位置:成果数据库 > 期刊 > 期刊详情页
音字转换中分层解码模型的研究与改进
  • 期刊名称:中文信息学报. 23卷/第6期. 2009
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院软件研究所,北京100190, [2]中国科学院研究生院,北京100049
  • 相关基金:国家自然科学基金资助项目(60773027,60736044);国家863计划重点资助项目(2006AA010108,2008AA01Z145)
  • 相关项目:基于NLP的高精度文本检索模型研究
中文摘要:

音字转换是中文信息处理领域的一个重要研究方向,在语音识别、中文拼音输入中都有广泛应用。该文对音字转换中的拼音流切分歧义问题做了分析与研究,发现传统的分层隐马尔可夫解码模型在解决这个问题时存在缺陷,提出了利用语言模型知识辅助拼音流切分来改进已有的分层模型的思想。实验表明,与传统方法相比,该文的方法可以将首字准确率提高3%。

英文摘要:

Pinyin-to-Character conversion is an important task in Chinese Information Processing with widely applications in such tasks as Chinese Speech Recognition, Chinese Pinyin input method et al. This paper investigates the Pinyin-to-Character conversion and the segmentation of pinyin stream and proposes a method using Language Model to improve pinyin stream segmentation model. This method achieves about 3 % enhancement in precision of the first character compared to the traditional hierarchical model.

同期刊论文项目
期刊论文 117 会议论文 76 专利 12 著作 3
期刊论文 12 会议论文 20
同项目期刊论文