位置:成果数据库 > 期刊 > 期刊详情页
基于次优查找树的词典机制研究
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]内蒙古工业大学信息工程学院,呼和浩特010051
  • 相关基金:基金项目:国家自然科学基金项目(60673015),内蒙古自然科学研究基金项目(20080404MS0904),内蒙古教育厅基金项目(NJ09068),内蒙古T业大学科学研究项目(X200806)
中文摘要:

在使用相同分词算法的情况下,词典机制决定着词语的查询速度,也影响着分词的速度和分词系统的广泛应用。根据词语在文本中出现频率的不同,通过构造次优查找树的词典机制,使得在分词过程中减少了比较次数,提高了分词的速度。最后采用最大逆向分词算法进行了对比实验,实验表明分词效率有一定提高。

英文摘要:

Dictionary mechanism exerts great effect not only on the dictionary query speed, but also the speed of segmentation and the wide use of the segmentation system. According to the different occurrence frequencies of words in the text, a dictionary mechanism of the nearly optimal search tree is designed, which is meant to reduce the number of times for comparison during segmentation and to pick up its speed. Finally, contrast experiments with maximal reverse segmentation algorithm are conducted which show that the efficiency of segmentation is improved to some degree.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169