位置:成果数据库 > 期刊 > 期刊详情页
汉语词典的快速查询算法研究
  • 期刊名称:李江波, 周强, 陈祖舜,汉语词典的快速查询算法研究,中文信息学报﹒20(5)﹒31-39,2006
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]清华大学计算机系智能技术与系统国家重点实验室,北京100084
  • 相关基金:国家自然科学基金资助项目(60173008);欧盟FP6项目ALVIS的科技部配套经费资助.致谢实验过程中使用了北京大学计算语言学研究所、日本富士通公司和人民日报社公共开发的1998年半年的人民日报标柱语料库,特此致谢.
  • 相关项目:基于情境的汉语基本事件内容分析研究
中文摘要:

汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TRIE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法。最后以逐字二分法查询性能为基准,使用这两种词典询机制进行了词语直接查询和分词查询两种应用的性能测试。经过实验分析,双数组TRIE机制的词典查询算法在查询速度上提高明显,查询速度约是逐字二分法的5倍。双编码机制的的词典查询算法查询速度有一定提高,而且调整机制更加灵活。

英文摘要:

The dictionary mechanism serves as one of the basic components in Chinese information processing systems. Its performance influences the performances of these systems significantly. In this paper, we review the algorithms for Chinese dictionary lookup at first, then design and implement a Chinese dictionary based on Double-Array TRIE mechanism, and present a new Chinese dictionary based on Double Coding mechanism. In the end, we compare their space and time complexity experimentally with the binary-seek-by-characters mechanism. It can be seen that the Chinese dictionary based on Double-Array TRIE mechanism improves the speed obviously.

同期刊论文项目
同项目期刊论文