位置:成果数据库 > 期刊 > 期刊详情页
维吾尔语词频统计子系统的体系结构
  • 时间:0
  • 分类:TP391.7[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]新疆师范大学数理信息学院,新疆乌鲁木齐830054
  • 相关基金:国家自然科学基金:项目编号:(60163002,60463005),新疆维吾尔自治区科技厅少数民族特培人员启动资金项目资助.
中文摘要:

维语语料库是汉维机器翻译系统的核心基础,同时也是对维语中的词语进行统计的一个完整和完善的基础模型,在此我们要介绍管道与过滤器模式在维语语料库的构造和维语词频统计系统中的应用。第一步介绍管道和过滤器概念,其次说明建立维语语料库过程和选择语料库原则,最后陈述维语词频统计结果和进行分析。

英文摘要:

As the core of Uyghur - Chinese artificial translation system, Uyghur Corpus is synchronously the full and perfect basic method of Uyghur vocabulary statistics. Hence we introduce the applications of pipeline and filtrate methods in Uyghur phraseology frequency statistic system and the construction of Corpus. Firstly, we introduce the concepts of pipeline and filtrate. In the second place, we illustrate the process that the Corpus is constructed and the principles of how the Corpus is selected. Lastly, we analyze the result of Uyghur Phraseology Frequency Statistics.

同期刊论文项目
期刊论文 10 会议论文 4 获奖 18 著作 2
同项目期刊论文