位置:成果数据库 > 期刊 > 期刊详情页
基于Web文本挖掘中的一种中文分词算法研究
  • ISSN号:1003-5850
  • 期刊名称:《电脑开发与应用》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]太原理工大学,太原030024
  • 相关基金:国家自然科学基金资助项目(No.60472093).
中文摘要:

基于Web文本挖掘问题,提出了一种改进的索引结构的词库组织体系及基于该词典结构的中文分词算法。同时,加强消除歧义方面的处理,分词精度有所提高。试验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。

英文摘要:

In the paper, we will give a improving method of organizing Chinese word library and the segment algorithm based on Web text mining. Also, we strengthen the processing of dispelling ambiguity in order to increase the segment precision. A large number of simulation experiments show that this method can greatly improve the speed of Chinese word segmentation, the recall ratio and precision of information.

同期刊论文项目
期刊论文 42 会议论文 26
同项目期刊论文
期刊信息
  • 《电脑开发与应用》
  • 主管单位:中国兵器工业集团公司
  • 主办单位:中国北方自动控制技术研究所
  • 主编:李定主
  • 地址:太原市体育路351号
  • 邮编:030006
  • 邮箱:dnkf@chinajournal.net.cn
  • 电话:0351-8725025
  • 国际标准刊号:ISSN:1003-5850
  • 国内统一刊号:ISSN:14-1133/TP
  • 邮发代号:
  • 获奖情况:
  • 中国兵器工业集团优秀科技期刊二等奖,山西省一级(优秀)期刊
  • 国内外数据库收录:
  • 被引量:6860