位置:成果数据库 > 期刊 > 期刊详情页
基于段落匹配和分布密度的偏重摘要实现机制
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:250-254
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连理工大学外语学院、电信学院,辽宁大连116024, [2]东北大学秦皇岛分校电子信息系,河北秦皇岛066004
  • 相关基金:国家自然科学基金资助项目(60673039); 辽宁省教育厅2009年度高等学校科研项目计划资助项目(2009A139); 大连理工大学2008人文社科研究基金资助项目(DUTHS2008320)
  • 相关项目:面向生物医学领域的文本挖掘技术研究与应用
中文摘要:

以《茶经》的翻译为例,基于树剪枝理论提出了一种典籍文本快速切分方法。首先,采用似然比统计量计算两字、三字甚至多字候选单元;然后在此基础上基于树剪枝的思想构建了典籍文本快速切分的模型算法,并构建了基本流程图;最后,以《茶经》为例验证了本算法的有效性和合理性。理论分析和算例表明,该算法能有效地对典籍文本进行自动切分,并简化了计算时间的复杂度,在推广中国典籍的对外传译方面具有良好的应用前景。

英文摘要:

This study proposes a new fast segmentation method for classic Chinese texts based on the tree pruning process.Firstly,word candidates of two,three and multiple characters are selected with likelihood ratio statistics.Then an algorithm of fast segment is presented and a basic flow chart is illustrated.Finally,the Classic of Tea is used to verify its validity and effectiveness.The theoretical analysis and experimental instances show that the algorithm is effective and promising in computer-aided translation of classic Chinese texts.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136