位置:成果数据库 > 期刊 > 期刊详情页
关于中英文混合文本断行算法的研究
  • ISSN号:1000-7105
  • 期刊名称:《电子测量与仪器学报》
  • 时间:0
  • 分类:TP317.2[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101, [2]北京信息科技大学计算机学院,北京100101
  • 相关基金:北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519); 国家社科基金重大项目资助(12&ZD234)
中文摘要:

为了解决中英文混合文本断行时中文和英文各自断行算法需求冲突的问题,研究适应中文断行的基于贪心策略的断行算法和适应英文断行的基于动态规划的断行算法的各自特点,通过中文汉字不同于英文单词的等宽特性,提出一种结合2种算法的针对中英文混合文本的改进断行算法。相对于原有的2种断行算法,改进断行算法能够兼顾混合文本中中文文本的断行效率和英文文本断行效果。

英文摘要:

To solve the conflict of demand for different line-breaking algorithms of Chinese and English part in the mixed text, different characteristics of line-breaking algorithm based on greedy strategy for Chinese text and the algorithm based on dynamic programming for English text are studied. According to monospaced characteristics of Chinese characters, an improved line-breaking algorithm which combines the two algorithms is proposed for mixed Chinese and English text. With respect to the original two line-breaking algorithms, the improved algorithm ensures both the efficiency of Chinese line- breaking and the effect of English line-breaking.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子测量与仪器学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:彭喜元
  • 地址:北京市东城区北河沿大街79号2层
  • 邮编:100009
  • 邮箱:mi1985@emijournal.com
  • 电话:010-64044400
  • 国际标准刊号:ISSN:1000-7105
  • 国内统一刊号:ISSN:11-2488/TN
  • 邮发代号:80-403
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2014版)
  • 被引量:14380