东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

中医针灸领域术语自动抽取研究

ISSN号：1003-0077
期刊名称：中文信息学报
时间：0
页码：-
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：大连理工大学计算机科学与技术学院,辽宁大连116024
相关基金：国家自然科学基金（61173100;61173101;61272375）; 福建省自然科学基金（2014J01218）
相关项目：跨语言信息检索中的机器翻译研究

作者：孙水华|黄德根|牛萍|

关键词：英汉人名音译, 音节划分, 短语表优化, C-VALUE, English-Chinese name transliteration, syllabification, phrase table optimization, C-value

中文摘要：

把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频词法及基于C-value方法对短语表进行优化,解决了训练语料偏小导致短语表中出现杂质信息的问题;之后,融入了汉语人名中首字（词）及尾字（词）的位置特征,改善了生成的音译候选中汉字选取的不合理性;最后,提出了两阶段音节划分方法,缓解了音节划分粒度过大导致的音译错误。与基准方法相比,其音译准确率ACC由63.78%提高到67.56%。

英文摘要：

The English Chinese name transliteration can be described as syllable-based translation, which can be solved by current a phrase based statistical machine translation model. After describing a detailed rule-based syllab- ification method, this paper presents a translation phrase table optimization by frequency thresh hold and c-value. In addition, the method is also featured by integrating the local features of Chinese names, as well as a two stage of syl- labification strategy. The experimental results show that the performance of the English-Chinese name translitera tion is improved from 63. 78% to 67.56% in terms of ACC.

同期刊论文项目

跨语言信息检索中的机器翻译研究

期刊论文 50 会议论文 29 著作 1

同项目期刊论文

MT-Oriented English PoS Tagging and Its Application to Noun Phrase Chunking

最大生成树算法和决策式算法相结合的中文依存关系解析

Implication operators on the set of V-irreducible element in the linguistic truth-valued intuitionis

基于句法结构约束的模糊限制信息范围检测

一种基于十八元语言值模糊相似矩阵的聚类方法

A Multistage Gene Normalization System Integrating Multiple Effective Methods

A two-phase Bio-NER system based on integrated classifiers and multiagent strategy

A distributed meta-learning system for Chinese entity relation extraction

Creating Chinese-English Comparable Corpora

基于迁移学习的蛋白质交互关系抽取

基于条件随机场与时间词库的中文时间表达式识别

基于组合核的蛋白质交互关系抽取

中英平行短语依存树库构建

ExtractingBiomedical Event with Dual Decomposition Integrating Word Embeddings

基于广义Jaccard系数的微博情感新词判定

Co-training for detecting hedges and their scope in biomedical texts

Hedge Scope Detection in Biomedical Texts: An Effective Dependency-Based Method

基于简单名词短语的汉语介词短语识别研究

Identification of English prepositional phrases within business domain for machine translation

基于信息熵和词频分布变化的术语抽取研究

利用句法短语改善统计机器翻译性能

An Unsupervised Graph Based Continuous Word Representation Method for BiomedicalText Mining

Context Information and Fragments Based Cross-Domain Word Segmentation

基于条件随机场的汽车领域术语抽取

一种基于十元格蕴涵代数的知识表示方法

语言真值直觉模糊命题逻辑系统的推理规则

基于TOPSIS的语言真值直觉模糊多属性决策

一种融合句法短语的汉英统计机器翻译方法

利用词表示和深层神经网络抽取蛋白质关系

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136