位置:成果数据库 > 期刊 > 期刊详情页
汉语名物化复合词识别
  • ISSN号:1000-386X
  • 期刊名称:《计算机应用与软件》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] TS952.83[轻工技术与工程]
  • 作者机构:[1]上海交通大学计算机科学与工程系,上海200240
  • 相关基金:国家自然科学基金项目(60496326).
中文摘要:

名物化复合词的识别是汉语复合词识别中的难点。困难之处在于汉语动词和名词共现时既可以构成动词短语也可以构成名物化复合词。传统的汉语复合词识别往往只使用语料统计特征,效果往往不怎么理想。基于最大熵模型,在基准上下文特征的基础上,采用了词汇特征与Web特征对动词和名词共现时的名物化媛选进行判定,取得了较好的实验结果。其中,Precision达到了86.31%,Recall达到了70.00%。

英文摘要:

The identification of nominalization compounds is very. difficult in Chinese compound recognition. When a verb and a noun cooccur,there will be an ambiguity as whether the expression is a verb phrase or a compound. Traditional identification of nominalization compounds is usually only based on the features from the corpus and the result is not very good. In this paper it uses a Maximum Entropy model to identify nominafization eompounds. Besides the baseline contextual features, the model also adopts lexical and Web features for the identification task. The experiment result is eneouraging. The Preeision and Recall is 86.31% and 70% respectively.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463