位置:成果数据库 > 期刊 > 期刊详情页
基于多层术语度的一体化术语抽取研究
  • 期刊名称:情报学报
  • 时间:0
  • 页码:275-285
  • 分类:TP391.41[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京理工大学信息管理系,江苏南京210094
  • 相关基金:本文为国家自然科学基金项目“基于可比语料的多语言文本聚类研究”(项目编号:70903032),中央高校基本科研业务费专项资金项目“Web2.0环境下多语言标签自动聚类研究”(项目编号:NUST2011ZDJH15)的成果之一.
  • 相关项目:基于可比语料的多语言文本聚类研究
作者: 章成志|
中文摘要:

文章采用分裂式层次聚类算法分别对中英文标签进行聚类,在标签聚类的基础上,采用先聚类后翻译的映射策略实现中英文标签的映射;在标签聚类及映射的基础上,自动发现多语言环境下潜在的社会关系网络。实验结果表明多语言环境下的社会关系网络比单一语言环境下的社会关系网络更为丰富。

英文摘要:

The divisive hierarchical clustering algorithm is used to cluster the social tags in Chinese and English separately. Based on the clustering of the tags, this paper uses the mapping strategy of "clustering first and translation second" to map the tags in Chinese and English. Based on the clustering and mapping of tags, the paper finds the latent social networks in the muhilingual context automatically. The experimental resuhs show that the social networks contain richer information in the multilingual context than in the monolingual context.

同期刊论文项目
期刊论文 11 会议论文 6 获奖 1 著作 2
同项目期刊论文