位置:成果数据库 > 期刊 > 期刊详情页
结合潜在语义分析与点互信息的同义词抽取
  • ISSN号:1009-3044
  • 期刊名称:电脑知识与技术
  • 时间:2014.1.5
  • 页码:128-132
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]西北师范大学计算机科学与工程学院,甘肃兰州730070
  • 相关基金:国家自然科学基金项目(刚163039,61163036);西北师范大学青年教师科研能力提升计划项目(NWNU-LKQN-10-2)
  • 相关项目:基于在线百科和问答社区的中文文本蕴涵知识获取
中文摘要:

同义词在信息检索、自动文摘、情感分析、机器翻译等应用中都发挥着重要的作用。该文提出在大规模语料中结合潜在语义分析与上下文互信息进行同义词挖掘的方法,分析了不同的词汇上下文窗口选择、权值计算、潜在语义分析降维、余弦相似度计算在同义词抽取中的作用。实验结果表明,同义词抽取的效果明显提高。

英文摘要:

Synonym plays an important part in many natural language processing applications, such as information retrieval, auto-matic summarization, sentiment analysis and machine translation. This paper presents a synonym mining method by combination of Latent Semantic Analysis(LSA) and context mutual information from large-scale corpus, investigating the different window-based context selection, the computation of weight, the dimensionality reduction of LSA, the cosine similarity play a part in syn-onym extraction. Experimental results show that the effectiveness of synonym extraction has improved obviously.

同期刊论文项目
期刊论文 30 会议论文 4 获奖 2
同项目期刊论文
期刊信息
  • 《电脑知识与技术:学术交流》
  • 主管单位:安徽出版集团有限责任公司
  • 主办单位:时代出版传媒股份有限公司 中国计算机函授学院
  • 主编:
  • 地址:安徽合肥市濉溪路333号
  • 邮编:230041
  • 邮箱:xsjl@dnzs.net.cn
  • 电话:0551-65690964 65690963
  • 国际标准刊号:ISSN:1009-3044
  • 国内统一刊号:ISSN:34-1205/TP
  • 邮发代号:26-188
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:23925