位置:立项数据库 > 立项详情页
多语言智能文本处理中基于主题语义空间的文本表示研究
  • 项目名称:多语言智能文本处理中基于主题语义空间的文本表示研究
  • 项目类别:面上项目
  • 批准号:60372016
  • 申请代码:F010406
  • 项目来源:国家自然科学基金
  • 研究期限:2004-01-01-2006-12-31
  • 项目负责人:赵军
  • 负责人职称:研究员
  • 依托单位:中国科学院自动化研究所
  • 批准年度:2003
中文摘要:

本申请旨在研究一种面向多语言智能文本信息处理的基于主题语义空间的文本表示机制TDR。该机制在保持LSI"语义扩充,能解决一义多词问题"的基础上,利用双语译词对之间的词义限制来解决"一词多义"问题,并设计一套概率模型和学习方法将蕴含在文本集合中的主题有意识地合理地分离出来,构建基于主题的语义空间,进而在这个主题语义空间上进行词义消歧、文本表示和文本间相似度计算。理论上,与LSI相比,利用TDR构建出的语义空间能够更加准确地反映词语和词语、词语和文本、文本和文本之间相对于文本主题的语义关联,从而有效地解决文本表示中的"语言障碍"、"一词多义"、"一义多词"等问题,为文本相似度判断提供可靠的依据。

结论摘要:

本申请旨在研究一种面向多语言智能文本信息处理的基于主题语义空间的文本表示机制TDR。该机制在保持LSI"语义扩充,能解决一义多词问题"的基础上,利用双语译词对之间的词义限制来解决"一词多义"问题,并设计一套概率模型和学习方法将蕴含在文本集合中的主题有意识地合理地分离出来,构建基于主题的语义空间,进而在这个主题语义空间上进行词义消歧、文本表示和文本间相似度计算。理论上,与LSI相比,利用TDR构建出的语义空间能够更加准确地反映词语和词语、词语和文本、文本和文本之间相对于文本主题的语义关联,从而有效地解决文本表示中的"语言障碍"、"一词多义"、"一义多词"等问题,为文本相似度判断提供可靠的依据。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 10
  • 20
  • 0
  • 2
  • 0
相关项目
期刊论文 8 会议论文 11 获奖 2 著作 1
期刊论文 31 会议论文 5
期刊论文 7 会议论文 1
期刊论文 26 会议论文 16 获奖 2
期刊论文 27 会议论文 9
期刊论文 23 会议论文 2 著作 1
赵军的项目