多语言智能文本处理中基于主题语义空间的文本表示研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

多语言智能文本处理中基于主题语义空间的文本表示研究

项目名称：多语言智能文本处理中基于主题语义空间的文本表示研究
项目类别：面上项目
批准号：60372016
申请代码：F010406
项目来源：国家自然科学基金
研究期限：2004-01-01-2006-12-31

项目负责人：赵军
负责人职称：研究员
依托单位：中国科学院自动化研究所
批准年度：2003

中文摘要：

本申请旨在研究一种面向多语言智能文本信息处理的基于主题语义空间的文本表示机制TDR。该机制在保持LSI"语义扩充，能解决一义多词问题"的基础上，利用双语译词对之间的词义限制来解决"一词多义"问题，并设计一套概率模型和学习方法将蕴含在文本集合中的主题有意识地合理地分离出来，构建基于主题的语义空间，进而在这个主题语义空间上进行词义消歧、文本表示和文本间相似度计算。理论上，与LSI相比，利用TDR构建出的语义空间能够更加准确地反映词语和词语、词语和文本、文本和文本之间相对于文本主题的语义关联，从而有效地解决文本表示中的"语言障碍"、"一词多义"、"一义多词"等问题，为文本相似度判断提供可靠的依据。

中文主题词：智能信息处理;多语言;文本表示;语义;语料库

英文摘要：

intelligent information proces

英文主题词： intelligent information proces

结论摘要：

本申请旨在研究一种面向多语言智能文本信息处理的基于主题语义空间的文本表示机制TDR。该机制在保持LSI"语义扩充，能解决一义多词问题"的基础上，利用双语译词对之间的词义限制来解决"一词多义"问题，并设计一套概率模型和学习方法将蕴含在文本集合中的主题有意识地合理地分离出来，构建基于主题的语义空间，进而在这个主题语义空间上进行词义消歧、文本表示和文本间相似度计算。理论上，与LSI相比，利用TDR构建出的语义空间能够更加准确地反映词语和词语、词语和文本、文本和文本之间相对于文本主题的语义关联，从而有效地解决文本表示中的"语言障碍"、"一词多义"、"一义多词"等问题，为文本相似度判断提供可靠的依据。

成果综合统计

成果类型

数量

期刊论文
会议论文
专利
获奖
著作

10
20
0
2
0

期刊论文

2004年：参加了863中文信息处理

问答式检索技术及其评测研究综述

面向文本检索的语义计算

Linguistic Theory Based Contex

面向商务信息抽取的产品命名实体识别研究

实体提及的多层嵌套识别方法研究

基于无监督学习的问答模式抽取技术

863信息检索评测——自动化所

基于相关文档池建模的查询扩展

Linguistic theory based contextual evidence mining for statistical Chinese co-reference resolution

会议论文

Cluster-based Language Model f

Chinese Question Classificatio

Word Sense Disambiguation thro

NLPR at TREC2004: Robust

2004年：参加国际文本检索评测TR

2005年：参加国际文本检索评测TR

面向商务信息抽取的产品名实体识

Bilingual Chunk Alignment Base

Product Named Entity Recogniti

基于相关文档池的语言建模研究

Chinese Named Entity Recogniti

Two-Phase Base Noun Phrase Ali

信息检索中基于极大似然集方法的

TREC中提高检索鲁棒性的技术研究

A Learning Based Model for Chi

NLPR at TREC 2005: HARD Experi

Multi-feature Based Chinese-En

构建汉语问答系统评测平台

Using Clustering Approaches to

Window-Based Method for Inform

获奖

《基于相关文档池建模的查询扩展

《面向商务信息抽取的产品命名实

相关项目

信息检索义项矩阵模型研究

期刊论文 8 会议论文 11 获奖 2 著作 1

基于立体视觉的图像语义分割研究

期刊论文 31 会议论文 5

INTERNET网络和混沌神经网络的复杂动力学行为及其应用研究

期刊论文 75 会议论文 2

面向机器翻译的双语组块研究

期刊论文 7 会议论文 1

基于甲骨文语料库的计算机辅助考释技术研究

期刊论文 26 会议论文 16 获奖 2

藏文字符信息熵研究

期刊论文 27 会议论文 9

智能信息融合变电站故障诊断理论方法研究

期刊论文 23 会议论文 2 著作 1

基于信任链的微博群体情感挖掘研究

期刊论文 26 会议论文 3

基于超光谱图象的混合物智能快速分类与识别

期刊论文 21 会议论文 13

赵军的项目

基于内容分析和行为分析的社区问答关键技术研究

期刊论文 3

　汉英双语命名实体对应和术语对应的获取技术研究

期刊论文 1

基于Web知识挖掘与融合的命名实体消歧技术研究

期刊论文 11 会议论文 38 获奖 2

汉语依存分析的概率化决策动作模型及自适应技术研究

期刊论文 7 会议论文 23

汉语文本中观点信息的提取与倾向性分析技术研究

期刊论文 12 会议论文 21

大规模知识关联和文本语义计算方法及应用验证

期刊论文 3