项目围绕领域问答系统中领域知识库构建、问句分析、文本及段落检索及答案提取关键问题展开研究和探讨,取得了以下进展1.在领域知识库构建方面,提出了领域术语、实体、实体关系提取方法及领域知识构建学习方法,实现从非结构化领域文本中获取领域知识;2.在问句分析方面,提出了协同半监督领域领域问类学习方法,探讨了集成学习问句分类、迁移问句分类、增量问句分类、问句语义标记识别及相似度计算方法,改善了领域问句分析语料标记问题;3.在答案文本检索方面,提出了基于领域实体扩展的领域文本检索方法及基于灰色关联的查询词选取方法,能有效提高领域文本检索精度;4.在答案提取方面,提出了结合依存句法的答案句模识别方法、融合多特征的答案学习排序方法及基于马尔科夫逻辑网的实体主页识别方法,实现答案的提取;5.在领域问答系统方面,设计实现了旅游领域Web问答及实体检索等多项原型系统,表现了好的效果。项目发表论文55篇,其中SCI收录1篇,EI收录28篇,ISTP 收录18篇,授权国家发明专利1项,受理国家发明专利2项,授权软件著作权17项,获得云南省自然科学二等奖1项,培养博士研究生1名,培养硕士研究生26名。
英文主题词Resticted-domain question answering system;Domian Knowledage Database building;Question Prasing;Document Retrieval; Answer Extraction;