位置:成果数据库 > 期刊 > 期刊详情页
融合领域命名实体识别的查询扩展方法研究
  • 期刊名称:计算机工程与设计(中文核心)
  • 时间:0
  • 页码:62-68
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]昆明理工大学信息工程与自动化学院,云南昆明650051, [2]昆明理工大学智能信息处理重点实验室,云南昆明650051
  • 相关基金:国家自然科学基金项目(60863011);云南省自然科学重点基金项目(2008CC023);云南省中青年学术和技术带头人后备人才基金项目(2007PY01-11)
  • 相关项目:受限域汉语问答系统普适性理论与方法研究
中文摘要:

针对领域知识特点和当前基本查询扩展方法的局限性,提出了在特定领域问答系统中将命名实体识别与基本查询扩展方法相结合对答案文本检索进行查询扩展的方法。该方法标注旅游领域18个类别的命名实体,并使用条件随机场理论建立实体识别模型,将识别模型以线性插值方式分别融合到本文选用的基于TF-IDF、互信息和局部上下文分析3种基本查询扩展方法中,再选取出扩展词进行查询。在旅游领域数据集上的实验结果表明,该方法在3种基本查询扩展方法基础上使准确度提高15.8%以上,其中结合领域命名实体识别和局部上下文分析的查询扩展方法的准确度提高了21.4%。

英文摘要:

For the characteristics of domain knowledge and the current limitations of the basic query expansion method, a new query expansion method of domain text retrieval by combining special named entity recognition (SNER) and basic query expan- sion method is proposed. First, eighteen categories of named entities are marked, and then the theory of conditional random fields (CRFS) is adopted to establish entity recognition model, finally, recognition model is integrated into the local context anal- ysis of query expansion method by linear interpolation method to select expansion terms. The experimental result of tourism data sets shows the proposed method is superior to the existing three basic expansion methods: the accuracy is improved by 15.8%. In particular, the method of fusion LCA and SNER improved 21.4%.

同期刊论文项目
期刊论文 31 会议论文 27 获奖 1 专利 3
同项目期刊论文