位置:成果数据库 > 期刊 > 期刊详情页
基于论坛话题段落划分的答案识别
  • ISSN号:0254-4156
  • 期刊名称:《自动化学报》
  • 时间:0
  • 分类:TP[自动化与计算机技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学基金(60973076,61100094),语言语音教育部一微软重点实验室开放基金(HIT.KLOF.2010061),哈尔滨市科技创新人才研究专项资金项目(2010RFXxG0031资助
中文摘要:

在论坛话题中识别答案是面向论坛的问答对挖掘中的核心问题.在论坛话题的讨论中通常存在隐式的结构,这种结构信息非常有助于最佳答案的定位和识别.本文提出了一种基于中文论坛话题段落划分的答案识别方法:首先将论坛话题重新组织为若干段落的集合,并基于此划分提取一组能够反映话题讨论逻辑结构的特征.在此基础上给出了一种可以根据候选答案所在段落类别实现模型选择的答案识别策略,从而避免了噪声信息对模型预测的误导.实验结果表明本文的答案识别方法非常适用于面向在线论坛的问答资源挖掘工作.

英文摘要:

Detecting answers in the threads is an essential task for the online forum oriented question-answer (QA) pair mining. In the forum threads, there normally exist implicit discussion structures with the valuable indication for locating the best answers. This paper proposes a thread segmentation based answer detecting approach: a forum thread is reorganized into several segments, and a group of features reflecting the discussion structures are extracted based on the segmentation results. Utilizing the segment information, a strategy is put forward to find the best answers. By evaluating the candidate answers in different types of segments with different models, the strategy filters the samples that mislead the decision. The experimental results show that our approach is promising for mining the QA resource in the online forums.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550