位置:成果数据库 > 期刊 > 期刊详情页
中文文本的信息自动抽取和相似检索机制
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连理工大学计算机系,辽宁大连116024
  • 相关基金:国家自然科学基金项目(60373095;60673039)资助
中文摘要:

目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.

英文摘要:

The mechanism of information extraction and similar retrieval for Chinese texts is presented in this paper. Users' information interests are represented as semantic Template. The relevant texts are obtained by search engine under conceptual expansion of keywords. Based on conceptual trigger and sentences parser,the text semantic templates are filled in term of the mapping rules between semantic relationship and slots ,so the textual database is built. Considering the fuzzy information from natural language texts, the similarity measure between user's queries and text semantic templates are put forward. Moreover, the digital feature of text can be expanded by fuzzy mathematics and calculated about similarity. It is shows that the mechanism of extraction and retrieval can improve the efficiency of users' query and meet the more and more information demands.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212