位置:成果数据库 > 期刊 > 期刊详情页
基于并列结构的部分整体关系获取方法
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:-
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海对外经贸大学统计与信息学院,上海201620, [2]江苏科技大学计算机科学与工程学院,江苏镇江212003, [3]中国科学院计算技术研究所智能信息处理重点实验室,北京100190
  • 相关基金:国家自然科学基金资助项目(61203284);国家社科基金重点项目(10AYY003)
  • 相关项目:基于云计算的海量数据挖掘关键技术研究
中文摘要:

属性是概念的内涵表达,描述概念的特征或性质,通过属性可以区分不同的概念,发现它们之间的差异。属性具备描述概念和鉴别概念的功能。基于Web的属性获取是指对给定的概念从Web网页中自动获取其属性集合。属性获取是概念知识获取的起点,也是领域本体自动构建的关键。文中从文本知识获取的角度对属性进行分类,并结合属性的元性质,探讨属性名称在Web语料中的基本表达方式(词汇句法模式),并通过词汇句法模式从大规模语料中获取属性名称,并且提出了基于统计和语义的候选属性验证方法。最后利用属性迭代获取模式进行属性迭代获取。通过几组概念的实例进行属性获取,实验结果表明,文中方法获取的属性的准确率较高。

英文摘要:

An attribute is the expression of connotation, which is used to explain some property of the conceptual word, and distinguish different concepts, and find their discrepancy. An conceptual word with attribute names are not an isolated vocabulary entry any more. Web-based attribute-acquisition is to acquire a set of attribute names from Web pages automatically for each given concept, enriching the semantics of the concept. Attribute acquisition is also a significant step of general knowledge acquisition from text, and an important task in automatic construction for domain ontologies. It makes a basic classification of attributes according to text knowledge acquisition in this paper and explores basic expressions (lexico-syntactical patterns) for attribute names in multi-linguistic Web corporal. After acquiring attribute names from large-scale corpus by patterns, a method based on statistics and semantic is proposed to validate. At last, attribute it- eration patterns are applied to acquire new attribute names through iteration method. The results show that the precision of attribute acqui- sition is very high through the experiment of several group concepts.

同期刊论文项目
期刊论文 72 会议论文 63 获奖 10 专利 7 著作 3
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136