位置:成果数据库 > 期刊 > 期刊详情页
基于文本挖掘机制的区域经济关系分析
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:F127[经济管理—世界经济] B97[哲学宗教—宗教学]
  • 作者机构:[1]北京大学经济学院,北京100871, [2]大连理工大学人文社会科学学院,大连116024, [3]大连理工大学电子与信息工程学院,大连116024
  • 相关基金:本文得到国家自然科学基金项目(编号:60373095,60673039)的资助.
中文摘要:

已有的经济关系研究大都采用实证的或单纯的计量学的方法来实现的。本文则针对非结构化的文本特点,采用信息抽取和文本挖掘方法挖掘用户感兴趣的区域经济关系是具有十分重大应用价值的研究课题。本文在探讨了基于实体关系的文本挖掘机制的基础上,对31个省、市、自治区的区域经济关系进行了分析。运用文本挖掘技术对经济关系的挖掘包括两种方式:一是基于属性的经济关系挖掘,利用信息抽取获取各个实体属性,采用聚类方法分析经济实体关系;二是基于相互引用的经济关系挖掘,首先构造经济实体关系分类词典,提出了实体关系标注算法,利用信息抽取获得实体之间的引用情况,然后构造关系有向图,从中挖掘区域经济之间的关系。研究表明,运用文本挖掘技术,既可以对各个区域经济发展状况进行分析和评价,也可以发现特定区域经济之间的内在关系。

英文摘要:

Text mining plays an important role in knowledge acquisition, and it is valuable issue to apply information extraction and text mining to mine relations among entities from non-structure texts in the internet. In this paper, the approach of text mining for relations between named entities is presented, and it includes two mining schemes. One is based on the attributes of entities. It applies the approach of information extraction to collect their attributes, and then adopt the clustering algorithm to analyze the relations between named entities. The other is based on the reference between entities. It constructs the relation dictionary and presents the algorithm of annotating relations. It set up the vector-graph based on the references between entities, and it derives several interesting information patterns from the vector-graph. As a result, it shows a better effect on mining the relationship between named entities from a specific domain.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778