位置:立项数据库 > 立项详情页
基于引文网络图数据挖掘的热点技术领域预测研究
  • 项目名称:基于引文网络图数据挖掘的热点技术领域预测研究
  • 项目类别:青年科学基金项目
  • 批准号:71003020
  • 申请代码:G030701
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:王名扬
  • 负责人职称:副教授
  • 依托单位:东北林业大学
  • 批准年度:2010
中文摘要:

技术创新在经济社会发展中占有重要地位,及时准确预测热点技术领域对科技管理政策的制定,如资金投放、优先发展领域确定以及研究布局的宏观规划具有重要意义。 热点技术领域的出现不是孤立事件,是科学技术相互影响和动态演化的结果,根据这些动态演化的信息可推演技术的发展趋势。但,在可用于预测统计分析的数据中存在很多内含结构信息的数据,如表征科学技术知识传输过程的科学引文网络和专利引文网络,常见的针对数值型数据的预测方法无法对其进行操作。 本项目在考虑科学技术动态演化特性的基础上,融合科学引文网络和专利引文网络的信息,建立起一条科学技术动态演化的信息链;考虑到引文网络拓扑结构的复杂性,通过图数据挖掘方法对其进行约简;结合引文网络的背景知识,构造核函数提取能表征网络引用模式动态演化特征的预测变量;并通过贝叶斯网络建立预测变量与热点技术决策变量的预测模型。通过研究,预期形成一套解决此类问题的模型化的方法。

结论摘要:

项目旨在开展热点技术预测相关的研究工作。项目的研究过程及结论如下 1)提取影响某技术领域发展的先导科学领域,构建影响该技术领域发展的科学-技术信息链项目将技术领域的发展融于整个科技大环境中,通过追踪技术领域被授权专利的引用数据以确定该技术的知识基础。构建技术领域与知识基础领域间的引证矩阵,定量知识流动的强度特性,确定出影响技术领域发展的核心先导领域。结合学科间实际引用过程的机理模型,利用系统辨识方法,抽象并构建出表征领域间实际引用过程的物理模型,利用该模型,辨识得到不同领域间知识传递的速度,确定出领域间强相关的时间距离,由此构建出影响技术领域发展的科学—技术信息链,为接下来提取合理时间区间内的信息,以实现热点技术领域的预测做好准备。 2)挖掘高被引文献的典型特征,提取先导领域在关联长度内的高被引文献,实现热点技术的预测以来自不同学科领域的文献数据为样本,结合基于粗糙集约简的多分类器融合框架,和基于软模糊粗糙集的案例推理方法,提取得到高被引文献的典型的先兆特征。发现,文献作者的声望、文献所在期刊的影响力,以及文献的质量,是决定文献是否能够成长为高被引文献的关键因素。这些先兆特征可以帮助识别先导领域在关联长度内发表的文献中哪些将成长为未来的高被引文献,在识别出的高被引文献基础上,结合其所表征的研究热点的变迁,实现对未来的热点技术的预测。 该研究为科研工作者深入了解科技发展的动态规律,有效捕捉技术发展的趋势,以提前做好科研规划提供了思路。同时,该研究还有助于研究者深入分析学科间的亲缘关系,为构筑结构优化的学科生态环境,更好的进行学科布局和政策倾斜提供了客观依据。 该项目共发表11篇文章,其中5篇文章被SCI/SSCI数据库收录,并发表在Journal of informetrics(SSCI,IF=4.23,信息科学领域的Top Journal)、Scientometrics(SCI,IF=1.97,国际科学计量学和信息计量学领域Top Journal)等信息科学领域的国际著名期刊上,3篇文章被EI数据库收录,3篇文章被CSSCI数据库收录,同时还完成1部专著,顺利完成了项目计划任务数中规定的研究任务。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 14
  • 2
  • 0
  • 0
  • 1
相关项目
期刊论文 16 会议论文 2 著作 3
期刊论文 22 会议论文 3 著作 1
期刊论文 9 会议论文 1 专利 1
王名扬的项目