位置:立项数据库 > 立项详情页
基于网络搜索数据的电子商务交易量预测研究- - 以3C产品为例
  • 项目名称:基于网络搜索数据的电子商务交易量预测研究- - 以3C产品为例
  • 项目类别:面上项目
  • 批准号:71172199
  • 申请代码:G021102
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:彭赓
  • 依托单位:中国科学院大学
  • 批准年度:2011
中文摘要:

近年来我国电子商务的飞速发展,网上交易额占社会消费品零售总额的比重的持续扩大,对我国转变经济发展方式、扩大内需、调整经济结构产生了积极促进作用,同时,也存在缺乏权威的电子商务交易统计数据,未形成系统的和有针对性的预测方法等问题。现有文献表明,互联网搜索数据中蕴含了众多网民的搜索意图和行为倾向,应用这一"意图数据库"可以用来预测典型的社会经济行为。本课题拟探索微观的搜索行为与宏观的电子商务交易规模之间的关联关系,并选择3C这一主流网上交易商品为代表,采用基于网络搜索数据的方法来预测我国3C电子商务交易量,重点解决①基本关键词词库的建立方法;②有预测能力的关键词选择方法;③搜索指数的合成方法;④基于搜索指数的预测模型及实证研究等问题。  本课题所探索的是一种全新的预测方法,在电子商务全产业交易量的预测方面有创新价值,也可以为相关管理部门提供可靠而及时的决策依据。

结论摘要:

在互联网经济和电子商务普及性应用时代,大数据极其应用得到快速发展。应用网络搜索数据分析和预测社会经济问题,已成成为当前学术热点。然而,《Nature》和《Sciences》先后发文指出利用网络搜索大数据应用与分析和预测社会经济热点时,容易出现大数据测不准的问题。探索利用网络搜索大数据应用的方法和技术方案问题,成为本项目解决的核心目标。基于,本项目立足于从理论方法建立和实证应用研究两个方面展开。在理论分析和基础方法建立方面,本项目重点研究了五个方面的基础性问题①比较了文本挖掘方法和调查问卷方法后,提出了基于搜索引擎推荐的启发式关键词库建立方法。该方法具有可操作性强、建立关键词库的速度快、可复制性好、成本低、预测效果好等优点;②分析了时差相关判别方法、赫斯特指数方法、动态时间弯曲方法在甄别有预测能力关键词的基础上,提出判别有预测能力关键词的组合方法TE-TDC。③提出了简单相加法、权重加权法、权重指数加权法、错位合成法和逐步合成法等五种网络搜索指数合成方法。④分析了网络搜索数据信号噪声产生的机理、提出了基于经验模态分解的搜索合成指数信号分解和噪声信号处理方法。⑤在预测模型的选择方面,比较分析了线性回归模型、时间序列模型和机器学习模型(包含支持向量机、随机森林和神经网络)在动态预测中的有效性。在实践应用方面,本项目应用百度、google和淘宝站内的搜索数据实证分析过的问题包括①预测了淘宝网的3C商品、服装品和美容护肤品等三大类商品的电子商务交易量;②预测了2010年上海世博会、2013年北京园博会、海南省旅游接待量等游客数量;③预测了汽车、房地产等大宗商品交易量;④预测了中国国家CPI、沪市等宏观经济指标;⑤预测了流感、艾滋病HIV、梅毒等流行疾病疫情。同时,还利用百度搜索数据建立了中国中小企业景气指数系统。从诸多实证应用中,本项目研究后得到三个结论其一,网络搜索数据可以作为电子商务交易与大宗商品交易、旅游客流量、流行疾病疫情和若干社会经济问题的先行指标,通过对相关网络搜索数据的监测,就可以对相关问题进行有效的预判,以利于政府、行业和企业即时采取应对策略;其二,网络搜索数据作为一种典型的大数据,其有效应用和精准的分析,还需要不断地在方法方面作出进一步的提高和改进;最后,网络搜索大数据还应该与其他多源数据相互融合才能更为有效地分析和预测社会经济问题。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 18
  • 11
  • 0
  • 0
  • 1
相关项目
期刊论文 5 会议论文 2 获奖 3 著作 2
期刊论文 6 会议论文 8 获奖 4 专利 3 著作 1
期刊论文 4 会议论文 1 专利 1
彭赓的项目
期刊论文 16 会议论文 11