互联网各种媒体资源的迅猛增长与用户快速而有效地从中获取有用信息之间的矛盾日益突出。基于多关系数据挖掘方法,研究语义相近、形式不同的跨媒体资源推荐技术,以发挥各种媒体资源优势互补的特性,降低个体认知负荷,成为缓解上述矛盾的重要途径之一。为此,本项目以异质跨媒体数据为对象,以多关系序列模式挖掘为手段,开展跨媒体推荐的关键技术研究。首先构造适用于高效跨媒体挖掘的新型索引结构,然后探索跨媒体背景下的多关系序列模式挖掘算法,最后建立多关系序列模式的评价与排序策略。该项目的研究在促进多关系数据挖掘发展的同时,还为不同媒体形式的推荐资源之间建立起了联系,从而发挥了不同媒体资源的优势,降低了用户从推荐资源中获取信息的认知负荷,具有重要的理论意义和实际应用价值。
Data mining;Recommender system;Sequential pattern;High utility itemset;Collaborative filtering
作为解决信息超载问题的重要手段,推荐系统已成为当前多领域交叉的热点研究内容。由于考虑了用户的访问顺序,基于序列模式研究推荐方法,进而解决面向关系型数据的精准推荐问题,具有重要的理论意义与应用价值。在本项目的资助下,课题组围绕着面向推荐系统的数据挖掘算法和新型推荐方法进行了全面深入的探索和研究,取得了多项成果,包括提出了关系数据的高效用项集挖掘系列算法,为提高推荐系统的个性化程度奠定了数据挖掘方法基础;提出了关系数据的序列模式挖掘算法,为推荐系统中融入用户的时序行为奠定了数据挖掘方法基础;改进了协同过滤等经典推荐方法,提出了基于序列模式的推荐方法,在推荐精度和对不同数据的适用性方面取得了进展。本项目已完成研究计划,达到预期目标。本项目提出的数据挖掘算法还应用于铝电解生产智能控制领域,提高了铝电解生产的智能化决策水平。本项目获国家科技进步二等奖1项,省部级科技进步一等奖2项;发表(录用)论文24篇,其中SCI检索2篇、EI检索6篇、ISTP检索1篇、核心期刊论文12篇;获得软件著作权2项;培养了硕士生6名,其中4名已取得硕士学位。