本项目拟围绕基于社会化标签的个性化推荐技术展开研究,具有重要的理论意义和实际价值。项目主要研究内容包括①基于社会化标签的混合个性化推荐策略研究使用基于内容的推荐算法对社会化标签数据进行处理,然后结合协同过滤推荐技术进行推荐;②基于模型矩阵分析的协同过滤推荐策略研究将社会化标签三维模型分解为三个二维模型,简化模型系统,并使用协同过滤方法进行个性化推荐;③使用张量因式分解的个性化推荐策略研究拟在现有的张量因式分解技术上,使用损失函数缩小预测值和实际值的距离,然后再进行偏差移除以进行结果优化;④基于训练集优化的推荐模型动态生成方法研究个性化推荐模型的建立和误差数据的筛选迭代进行,直至推荐模型收敛为止,动态生成精确度更高的推荐模型。拟在国内外SCI、EI收录刊物以及计算机学会推荐高水平学术会议上发表论文6~8篇、申请国家发明专利3~4项;培养博士毕业生1~2人、硕士毕业生3~5人。
personalized recommendation;social tag;collaborative filtering;text categorization;service discovery
本课题围绕基于社会化标签的个性化推荐方法、Web评论观点分析方法、文本信息个性化检索与推荐方法、面向业务规则的服务选择和推荐方法展开研究。课题主要创新点如下(1)针对基于评分相似度的推荐模型存在的数据稀疏性问题,提出了一种在建模过程中结合面向用户和面向项目的信息,以及评分相似度与社会化标签相似度的推荐方法;对社会标签网络进行了分析,提出了结合社会标签相似度的K近邻推荐模型和相应的推荐方法。(2)深入分析了用户、项目和上下文属性信息对社会兴趣、用户兴趣和项目受欢迎度的影响,针对属性数据存在数据不规范的问题,提出了属性向量构造方法;提出了融合属性信息来解决矩阵推荐算法数据源单一问题的方法,分别构造了融合不同单类属性信息和多类属性信息的SVD模型。(3)提出了基于隐向量模型和基于K近邻模型个性化推荐系统训练集优化的方法,结合Adaboost迭代算法,在迭代过程中去除数据集中不能代表用户喜好的信息或者恶意用户的信息,从而提高推荐系统的精度。(4)针对评分预测问题的特点,对自编码器的网络结构和学习算法进行修改,提出了用于评分预测的自编码器模型。同时,为了解决参数随机初始化导致自编码器模型收敛到较差极小值的问题,给出了采用结构相似的有限玻尔兹曼机进行预训练的方法。(5)将关联分类规则应用于Web评论观点分类问题,提出了构造最优关联分类规则集的方法;针对单一评价参数在分类问题上的不足,提出了一种多参数投票的评分机制;提出了基于Mean Shift的Web文本分类算法,通过k近邻的自适应带宽均值漂移向量不断的寻找样本中密度最大的点,使用不同类别的样本中心点构成基于质心的分类器;为了更好地利用文本中句子顺序的关系,提出了使用循环神经网络模型来提高观点分类性能的方法。(6)针对向量空间模型文本表示方法中特征项的无关性问题,提出了一种基于频繁项目集的文本特征扩展方法;针对短文本的特征扩展问题,提出了基于频繁词集构建短文本背景知识库的方法;提出了一种基于长文本特征扩展和受限玻尔兹曼机特征空间变化的短文本分类方法;提出了一种基于复杂特征表示和类中心分裂-合并策略的文本聚类方法。(7)对现有的服务生命周期管理模型进行了详细分析,提出了一种基于利益相关者的服务生命周期管理模型;针对服务发现过程中的服务选择和推荐,提出了基于改进协同过滤方法的服务排序方法和基于重排序的服务推荐方法。