位置:成果数据库 > 期刊 > 期刊详情页
Feature selection algorithm for text classification based on improved mutual information
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP39[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学华德应用技术学院计算机应用技术系,黑龙江哈尔滨150025, [2]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
  • 相关基金:基金项目:国家自然科学基金项目(60736044,60773070)
中文摘要:

研究目的是挖掘搜索引擎中用户兴趣偏好,实现个性化搜索引擎技术。研究方法采用识别用户输入查询串,通过查询进行挖掘用户兴趣类别,但有时用户输入查询串短,或者出现查询词歧义等。由于查询会返回一系列文档,将相关文档分类处理,能够更清晰识别用户兴趣偏好。结果显示通过文档关系矩阵,将用户查询映射到对应类别,发现用户兴趣爱好。对于兼类查询等问题可以通过扩展查询解决。结论是该模型通过查询串和相关文档之间关系,进而实现用户偏好的辨别。该技术为搜索引擎信息推荐等技术打下良好基础。

英文摘要:

The goal of the researches is digging user interest and realizing personalized search. The method of research is finding user query. Digging user class by query ,but sometime the query is short or query is ambiguity. Query will reaun some documents and then class the document finding user interest. The result shows query is mapped to the class by document matrix. Query expansion effectively solves the question of query short and ambiguity class. The result is that the input of the model is user query and the document,the output is user interest that provides the foundation for sorting technology.

同期刊论文项目
期刊论文 117 会议论文 76 专利 12 著作 3
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433