东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于检索历史上下文的个性化查询重构技术研究

期刊名称：中文信息学报
时间：0
页码：55-62
语言：中文
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]哈尔滨工业大学信息检索研究中心,黑龙江哈尔滨150001
相关基金：国家自然科学基金重点资助项目（60736044）;国家自然科学基金面上资助项目（60675034）;国家863计划探索类专题资助项目（2008AA012144）;语言语音教育部一微软重点实验室开放基金资助（HTT.KLOF.2009020）
相关项目：下一代信息检索研究

作者：宋巍|刘挺|张宇|李生|

关键词：计算机应用, 中文信息处理, 个性化检索, 隐式反馈, 查询重构, computer application, Chinese information processing, personalized web search, implicit feedback, query reformulation

中文摘要：

基于检索历史隐式地学习用户偏好是个性化检索研究的热点，而根据用户检索历史重构新的查询输入是其中主要的研究内容。已有的研究在利用检索历史进行查询重构时，通常不区分检索历史中的内容是否与当前查询相关，而是将全部检索历史视为整体，因而使重构后的查询含有较多噪声。该文基于相关词语在上下文中大量共现的特征，将用户历史检索结果的网页摘要作为上下文语境，结合用户点击，选择检索历史中与当前查询共现程度最高的词语重构查询模型。对初始检索结果重排序的实验表明，该方法可以有效地选择相关词语，减少噪声。用p@5和NDCG两种指标评价，比最好的基准系统分别相对提高12．8％和7．2％，比初始排序结果相对提高26．0％和11．4％。

英文摘要：

Learning user preference implicitly is a hot research topic for personalized search ,and query model reformulation based on user search history is a key issue. Existing work considers the search history as a whole without distinguishing whether it is relevant to current query, resulting in much noise. In this paper, assuming that the relevant terms tend to co-occurrence in context, we treat each past snippet as a context and reformulate the query by selecting the most relevant terms to the whole query from the user clicks. The experiment results show that the algorithm can select relevant terms and reduce noise. With the evaluation metrics of p@ 5 and NDCG, the system achieves a relative improvement against the best baseline system by 12.8 % and 7.2% respectively, 26.0% and 11.4% against the original ranking.

同期刊论文项目

下一代信息检索研究

期刊论文 117 会议论文 76 专利 12 著作 3

汉语语义角色标注方法研究

期刊论文 29 会议论文 12

　彩色透水混凝土

期刊论文 63

同项目期刊论文

用户查询意图切分的研究

面向blog的爬行算法

面向用户行为的页面质量评估

基于HITS算法的查询结果多样化方法

基于网络资源与用户行为信息的领域术语提取

Research on Automatic Pattern Acquisition Based on Construction Extension

Web Based Translation of Chinese Organization Name

网页作弊与反作弊技术综述

基于群体智慧的Web访问日志会话主题识别研究

Identifying Web Spam with the Wisdom of the Crowds

How do users describe their information need: Query recommendation based on snippet click model

Extraction and Polarity Determination for Opinion Expression

基于话题和修辞识别的阅读理解why型问题回答

基于用户行为的竞价广告效果分析

网页质量评价体系的研究

基于日志分析的中文输入法用户行为研究

问答社区中回答质量的评价方法研究

面向信息检索的近邻语言模型

中文搜索引擎用户行为的演化分析

面向排序学习的特征分析的研究

基于回归支持向量机的信息检索

网络检索用户行为可靠性分析

Query Clustering for Learning to Rank Models on Web Search

Chinese Query Reformulation and Variation: A Case Study in Sogou Log

An Unsupervised Approach for Noun Resolution

A statistical approach to instance-level schema matching

A Temporal Topic Model for New Event Detection

Conceptual Graph Matching Method for Reading Comprehension Tests

基于目的分析的作弊页面分类

Relevance Feedback Based Query Optimization

A new query expansion approach using collocation relationships in language models for information re

Query Spelling Correction For Multi-Language Search Engines

微博用户的相似性度量及其应用

基于小规模尾字特征的中文命名实体识别研究

音字转换中分层解码模型的研究与改进

Web数据反馈的搭配抽取方法

高性能中文垃圾邮件过滤器

Study on the Optimal Parameters of Image Fusion Based on Wavelet Transform

面向TDT的动态多文档文摘研究

基于上下文的查询扩展

中文交互式问答用户问题相关检测研究

基于日志挖掘的搜索引擎用户行为分析

面向用户互联网访问日志的异常点击分析

一种基于文档相似度的检索结果重排序方法

低频查询的用户行为分析和类别研究

A Re-ranking Approach for Categorization Information Retrieval Based on Multiple Feature Selection

基于改进的TextTiling方法的用户新兴趣发现的研究

开放域问答技术进展

An Efficient Approach to Comment Spam Identification

基于VASE特征词的网络查询分类研究

基于人工标注的个性化检索系统评测的研究

Research on Query Translation for CLIR Based on a Combination of Statistical Method and Web Informat

The Chinese Pinyin Input Method based on Internet Data

Mining Synonymous Entities using Search Engine Query Logs

Log-Mining Based Query Spelling Correction for Chinese Search Engines

Chinese Organization Name Translation via Web Mining

Collocation Extraction Using Web Feedback Data

面向协作式问答的问题理解技术研究

锚文本检索有效性分析

基于群体智慧的Web浏览日志会话划分研究

基于labeled-LDA模型的文本分类新算法

基于用户行为分析的搜索引擎自动性能评价

基于单字提示特征的中文命名实体识别快速算法

基于用户日志挖掘的搜索引擎广告效果分析

Automatic Hot Event Detection Using Both Media and User Attention

基于查询聚类的排序学习算法

基于浏览器收藏夹的用户行为研究

查询会话中的用户行为分析

基于语义域语言模型的中文话题关联检测

信息过滤中基于二元近似关系分布的噪声屏蔽算法

企业内部邮件中话题讨论检索研究

面向排序的基于查询需求的查询聚类模型

基于用户行为的长查询用户满意度分析

基于用户兴趣分析的网页生命周期建模

针对搜索引擎的媒体倾向性研究

使用基于多例学习的启发式SVM算法的图像自动标注

基于多例学习的Web图像聚类

量子程序设计语言NDQJava-2

Feature selection algorithm for text classification based on improved mutual information

基于多重特征选择和多分类器融合的文本层次分类研究

一种新的面向主题的爬行算法

融合多类特征的Web查询意图识别

基于改进TextTiling方法的用户新兴趣发现的研究

基于TSVM与主动学习融合的蛋白质交互作用关系抽取

网页结构树相似度计算

面向互联网新闻的话题检测与追踪

基于文摘的信息检索模型

开放域问答技术研究进展

信息检索结果多样化探索

基于“VASE”特征词的网络查询分类研究

以机器翻译技术为核心的多语信息处理研究

基于URL主题的查询分类方法

短语结构树库向依存结构树库转化研究

基于话题和修辞识别的阅读理解why型问题回答

基于柱搜索的高阶依存句法分析

中文交互式问答用户问题相关检测研究

评价对象抽取及其倾向性分析

基于自动构建语料库的词汇级复述研究

复述技术研究

基于语言模型验证的词义消歧语料获取

短语结构树库向依存依存结构树库转化研究

基于启发式错误驱动学习的中文时间表达式识别

基于潜在语义索引和自组织映射网的检查结果聚类方法

基于SVMTool的中文词性标注

基于宏微观重要性判别模型的时序多文档文摘

基于社会网络的人名检索结果重名消解

中文事件抽取技术研究

一种基于主题的文本聚类方法

中文语义角色标注的特征工程

基于最大熵分类器的语义角色标注

基于SVM的汉语句子片段划分

基于二元分类的复述搭配抽取

基于改进TextTiling方法的用户新兴趣发现的研究

开放域问答技术研究进展

基于潜在语义索引和自组织映射网的检索结果聚类方法

基于浅层语义树核的阅读理解答案句抽取

国内外世界遗产原真性与完整性研究综述

从原真性保护看圆明园遗址的功能分区展示

高校内院系效率的DEA基准化分析

“真实性”和“原真性”辨析

考虑决策者偏好的模糊决策单元排序

从圆明园三大保护工程看圆明园遗址的功能分区展示

肾移植后原发性渗出性淋巴瘤1例并文献复习

结构振动的自适应滤波控制中的误差通道在线辨识与验证

FULMS algorithm based multi channel active vibration control of piezoelectric flexible beam

试论宋代社会教化的新特征

授权教育对老年人自我护理能力及健康促进生活方式的干预效果

自制简易负压引流装置在预防剖宫产腹部切口脂肪液化中的应用

2型糖尿病患者血清联朕素浓度与尿微量白蛋白相关性的研究

从“朱陆之争”到“内在理路”——余英时中国学术思想史研究理念与方法管窥

模糊非径向DEA模型的可信度求解

果皮和果肉中维生素C含量差异的测定分析

＂项目参与式＂大学生创业教育体系构建策略

超声-微波协同提取超级黑糯玉米芯色素的工艺研究

超声波电动机定子振动模态及影响因素分析

天津市公安特警甲真菌病致病菌调查

浅论调整上海市肠道门诊设置的必要性

核不均一核糖核蛋白A2／B1在非小细胞肺癌发病机制中作用的探讨

小儿消咳片中白屈菜红碱的含量测定

中医传感针研究展望

CSFV和PRRSV二联RT—PCR检测方法的建立

圆柱-球体三自由度超声电机神经网络控制策略仿真

家畜病理学实验课程教学改革与实践

天津市区交警足部浅部真菌病流行病学调查

在英语听力教学中训练学生的语境反应和重构能力——一项行动研究

鬼臼毒素的荧光光谱法研究

在英语听力教学中训练学生的语境反应和重构能力

地方工科类大学国贸专业“应用型”人才培养方案问题研究——以内蒙古工业大学为例

输入与输出的中心资源分配DEA模型

HPLC法测定牛蒡子药材中牛蒡子苷的含量

数据库原理课程教学中几个重难点问题的多解探讨

内蒙古经济类专业大学生有关就业问题调查研究

蜜罐技术的研究与分析

植物组织中糖化合物测定方法的研究进展

缓解廊坊市交通拥挤堵塞基本途径的研究

我国土地征收补偿制度的完善

“轻金属冶金学”课程多位教师联合教学的实践

土地征收补偿的理论依据和原则

从短信语言看当今青年文化心理

环氧化酶-2和血管内皮细胞生长因子在妊娠滋养细胞肿瘤中的表达及意义

嵌入式操作系统课程教学模式探索

微波辐射下离子液体催化合成α-溴代芳基酮

集体心理治疗对门诊抑郁症患者的疗效研究

超声波辐射合成2-氨基噻唑衍生物

痰中检测核不均一核糖核蛋白A2/B1早期诊断肺癌的意义

上海市肠道门诊肠道传染病防控现状调查

补脑I号治疗老年人轻度认知功能障碍临床观察

基于“三学期制”培养创新型人才的实践与思考

皮肤性病学教学资源管理与评估系统的研究

论网络时代的社会思潮

计算机类应用型本科的人才定位和课程体系

基于URL主题的查询分类方法

微波辐射下2-乙酰氨基噻唑衍生物的一锅法合成及生物活性研究

构建邯郸广府太极拳国际化发展体系的可行性研究

太极拳国际化发展体系的构建研究

非物质文化遗产保护视野下太极拳的高校传承模式实证研究——兼谈民族体育高校传承的实践

适配体药物的研究现状及其在传染病防制领域的应用前景

微波辐射下N-[4-（香豆素-3-基）噻唑-2-基]芳醛腙类化合物的合成及生物活性研究