基于NLP的高精度文本检索模型研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于NLP的高精度文本检索模型研究

项目名称：基于NLP的高精度文本检索模型研究
项目类别：面上项目
批准号：60773027
申请代码：F0206
项目来源：国家自然科学基金
研究期限：2008-01-01-2010-12-31

项目负责人：孙乐
负责人职称：研究员
依托单位：中国科学院软件研究所
批准年度：2007

中文摘要：

文本检索系统的查询条件和文档集都是由自然语言构成的。由于传统文本检索系统本质上只是将文本看作一组无序词串，利用简单的词频统计来模糊计算相关性，因此，传统检索系统面临许多无法解决的问题。同时，一些研究表明将相对复杂和精确的自然语言处理（NLP）技术直接（浅层）应用于传统检索系统并不能带来性能的明显的改善。本申请书提出的基于NLP的高精度文本检索模型研究，是以NLP技术与信息检索中的语言模型方法的深层次融合为出发点，主要探讨不同于传统IR模型的能够融入NLP技术的新的语言模型检索方法，研究这些不同层次的NLP技术对IR性能的影响，并期望在比较后获得相对最佳的融合模型。本项目试图建立NLP与IR之间的紧密的联系，来系统地揭示一些客观现象，而这在国内尚属空白。

中文主题词：高精度文本检索；语言模型；自然语言处理

成果综合统计

期刊论文
会议论文
专利
获奖
著作

12
20
0
0
0

基于核方法的敏感信息过滤的研究

Study of Kernel-based Methods for Chinese Relation Extraction(poster.

Two-Step Chinese NER Based on CRF

ISCAS at Multilingual Opinion Analysis Task NTCIR 7

基于小规模尾字特征的中文命名实体识别研究

基于VASE特征词的网络查询分类研究.

音字转换中分层解码模型的研究与改进

基于labeled-LDA模型的文本分类新算法

基于单字提示特征的中文命名实体识别快速算法

基于“VASE”特征词的网络查询分类研究

会议论文

Improving Phrase-based SMT Model with Flattened Bilingual Parse Tree.

ISCAS: A System of Chinese Word Sense Induction Based on K-means Algorithm.

Overview of Chinese Word Sense Induction at Task-4 at CLP2010.

基于规则和类型还原的用户查询意图识别.

A Syllable-based Name Transliteration System.

基于上下文图模型文本表示的文本分类研究

利用压平的双语句法树进行短语重排序

基于单字消除和实体识别的查询切分研究

软件所COAE2008报告

A Unified Graph-Based Iterative Reinforcement Approach to Personalized Search.

Query Model Refinement Using Word Graphs.

A Structured Prediction Approach for Statistical Machine Translation

Smoothing LDA Model for Text Categorization.

A Lexical Chain Approach for Update-style Query-focused Multi-document Summarization.

A GENERATIVE ENTITY-MENTION MODEL FOR LINKING ENTITIES WITH KNOWLEDGE BASE.

A Unified Iterative Optimization Algorithm for Query Model and Ranking Refinement.

Y Smoothing Document Language Model with Local Word Graph.

TC-DCA: A System for Text Classification Based on Document's Content Allocation.

一种LDA模型的高效并行求解算法.

ISCAS机器翻译和系统融合评测系统介绍

相关项目

维、哈、柯多文种信息检索技术研究

期刊论文 3

面向维基百科的多粒度一体化信息抽取方法研究

期刊论文 19

引入涉身认知机制的汉语隐喻计算模型及其实现

期刊论文 17 会议论文 1

互联网上基于概念分析的文本信息监控技术研究

期刊论文 40 会议论文 7

基于语言模型的通用实体检索建模及框架实现研究

期刊论文 23 会议论文 10

基于Web的概念实例及其属性值提取方法研究

期刊论文 10 会议论文 12 获奖 4

语音识别中多层语言知识建模及全局解码算法研究

期刊论文 3 会议论文 16

基于等价伪词的汉语全文无指导词义消歧技术研究

期刊论文 33 会议论文 15

现代维语信息处理技术方法和信息库构造研究

期刊论文 10 会议论文 4 获奖 18 著作 2

孙乐的项目

语义计算与理解的资源共享与测评方法

基于查询语义分析与推理的隐式相关反馈检索模型研究

期刊论文 3

基于语言知识库的统计翻译模型研究

期刊论文 3

汉语认知加工机制与计算模型研究

期刊论文 7

语义计算与理解的资源共享与测评方法

期刊论文 5 会议论文 15