自然语言处理中语言元素的非齐次属性研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

自然语言处理中语言元素的非齐次属性研究

项目名称：自然语言处理中语言元素的非齐次属性研究
项目类别：面上项目
批准号：60673037
申请代码：F0206
项目来源：国家自然科学基金
研究期限：2007-01-01-2009-12-31

项目负责人：刘秉权
负责人职称：副教授
依托单位：哈尔滨工业大学
批准年度：2006

中文摘要：

语言元素的非齐次属性是指语言元素在语料中出现的位置和范围信息及其特点，是自然语言中的普遍现象，是自然语言语法、语义规律的一种间接体现；针对某些自然语言处理的实验表明对非齐次属性规律的充分利用可以有效提高处理精度。本研究基于面向大规模真实语言环境的自然语言处理系统，以当前自然语言处理中的主流统计模型为考察对象，以概率论和信息论为理论基础，研究语言元素的非齐次属性及其作用规律，包括非齐次属性的量化表示方法和统计规律分析；非齐次概率统计模型的基本理论；非齐次概率模型的特征表示、抽取和组合优化；非齐次概率模型的理论评价标准等。在对特定模型齐次化的基础上总结适合非齐次概率建模的通用原则和基本方法，以期对词性标注、句法分析等各层次的自然语言分析以及语音识别、音字转换、信息检索、机器翻译、信息抽取、自动文摘等自然语言处理应用的性能提高起到普遍促进作用。

中文主题词：自然语言处理;语言元素;非齐次属性;概率模型

结论摘要：

英文主题词natural language processing;language element;non-stationary property;probability model

成果综合统计

期刊论文
会议论文
专利
获奖
著作

15
13
0
0
0

空间金字塔颜色直方图在图像分类中的应用

基于双阈值的特定英语音频句子边界检测

面向汉语建模的自适应词表生成算法

一种基于无监督学习的词变体识别方法

Trie树和单字倒排相结合的汉英词典查找机制

领域术语自动抽取及其在文本分类中的应用

The Effectiveness Study of Local Maximum Feature for Chinese Unknown Word Identification

Exploiting Pinyin Constraints in Pinyin-to-Character Conversion Task: a Class-Based Maximum Entropy

An Empirical Study of Non-Stationary Ngram Model and its Smoothing Techniques

The Study of Non-stationary Maximum Entropy Markov Model and its Application on the Pos-Tagging Task

Exploiting Word Positional Information in Ngram Model for Chinese Text Input Method

Research on Chinese place name recognition based on kernel classifier

面向网络文本的中文产品命名实体识别

双阈值的特定英语音频句子边界检测

基于词聚类特征的统计中文组块分析模型

会议论文

Extracting domain-specific terms from unlabeled web documents by bootstrapping and term classifiers

基于统计的中文领域术语自动抽取方法的比较研究

BBS 短文本聚类技术研究

Adaptive Maximum Marginal Relevance Based Multi-email Summarization

Foxinfo1.0: A Chinese Topic-oriented Search Engine

InsunPOS ：基于条件随机域的词性标注系统

Chinese chunking algorithm based on conditional random fields

A combination of rule and supervised learning approach to recognize paraphrases

IMAGE CLASSIFICATION BY COMBINING MULTIPLE SVMS

Chinese Part-of-speech Tagging Based on Fusion Model

基于内容的服装图像检索技术研究

Chinese Chunking Algorithm Based on Cascaded Conditional Random Fields

Chinese chunking and its application on similarity computation

相关项目

基于等价伪词的汉语全文无指导词义消歧技术研究

期刊论文 33 会议论文 15

互联网上基于概念分析的文本信息监控技术研究

期刊论文 40 会议论文 7

面向维基百科的多粒度一体化信息抽取方法研究

期刊论文 19

现代维语信息处理技术方法和信息库构造研究

期刊论文 10 会议论文 4 获奖 18 著作 2

引入涉身认知机制的汉语隐喻计算模型及其实现

期刊论文 17 会议论文 1

基于Web的概念实例及其属性值提取方法研究

期刊论文 10 会议论文 12 获奖 4

基于贝叶斯统计学习的概率软测量建模方法研究

期刊论文 22

基于超几何分布的无参概率信息检索模型研究

期刊论文 1

非母语写作水平计算机自动评测技术研究

期刊论文 5 会议论文 4

刘秉权的项目

面向问答社区的中文描述性答案融合框架及融合方法研究

期刊论文 2

面向网络异构信息源的问答资源挖掘

期刊论文 8 会议论文 4