东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于多特征融合的中文比较句识别算法

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2013
页码：110-116
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]北京理工大学,北京100081
相关基金：国家重点基础研究发展计划（973计划）资助项目（2013CB329605,2013CB329303）;国家自然科学基金资助项目（61201351）;国家自然科学基金重点资助项目（61132009）
相关项目：基于概率化SC文法的多策略机器翻译研究

作者：刘全超|师超|黄河燕|周海云|

关键词：比较句, 规则, CRF, SVM, comparative sentence , rule , CRF, SVM

中文摘要：

观点承我着文本的重要信息,而比较句是观点评论中一种常见的句式现象.针对中文比较句识别问题,该文提出了一种基于规则与统计相结合的方法并进行实验.该方法先对语料及其分词结果进行规范化处理,再通过基于比较特征词词典与句法结构模板、依存关系相结合的方法进行泛提取.然后设计一种CSR规则提取算法,并利用CRF挖掘实体对象信息及语义角色信息.最后利用SVM分类器,选取不同特征维数,找到使性能达到最优的特征形式完成精提取.

英文摘要：

Opinions always carry important information of texts. Comparative sentence is a common way to express opinion. This paper described how to recognize comparative sentences from Chinese text documents by applying rule-based methods and statistical methods as well as analyze the performance of these methods. This method firstly normalized the corpus and its segmentation results, and then got the broad extraction results by using a lexiconbased method, sentence structure and dependent relationship analysis. Then a kind of CSR rule extraction algorithm was designed to extract the dependency relationship. The paper also used a CRF algorithm to identify entities and semantic roles. Finally, by using SVM classifier and choosing different feature dimensions the paper found the most optimum and effective features combination to finish the accurate extraction.

同期刊论文项目

基于概率化SC文法的多策略机器翻译研究

期刊论文 10 会议论文 8 获奖 2

基于本体的多策略民汉机器翻译研究

期刊论文 25

同项目期刊论文

基于网站用词调查的现代维吾尔语词长研究

现代维吾尔语语言资源监测中数据分析技术研究

基于藏语字性标注的词性预测研究

基于多特征微博话题情感倾向性判定算法研究

多策略机器翻译研究综述

融入双语最大名词短语的机器翻译模型

引入混合特征的最大名词短语双向标注融合算法

基于依存适配度的知识自动获取词义消歧方法

基于双语协同训练的最大名词短语识别研究

基于词语距离的网络图词义消歧

现代维吾尔语句子分类系统

汉维双语计算机操作学习系统的开发与应用

新疆小学信息技术双语教学资源构建研究

基于形态分析的现代维吾尔语名词词干识别研究

A Hybrid Method of Domain Lexicon Construction for Opinion Targets Extraction Using Syntax and Seman

基于词汇语义和句法依存的情感关键句识别（已录用）

基于多特征微博话题情感倾向性判定算法研究

多策略机器翻译研究综述

Self-Adaptive Topic Model: A Solution to the Problem of "Rich Topics Get Richer"

基于级联模型的中文情感要素抽取

A Hybrid Method of Domain Lexicon Construction for Opinion Targets Extraction Using Syntax and Semantics

基于词汇语义和句法依存的情感关键句识别

基于网站用词调查的现代维吾尔语词尾切分和应用研究

基于网站用词调查的现代维吾尔语词干提取和应用研究

现代维吾尔文网络媒体用词研究

用于构建维吾尔文语料库的中文件格式转换技术研究

现代维吾尔语常用词统计关键技术研究

现代维吾尔语简单句识别研究

汉哈机器翻译中的文字转换技术研究

藏文词典排序原理与查词典的方法

基于语法的维吾尔语情感词汇自动获取

基于错误驱动学习策略的藏语句法功能组块边界识别

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136