东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

分布式策略与CRFs相结合识别汉语组块

ISSN号：1003-0077
期刊名称：《中文信息学报》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]大连理工大学计算机科学与工程系,辽宁大连116024
相关基金：国家863高技术研究发展计划资助项目（2006AA012140）;国家自然科学基金资助项目（60673039）

作者：黄德根[1], 于静[1]

关键词：计算机应用, 中文信息处理, 组块识别, 条件随机域(CRFs), 分布式策略, 基于CRFs的错误驱动, 浅层句法分析, computer application, Chinese information processing, chunking, conditional random fields（CRFs）, distributed strategy, error-driven technique, shallow parsing

中文摘要：

该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块。该方法首先将11种类型的汉语组块进行分组，结合CRFs构建不同的组块识别模型来识别组块；之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别；最后依据各分组F值大小顺序处理类型冲突。实验结果表明，基于CRFs的分布式策略及错误驱动方法识别汉语组块是有效的，系统开放式测试的精确率、召回率、F值分别达到94．90％、91．00％和92．91％，好于单独的CRFs方法、分布式策略方法及其他组合方法。

英文摘要：

This paper proposes a distributed strategy for Chinese text chunking on the basis Conditional Random Fields（CRFs） and Error-driven technique. First eleven types of Chinese chunks are divided into different groups to build CRFs model respectively. Then, the error-driven technique is applied over CRFs chunking results for further modification. Finally, a method is described to deal with the conflicting chunking according to the F-measure values. The experimental results show that this approach is effective, outperforming the single CRFs-based approach, distributed method and other hybrid approaches in the open test by achieving reaches 94.90%, 91.00% ,and 92.91% in recall, precision, and F-measure respectively.

同期刊论文项目

面向生物医学领域的文本挖掘技术研究与应用

期刊论文 77 会议论文 15

同项目期刊论文

基于产品属性的条件句倾向性分析

评论挖掘中产品属性归类问题研究

文本中人物性别识别研究

日本地震的微博热点事件分析

基于用户向量扩展的协同推荐方法

Web-oriented OOV translation extracting approach through cross-language query expansion for English-

Extracting protein-protein interaction from biomedical literature using an ensemble kernel

BioPPISVMExtractor:A Protein-Protein Interaction Extractor for Biomedical Literature Using SVM and R

基于SimRank的跨领域情感倾向性分析算法研究

Uncertainty sampling-based active learning for protein-protein interaction extraction from biomedica

BioPPIExtractor: A protein-protein interaction extraction system for biomedical literature

Incorporating rich background knowledge for gene named entity classification and recognition

Fusing multiple methods for discovering implicit knowledge in biomedical literature

Query expansion based on local co-occurrence analysis

Exploiting the performance of dictionary-based bio-entity name recognition in biomedical literature

基于段落匹配和分布密度的偏重摘要实现机制

Improving the performance of bio-entity name recognition in biomedical literature via the contextual

基于支持向量机的生物医学文献蛋白质关系抽取

Exploiting the contextual cues for bio-entity name recognition in biomedical literature

Variable length relevant passage retrieval in biomedical literature

条件随机域与上下文线索结合的生物实体识别

基于情感分布的微博热点事件发现

基于编辑距离和多种后处理的生物实体名识别

中文文本的信息自动抽取和相似检索机制

基于锚信息的生物医学文献双语摘要句子对齐

文本挖掘中的知识模式表示、评价及检索机制

搜索引擎发展阶段研究及热点发现

基于半监督学习的蛋白质关系抽取研究

分布式检索中基于主题的语言模型集合选择策略

一种基于社会化标注的网页检索方法

基于LDA模型的餐馆评论排序

基于ChunkCRF的观点持有者识别及其在观点摘要中的应用

融合字特征的平滑最大熵模型消解交集型歧义

基于高斯混合模型的生物医学领域双语句子对齐

基于权重标准化SimRank方法的查询扩展技术研究

基于LDA模型的博客垃圾评论发现

基于语义资源的生物医学文献知识发现

基于项目和标签的随机游走个性化信息推荐模型

基于神经网络的Listwise排序学习方法的研究

基于语义结构的科技论文抄袭检测

基于文献的知识发现：一个面向H1N1的研究

情感词汇本体的构造

基于文本挖掘机制的区域经济关系分析

基于用户信息平滑聚类的协同推荐方法

中文情感常识知识库的构建

语言模型在信息检索中的应用

一种基于位置优化的排序学习方法

基于实体关系的犯罪网络识别机制

基于词向量的情感新词发现方法

追踪事件微博报道：一种流的动态话题模型

基于多级锚点词的典籍英汉双语对齐研究——以《茶经》及其译文为例

自然语言处理技术在网络案情分析系统中的应用

文本挖掘技术在互联网赌博案情分析中的应用

基于互文性度量的文本翻译索引

我国知识管理领域研究热点问题及发展趋势预测

基于加权SimRank的跨领域文本情感倾向性分析

基于支持向量机的人物属性抽取

基于语义特征和本体的语篇情感计算

人际网络关系抽取和结构挖掘

基于结构和链接扩展的中文网页分类研究

大数据时代的计算政治学研究

基于文档语义图的中文多文档摘要生成机制

基于改进潜在语义分析的跨语言检索

基于语境歧义词的句子情感倾向性分析

基于网页查询结果的广告查询扩展研究

一种基于社会化标注的查询扩展方法

基于情感向量空间模型的歌曲情感标签预测模型

维基百科中争议性文章的发现方法研究

一种基于主题类别信息问句检索的新方法

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136