东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于最大匹配和歧义检测的中文分词粗分方法

ISSN号：1671-4598
期刊名称：《计算机测量与控制》
时间：0
分类：TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]中国石油大学地球物理与信息工程学院, [2]中国石油大学(北京)油气资源与探测国家重点实验室, [3]中国石油化工股份有限公司石油勘探开发研究院信息所
相关基金：国家自然科学基金(60473125);中国石油(CNPC)石油科技中青年创新基金(5E7013);国家重大专项子课题(G5800-08-ZS-WX)

作者：李国和[1], 刘光胜[1], 吴卫江[1], 孙红军[2,3], 唐先明[2,3], 韩宝东[2,3]

关键词：中文分词, 粗分, 最大匹配算法, 全切分算法, 歧义检测

中文摘要：

中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好效果。

同期刊论文项目

沉积微相划分中知识发现机理的研究

期刊论文 34 会议论文 1

同项目期刊论文

基于人工免疫系统的曲线识别方法

Efficient Algorithm for Superi

An Efficient and Optimal Metho

基于对象分布的连续属性离散化方

基于概率统计局部聚类的曲线分段

基于人工免疫系统的沉积微相自动

基于标识特征的信息系统特征选取

一种时序曲线的表示和识别方法

基于VC的图形标识工具GLSTool设

基于支持向量机的缺失数据补齐方

基于支持向量机的地层识别研究

基于概率统计的有序对象信息系统

石油勘探软件集成技术研究

基于类扩张矩阵的信息系统特征选

一种曲线形态的识别方法及其应用

针对全空子数据体的GPU体绘制

一种面向连续型属性的特征选取方法

两个经典频繁子图挖掘算法的对比与分析

基于FP_Growth的消费行为关联分析系统设计与实现

基于对象分布的连续属性离散化方法

语义关系自动抽取方法

综合最大匹配和歧义检测的中文分词粗分方法

提高时序数据识别精度的方法及应用

混合销售预测模型

移动工作集的冲突避免和解决

基于强化正域的属性约简方法

基于语义的文档关键词提取方法

基于Spark的人工蜂群改进算法

基于VC的图形标识工具GLSTool设计与实现

基于Android手机的标签数字码识别与应用

人工神经网络在并行计算机集群上的设计研究

基于支持向量机的缺失数据补齐方法

一种基于极大连通子图的电信社群网分割算法

期刊信息

《计算机测量与控制》
北大核心期刊（2011版）

主管单位:中国航天科工集团公司
主办单位:中国计算机自动测量与控制技术协会
主编：苟永明
地址：北京海淀区阜成路甲8号中国航天大厦405
邮编：100048
邮箱：ly@chinamca.com
电话：010-68371578 68371556

国际标准刊号：ISSN：1671-4598
国内统一刊号：ISSN：11-4762/TP
邮发代号:82-16

获奖情况:
中国学术期刊综合评价数据库来源期刊,中国科技论文统计源期刊,“国家期刊奖百种重点期刊”

国内外数据库收录:
美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）

被引量:27924