东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于知网的贝叶斯中文人名识别

ISSN号：0469-5097
期刊名称：南京大学学报(自然科学版)
时间：2012
页码：147-153
分类：TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]合肥工业大学计算机与信息学院,合肥230009
相关基金：国家自然科学基金（61070131,61175051）,国家重点基础研究发展计划（973项目）（2009CB326203）
相关项目：动态环境下复杂系统因果关系发现与稳健性推理的研究

作者：蒋才智|王浩|姚宏亮|

关键词：贝叶斯分类器, 知网语义, 中文人名识别, Bayesian classifier, HowNet, Chinese name recognition

中文摘要：

本文在朴素贝叶斯分类器的基础上，融人了知网语义的元素，构建了一个统计与语义相结合的中文人名识别模型．其基本思想是，首先利用贝叶斯分类器对中国人名进行定位和粗略识别，然后使用知网语义做进一步修正．该模型在继承了贝叶斯算法公式简单和具有一定学习能力的基础上，避免了人名规则的大量使用，同时克服统计方法中人名边界难于界定的问题．实验结果表明，其准确率和召回率分别为95．67％和97．78％．

英文摘要：

Chinese name is of highest frequency of unknown words in Chinese articles. The correct fate of Chinese name recognition will affect the application of syntactic analysis, machine translation, information retrieval, extraction, automatic question answering system, and so on. It is the key and difficult point. The difficulty of Chinese name recognition is that it contains large kinds of name without morphological characteristics, also has some uncommon words. Despite these shortage for name recognition, there is the relative independence between characters except a small number of characters could be word. Thus feature is well in line with the Naive Bayes. In fact, the Bayesian classifier has good recognition results. But in the complex context, the recognition is not satisfactory for applications. The reason is that it is difficult to define the boundary of the names. It is easy to cause the boundary error. To solve this problem, this paper constructs a Chinese name recognition model combining HowNet with Bayesian classifier. The basic idea is to locate and recognize the Chinese name roughly by Bayesian classifier, and then to fix this name by using HowNet. The model not only has the advantages of simple formula and ability to learn, but also overcomes the extensive use of rules and the difficulty of boundary defining. Experimental results show that the precision and recall rates were 95.67% and 97.78%, respectively.

同期刊论文项目

动态环境下复杂系统因果关系发现与稳健性推理的研究

期刊论文 38

基于灵敏性分析和隐因素发现的复杂系统脆弱性演化机制研究

期刊论文 39

同项目期刊论文

基于影响力计算模型的股票网络社团划分方法

基于Markov毯分解的抽样近似推理算法*

基于结构分析的局部Gibbs抽样自动推理算法

一种基于桶树的自动推理问题求解算法

一种基于因果强度的局部因果结构主动学习方法

局部因果关系分析的隐变量发现算法*

基于离群特征模式的股市波动预测模型

改进的基于邻接树的贝叶斯网络推理算法

一种基于流特征模式的股市跟踪预测算法

基于马尔科夫毯特征选择和向量自回归的房地产板块股价指数的预测分析

特征滞后计算的股市波动预测

特征背离和风险偏好分析的股价态预测方法

一种求解社区检测问题的改进分布估计算法

基于Markov毯分解的抽样近似推理算法

一种基于节点相异度的社团层次划分算法

复合加权股票网络的活跃性层次聚类*

贝叶斯网络的一种隐变量学习方法

动态贝叶斯网络的灵敏性分析研究

基于状态空间与概率空间映射的极大相似度匹配情感模型

基于马尔可夫毯时序回归模型的房地产板块指数预测

基于影响力传动的 Kuramo to 股市预测模型

自利Agent追捕联盟生成算法

基于FactoredFrontier算法的动态贝叶斯网络灵敏性分析方法

基于量子少数者博弈的多机器人追捕

K线能量计算的股市生命期态势预测方法

基于影响力计算模型的股票网络社团划分方法

基于结构分析的局部Gibbs抽样自动推理算法

基于离群特征模式的股市波动预测模型

基于贝叶斯网络的频繁模式兴趣度计算及剪枝

特征滞后计算的股市波动预测

基于Markov毯分解的抽样近似推理算法

一种基于马尔可夫毯分解的抽样近似推理算法

A Method of Learning Latent Variables Dimensionality for Bayesian Networks

一种基于结构分析的局部Gibbs抽样自动推理算法

Online Feature Selection with Streaming Features

融合遗传优化的粒子滤波器算法

基于L1正则化的贝叶斯网络分类器

基于Factored Frontier算法的动态贝叶斯网络灵敏性分析方法

基于粒子滤波的非线性系统静态参数估计方法

基于状态空间与概率空间映射的极大相似度匹配情感模型

一种基于结构分解和因子分析的贝叶斯网络隐变量发现算法

An new immune genetic algorithm based on uniform design sampling

灵敏性分析下的因果网络参数的扰动学习研究

普适医疗信息管理与服务的关键技术与挑战

逻辑回归分析的马尔可夫毯学习算法

多Agent动态影响图的一种混合近似推理算法

基于马尔可夫毯时序回归模型的房地产板块指数预测

基于影响力传动的 Kuramo to 股市预测模型

基于FactoredFrontier算法的动态贝叶斯网络灵敏性分析方法

基于量子少数者博弈的多机器人追捕

K线能量计算的股市生命期态势预测方法

基于频繁项集发现的匿名隐私保护算法

基于熵理论的匿名发布表质量度量方法研究

一种改进拉丁方抽样免疫遗传算法

微观数据外包管理中的安全问题研究进展

相依样本下移动平滑过程的极限性质（英文）

数据发布领域匿名隐私保护相关技术研究

生物缺失数据处理的贝叶斯模型研究

K-匿名隐私保护相关技术的研究

期刊信息

《南京大学学报：自然科学版》
中国科技核心期刊

主管单位:中华人民共和国教育部
主办单位:南京大学
主编：龚昌德
地址：南京汉口路22号南京大学（自然科学版）编辑部
邮编：210093
邮箱：xbnse@netra.nju.edu.cn
电话：025-83592704

国际标准刊号：ISSN：0469-5097
国内统一刊号：ISSN：32-1169/N
邮发代号:28-25

获奖情况:
中国自然科学核心期刊,中国期刊方阵“双效”期刊

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9316