东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

融合音节特征的最大熵藏文词性标注研究

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2013
页码：160-165
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030, [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
相关基金：国家自然科学基金资助项目（61032008,61262054）
相关项目：多民族文字识别及理解的理论与方法研究

作者：于洪志|李亚超|汪昆|冷本扎西|

关键词：藏文, 词性标注, 最大熵, 形态特征, Tibetan, part of speech, maximum entropy, morphological features

中文摘要：

藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%。

英文摘要：

Tibetan Part of Speech（POS）is an important problem for Tibetannatural language processing,the paper studies the fusion of morphologicalfeatures for Tibetan part of speech withmaximum entropy model,based on the analysis of Tibetan scripts and the result of statistics,and define the feature templates.Experimental results show that,Tibetan POS with maximum entropy achieves much better results,syllable features can increase the performance of Tibetan POS significantly,and obtain an error reduction of 6.4%compare to the baseline.

同期刊论文项目

藏文实体语义关系抽取理论与方法研究

期刊论文 8

多民族文字识别及理解的理论与方法研究

期刊论文 41 会议论文 33 获奖 5 著作 3

同项目期刊论文

维吾尔文智能输入法研究

基于维语词干词缀粒度的汉维机器翻译

维吾尔语词尾对汉维统计机器翻译影响的研究

基于KNN的中文文本分类性能研究

维吾尔文扫描页的倾斜校正

印刷哈萨克斯拉夫粘连字符的切分方法

最大熵和条件随机场模型相融合的藏文人名识别

<span style="color:#943634;font-family:宋体;font-size:10.5pt;">名词重叠形式的统计分析</span>

与基线信息无关的手写阿拉伯文字特征提取

维吾尔文智能输入法的研究

基于短语的藏汉机器翻译系统

基于短语的藏汉统计机器翻译系统

统计与规则相结合的藏文句子自动断句方法

The initial framework of developing semantic knowledge base of Mongolian idioms

基于词典的藏汉跨语言检索系统研究

“蒙古语名词语义信息词典”数据库的构建

Graphic Language Model for Agglutinative Languages Uyghur as Study Case

《蒙古语名词语义信息词典》中的一价名词语义关系分析

Topic Language Model Adaption for Recognition of Homologous Offline Handwritten Chinese Text Image

一种基于HMM的维吾尔文联机手写识别的方法

Restoring camera-captured distorted document images

<span style="color:#943634;font-family:宋体;font-size:10.5pt;">《蒙古语语法信息词典名词分库》的设计</

Exploring More Representative States of Hidden Markov Model in Optical Character Recognition: A Clus

一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法

一种与基线信息无关的阿拉伯文字特征提取方法

维吾尔新文字印刷体识别系统的研究与开发

面向信息处理的蒙古语名词语义分类体系

基于条件随机场的藏语自动分词方法研究与实现

多字体印刷藏文内容监测系统研究

基于音节标注的藏文自动分词研究

一种提高维吾尔语-汉语词语对齐的方法研究

蒙古语熟语资源库的初步构建

“蒙古语名词语义信息词典”的开发与应用

蒙古语语义信息词典SIKM的研发

基于音节标注的藏文自动分词研究

基于语义空间的藏文微博情感分析方法

融合无监督特征的藏文分词方法研究

面向语音合成的藏语音素切分算法研究

面向互联网的藏文实体关系模板获取技术研究

藏语声调产生的原因探析——以安多天祝话单音节和双音节音调实验为个案

基于多特征的藏文微博情感倾向性分析

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136