东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于虚词切分的藏文分词系统的设计与实现

ISSN号：1005-5738
期刊名称：西藏大学学报(社会科学版)
时间：2012.10.10
页码：61-65+96
分类：TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]西藏大学藏文信息技术研究中心,西藏拉萨850000
相关基金：2011年度国家自然科学基金资助项目“藏语语音合成关键技术研究”（项目号：61165010）;2010年度国家自然科学基金资助项目“基于虚词的藏语基本句型的形式化研究”（项目号：61063015）;2011年度国家自然科学基金资助项目“藏语依存树库的构建”（项目号：61163043）; 2009年度教育部长江学者与创新团队发展计划资助项目“藏文信息技术创新团队”（项目号：IRT0975）阶段性成果
相关项目：基于虚词的藏语基本句型的形式化研究

作者：赵栋材|Zhao Dong-cai(Research Center of Tibetan Informati|

关键词：虚词识别, 藏文分词, 藏文信息处理, 中文信息处理, Function word recognition, Tibetan participle word, Tibetan, Information processing, Chinese

中文摘要：

藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。

英文摘要：

The Tibetan participle word is the baseline of research on the processing Tibetan natural language.According to the special role of the Tibetan function words in the Tibetan text as well as its integrating features,agglutinative variant and restore features,a Tibetan participle words system was designed based on the forward maximum matching of Tibetan function words segmentation.The original text word is carried on scanning process gradually by this system to get segmentation results.The experiments showed that the function words segmentation correct rate possess more than 90% with the system.

同期刊论文项目

藏语依存树库的构建

期刊论文 41 会议论文 2 著作 2

藏语语音合成关键技术研究

期刊论文 15

基于虚词的藏语基本句型的形式化研究

期刊论文 16 著作 1

　藏文信息处理技术

期刊论文 8

同项目期刊论文

面向藏语自然语言处理的藏语语言资源建设

基于HMM模型的藏语语音合成研究

基于藏语拉萨语语音识别中端点监测算法的研究

藏语句子边界识别方法

拉萨方言语音特征向量的AP聚类分析

基于BP网络的木刻藏文经书文字识别研究

大型藏语平衡语料库建设中样本类别号的研究

藏文搜索引擎中的分词算法研究

基于 FUG 的藏语句法形式化描述

藏语动词的黏着性及屈折性变化研究

藏文文本分词赋码一体化研究

藏文自动分词中未登录词处理方法研究

识别现代藏文基字的算法设计与实现

藏语语料库TEI标记规范探讨

面向藏语自然语言处理的藏语语言资源建设

基于FUG的藏语句法形式化描述

基于BP网络的木刻藏文经书文字识别研究

现代藏文音节字自动校对研究

藏文词性自动标注中歧义问题处理方法研究

藏语语音合成中语料数据标注规则的设计

数据挖掘技术在西藏旅游电子商务中的应用研究

藏文文本分词赋码一体化研究

面向藏语自然语言处理的藏语语言资源建设

基于UFG的藏语句法形式化描述

词汇计量与史诗诸要素的解析_以语料库方法解构格萨尔史诗之_霍岭

藏语句子结构的分析方法刍议

上下文无关文法与藏语句法分析

再析藏语语法理论中的“格”概念

计算机识别藏语虚词的方法研究

藏语依存树库构建的理论与方法探析

面向信息处理的藏文字词统计分析设计

词汇计量与史诗诸要素的解析——以语料库方法解构格萨尔史诗之《霍岭》

藏文词性自动标注方法的比较

基于FUG的藏语句法形式化描述

基于统计的藏文音节字校对系统开发研究

藏语言的定性分析与定量研究

“大型藏文基础语料库”数据分析

基于BP网络的木刻藏文经书文字识别研究

现代藏文音节字自动校对研究

史诗《霍岭》语料库句子及诗行计量解析

配价语法视觉下的藏语句子结构描写研究

基于藏文音节特征的模式匹配算法的研究

词汇计量与史诗诸要素的解析--以语料库方法解构格萨尔史诗之《霍岭》

交互式藏文初学软件的设计

基于贝叶斯算法的藏语拼写检查的研究与实现

面向藏语自然语言处理的藏语语言资源建设

藏文音节规则库的建立与应用分析

藏语句子边界识别方法

基于BP网络的木刻藏文经书文字识别研究

藏文词性自动标注中歧义问题处理方法研究

藏语自动分词中的几个关键问题的研究

藏文停用词选取与自动处理方法研究

期刊信息

《西藏大学学报》

主管单位:西藏大学
主办单位:西藏大学
主编：图登克珠
地址：西藏拉萨市藏大东路10号
邮编：850000
邮箱：xzdxxbzmb@163.com
电话：0891-6405034

国际标准刊号：ISSN：1005-5738
国内统一刊号：ISSN：54-1034/C
邮发代号:

获奖情况:
2007年,2011年两次被评为"全国民族地区民族文字版...

国内外数据库收录:
中国社科基金资助期刊,中国国家哲学社会科学学术期刊数据库

被引量:2898