东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

藏文网页抓取及编码统一转换的系统研究

ISSN号：1009-2102
期刊名称：西北民族大学学报(自然科学版)
时间：0
页码：22-25
语言：中文
分类：TP393.02[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]西北民族大学中国民族信息技术研究院,甘肃兰州730030
相关基金：国家自然科学基金（60773052）;国家教育部基金项目（MZ115-78）
相关项目：基于语音、嗓音和呼吸信号的藏语拉萨话韵律模型研究

作者：陈琪|于洪志|李永宏|

关键词：藏文网页, 抓取, 编码识别, 编码转换

中文摘要：

藏文文本资源的收集对藏语信息处理研究有着至关重要的作用．文章在分析国内外藏文网页主要编码方式的基础上，提出了藏文网页的编码识别、自动获取与过滤，文本编码统一转换的算法．系统主要包括网页编码识别网页、自动获取、文本过滤、编码转换等几个模块．在windows平台下对系统的测试结果良好，为藏语电子文本的收集和整理提供了方便、快捷的平台．

同期刊论文项目

基于语音、嗓音和呼吸信号的藏语拉萨话韵律模型研究

期刊论文 39 会议论文 5

同项目期刊论文

藏语安多方言的音联结构及统计分析

基于线性预测残差倒谱的基音检测

语音驱动的唇型合成系统的实现

现代藏语声调研究现状及方法

基于LPC残差与SCMDSF相结合的基音周期检测

国内鼻音的研究进展概述

多维嗓音分析软件(MDVP)的研究

口鼻流信号分析软件的功能设计

藏语语音合成语料库的韵律标注规则设计

藏语新闻朗读的呼吸信号声学分析

《藏英汉有声电子词典》的功能结构设计与系统实现

PowerLab生物信号处理系统在音语生理研究中的应用

藏语孤立词语音识别系统研究

言语声学参数分析系统设计

藏文编码方式及其相互转换

藏文字形结构计量统计分析

基于词汇层面的藏语拉萨话音节时长统计

基于字词处理的藏文文本分析系统

基于关联规则的藏语语音韵律参数提取

《仓央嘉措情歌》的用词风格统计研究

基于大字符集编码的藏梵文的混合排序

音段自动切分系统的设计与实现

藏语连续语音语料库设计与实现

套房式语音录音室的声学设计及客观评价

藏语命名实体识别研究

新旧小学藏语文教材量化对比分析——文章体裁、文学体裁及选材的统计研究

藏语语音合成中文本分析的若干问题研究

关联规则挖掘Apriori算法的优化及Java实现

仓央嘉措情歌声学分析

在Windows Mobile中藏文SIP的实现

基于SVM的藏语说话人性别识别

Sona-Match实时发音纠正在语音教学中的实现

藏语新闻朗读语音停顿和呼吸重置关系研究

现代语音学仪器及生理语音学研究

藏语方言计算机辅助系统的研究

基于AMDF的藏语语音基音周期检测

语音语料库的设计研究

藏语单音节声学参数数据库结构设计

期刊信息

《西北民族大学学报：自然科学版》

主管单位:国家民族事务委员会
主办单位:西北民族大学
主编：何烨
地址：甘肃兰州市西北新村1号
邮编：730030
邮箱：xmxb@chinajournal.nt.cn
电话：0931-2938092

国际标准刊号：ISSN：1009-2102
国内统一刊号：ISSN：62-1188/N
邮发代号:

获奖情况:
2000年被中国学术期刊（光盘版）编委会评为《CAJ...,2001年成为中文科技期刊数据库全文收录期刊

国内外数据库收录:

被引量:1936