东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于多时间尺度韵律特征分析的语音转换研究

ISSN号：1673-629X
期刊名称：计算机技术与发展
时间：2012.12.12
页码：67-70+74
分类：TP31[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京邮电大学通信与信息工程学院,江苏南京210003
相关基金：国家自然科学基金资助项目（60902065,61001152,61172118）;浙江省自然科学基金（Y1090649）;南京邮电大学引进人才基金（NY209004）
相关项目：高分辨率无序大尺度场景的多视图三维立体重建

作者：李燕萍|张玲华|

关键词：语音转换, 韵律, 多时间尺度, 高斯混合模型, voice conversion, prosody , multi-time scale, Gaussian mixture model

中文摘要：

为了提高转换语音的可懂度与自然度，文中在语音信号的特征抽取方面，注重对语音信号韵律特性的研究，提出了一种多时间尺度的韵律特性抽取方法及其参数化表示，基于逐级细化的策略实现语音信号在多时间尺度下的韵律特征分析与提取，实现对韵律特性从整体到局部细致完整地刻画，克服了韵律信息表述的模糊性和复杂性。实验结果表明，文中提出的语音转换系统在四种测试类型中性能良好，与现有的高斯混合模型相比，ABX测试结果提高了10．88％，同时MOS得分平均提高了18．59％。

英文摘要：

In order to improve the conversion speech intelligibility and natural degrees, based on speech signal feature extraction, pay great attention to the research of speech signal prosody characteristics, put forward a prosody characteristics extraction method based on multi- time scale and parameterized representation. Based on stepwise refinement strategy, achieve the implementation of prosodic feature extrac- tion on different time scales, which can enable detailed full description for prosodic information from global to local,overcome the ambi guity and complexity of prosody characterization. The experimental results show that the performance of proposed voice conversion sys tem in four test type is good,and compared with existing Gaussian mixture model,ABX test results increased by 10.88% ,and at the same time,MOS scoring average is improved by 18.59%.

同期刊论文项目

基于内容的流行音乐结构分析的研究

期刊论文 16 会议论文 5

高分辨率无序大尺度场景的多视图三维立体重建

期刊论文 30 会议论文 14 专利 2

基于概率图模型和语义描述的人群行为分析

期刊论文 28 会议论文 6

同项目期刊论文

基于线性生长的区域立体匹配算法研究

利用深度信息增强的自由视点DIBR技术研究

率失真优化和系数移位结合的ROI编码方法

Topic-Based Knowledge Transfer algorithm for Cross-view Action Recognition

基于视点质量一致性的多视点视频码率控制

一种基于局部可信视差的立体图像误码掩盖算法

基于Irrlicht引擎的草绘三维场景生成研究

人群行为分析研究进展

基于边界平滑性准则的立体图像误码掩盖算法

Efficient Rate Control Algorithm for Multi-view Video Coding

Action recognition from a different view

基于双语动态系统包的视角无关的人体行为识别方法

基于除法模型和核密度估计算法的镜头径向失真校正方法

一种结合遗传算法和LM算法的摄像机自标定方法

采用光照不变特征改进支持权重快速立体匹配

基于分层时序模型的步态识别算法

基于韦伯感知和导引滤波分层聚合快速立体图像匹配

多视点视频编码的码率控制优化算法(英文)

Robust and Efficient Network coding Against Pollution Attacks

Novel Reconstruction based Image Super Resolution

Novel Chinese Text Localization Method for Natural Images Through SVM Classification

自适应对称自回归模型的压缩图像内插方法

基于稀疏表征的双人交互行为识别

Collective Activity Recognition by Attribute-based Spatio-Temporal Descriptor

Group Detection in Complex Scene by Split-Merge Strategy

基于运动和外形度量的多目标行人跟踪

基于双语动态系统包的视角无关的人体行为识别

采用光照不变特征改进支持权重快速立体匹配

基于韦伯感知和导引滤波分层聚合快速立体图像匹配

基于非局部均值的彩色图像去噪

使用方向参数的双三次图像内插方法

Dynamic Global-Principal Component Analysis Sparse Representation for Distributed Compressive Video Sampling

基于稳态匹配概率的光照鲁棒立体匹配算法的研究

基于音乐情感特征提取的音乐检索分析

一种新型音符起始点检测算法

Note onset detection based on Gaussian kernel smoothing

基于压缩感知的分布式语音压缩与重构

基于自适应多尺度压缩感知的语音压缩与重构

基于熵的非参数估计的音乐声纹提取方法

基于关键段和小波包最优基的流行歌曲索引

基于CQT的音符起始点检测

基于古典音乐的Internet分组差错隐藏方案

基于ICT中间件的电信级网络传真运营系统

基于κ平面分段回归的音乐情感分类

基于UR-LDA的微博主题挖掘

基于匹配追踪的音符起始点检测

期刊信息

《计算机技术与发展》
中国科技核心期刊

主管单位:陕西省工业和信息化厅
主办单位:陕西省计算机学会
主编：王守智
地址：西安市雁塔路南段99号
邮编：710054
邮箱：ctad@vip.163.com
电话：029-85522163

国际标准刊号：ISSN：1673-629X
国内统一刊号：ISSN：61-1450/TP
邮发代号:52-127

获奖情况:
《CAJ-CD规范》执行优秀期刊

国内外数据库收录:
中国中国科技核心期刊

被引量:21263