位置:立项数据库 > 立项详情页
基于Web的音频识别与检索关键技术研究
  • 项目名称:基于Web的音频识别与检索关键技术研究
  • 项目类别:面上项目
  • 批准号:60673100
  • 申请代码:F020508
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2009-12-31
  • 项目负责人:周明全
  • 负责人职称:教授
  • 依托单位:北京师范大学
  • 批准年度:2006
中文摘要:

将音频信号处理技术和机器学习、降维技术有机结合,研究网络环境下海量的基于内容音频信息的识别检索关键技术。包括方法与实现两部分将小波分析、支持向量机和组合分类器等数据挖掘前沿算法应用于音频信号的分类,建立音频信号分类体系;音频指纹表征音频内容,研究指纹的识别特性,提取音频特征建立特征向量,建立音频指纹模型;针对"维数灾难",将流形学习理论引入音频信号高维数据特征的处理,建立高维数据到低维空间的映射;建立特征值向量空间模型,通过反馈结果、学习机制、相似度度量,研究相似度匹配新算法,利用降维和索引加快匹配速度;以适应大规模音频数据的检索要求。基于音频检索新技术,利用智能学习机制,建立音乐检索的原型系统设计良好的智能用户接口,提供哼唱、歌唱、音符、曲谱等多模式检索新模式。嵌入基于内容的音频检索实现新技术,将有力的推动国产音响录放设备的创新服务,研究意义重大,应用前景广阔。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 31
  • 10
  • 0
  • 0
  • 0
相关项目
期刊论文 16 会议论文 9 专利 6 著作 1
期刊论文 7 会议论文 4
周明全的项目
期刊论文 77 会议论文 28 获奖 4 著作 4