位置:立项数据库 > 立项详情页
基于压缩域听觉谱的音频分类与检索算法研究
  • 项目名称:基于压缩域听觉谱的音频分类与检索算法研究
  • 项目类别:面上项目
  • 批准号:60872115
  • 申请代码:F010302
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:余小清
  • 负责人职称:副教授
  • 依托单位:上海大学
  • 批准年度:2008
中文摘要:

随着计算机处理能力提高、互联网发展和人们对音频信息需求量的增加,如何利用有效的方法对海量压缩格式音频数据进行快速、精确的分类检索引起了广大研究者的关注。项目组通过三年多研究和探索,系统构建了MP3压缩域听觉谱数学模型CASM,提出了一种仿人耳对音频信息处理的预处理机制,并基于MP3压缩域听觉谱进行了特征选择,利用基于熵的相似度度量方法研究了不确定性推理过程对音频分类和检索的影响,利用熵的方法对相似度进行了评价,利用模糊-粗糙近邻算法(FRNNC)对音频进行了分类,建立了快速精确的检索方法,得到了较好的实验结果,其方法不仅简化了压缩域音频分类检索的流程,同时也为在海量压缩音频数据中提取具有良好鲁棒性的压缩域音频特征提供了新的思路。项目组共获得发明专利1项,申请发明专利5项,发表论文48 篇,其中国际学术期刊7篇,SCI收录5篇,ISTP检索3篇,EI检索41篇,并多次参与国内外合作交流。

结论摘要:

英文主题词Compressed domain, the auditory spectrum, feature extraction, classification and retrieval


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 17
  • 37
  • 5
  • 0
  • 0
会议论文
相关项目
期刊论文 23 会议论文 3 获奖 1 专利 3
期刊论文 18 会议论文 10 专利 3 著作 1
余小清的项目