本课题针对案例跨媒体数据的类型多样性、语义相关性,以面向学术领域的案例为研究对象,研究了案例库的构建、形式化表示与使用,文本与图像数据的特征提取、组织和存储技术,提出了集低级物理特征和高级语义特征于一体的M2+-树索引技术,支持IR和DBIR关键字检索的扩展倒排索引技术,基于案例主题词条不确定性的概率聚类技术,面向用户意图识别的用户兴趣建模技术,支持用户意图识别及个性化推荐的基于案例频繁闭词序列集的层次聚类技术,案例实例间关联关系的可视化技术,以及支持视听高维数据有效查询的假活动空间过滤技术等,并拓展性地探索了分布式异构案例数据源的多模式集成与模式匹配问题。事实证明,本项目的研发工作是正确的,上述技术的提出对于跨媒体信息检索有着重要的理论研究意义和实际推广使用价值。
英文主题词case; cross-media data; information retrieval; index; clustering