随着网络用户数目的增长和网络信息的增多,对网络信息内容的有效利用是一项迫切而又长期的需求,在这种需求驱动下,包括搜索引擎在内的内容处理应用都表现出了重要的市场价值,然而离用户真正有效利用网络信息还有较大差距。造成这种差距的一个最根本原因在于,作为它们的核心的文本检索技术遇到严重的鲁棒性问题现有的文本检索模型,面对不同的查询、使用不同的模型或参数、在不同的文档集合上表现出较大的缺乏理论解释的性能差异。本课题致力于探索造成这些差异的原因以及合适的解决办法。在对已有模型鲁棒性的分析基础上,课题从查询和模型两个角度进行研究,一方面从查询分析和重构入手,另一方面从理论上探求可解释的更鲁棒的信息检索模型。本课题的研究面对的是信息检索的核心问题,具有重要的研究价值,也具有广阔的应用前景。
英文主题词Information Retrieval; Text Retrieval Model; Robustness