本项目针对当前大规模信息检索和搜索技术中普遍存在的用户查询语义分散和多样化的趋势及其技术挑战,通过采用原创性的新型信息检索模型(称为"二次检索模型"),并广泛利用自然语言处理、语料库统计、语义知识库的近期成果,研究和实现面向复杂文档集和多义检索查询的新型文本检索技术。项目的特色在于创新性地提出了利用二次检索模型获得用户查询的各个导出查询、用多个导出查询表示用户查询的多种语义,并针对每种查询的语义构造独立的搜索结果和完善的搜索结果排序方法。一方面,二次检索模型和导出查询的检索和排序本身具有很好的理论研究价值,为进一步发展IR的理论模型研究提出了新的课题与途径;另一方面,本研究成果可改善当前信息检索和搜索应用的技术效果,提高各类信息检索、文档管理和搜索引擎系统在应对多义查询的相关技术水平,并增强自身在国际信息检索研究领域与中文处理技术领域的原始创新性和自主知识产权。