语义分析涵盖词、短语、小句、句、句群、段落、篇章等不同层次,现有研究受限于词义层且其理论基础极为薄弱。申请人期望在词义区分、词义知识表示与获取(资源建设)、词义消歧的整体方案下有效化解这一难题与困境。本项目的研究依据"使用即意义"原则和"经验主义"方法,提出新的词义区分理论,将词义区分视为目标词的搭配环境的聚类问题;提出新的"高层概念树+词义多元组"的词义知识表示框架,高层概念树表达粗粒度词义的聚合关系,词义多元组以词义区分为基础、表达任一词义的组合关系;提出新的词义消歧模型,即,与聚合关系相关的段落-篇章层消歧结合与组合关系相关的句子层消歧,增强消歧的理据性和计算性。上述理论与模型作为原始创新思路,建立在坚实的计算语言学(搭配是最简单、最易抽取的语言成分)、应用数学(聚类方法趋于成熟)基础上,建立同源知识做一体化处理,可行性强,有助于促进词义问题的规范化与标准化。