large-scale unnormal knowledge base natural
在本项目中,主要研究以下三个方面 (1)有关非规范知识的6个要素概念、汉语词语(表示概念的)、指称对象、内涵定义特征、关系(包括概念、词语各自间的)以及概念及汉语词语之间的对应关系及其计算理论;探索用汉语表示的知识概念的自动组合和自动释义的构造原理及计算理论,从而研究自然语言处理和非规范知识处理的关系,开发和完善基于自然语言语义理论的非规范知识处理技术,有效地为语义网和通用网上编辑器的建设提供必要的理论成果和和算法。 (2)研究大规模网页文本知识获取方法。主要是获取领域概念及其上下位、部分关系、地理位置关系、同称关系等特殊关系,自动建立概念语义空间。同时根据特定学科,获取该学科中概念的属性值(主要以生物学为例)。 (3)研究常识知识获取和组织方法。主要集中在有关人的常识方面,包括心理常识、生理常识和行为常识等。项目在这三个方面都取得了大量的成果,例如完善了知识模型管理系统,概念关系的验证方法研究、增补了社会角色中的内容,完成了"智能语音对话系统"的专利使用权转让工作等,且这些工作均被国内期刊、国际期刊和国际会议所录用。