基于认知机理和语义层次的文本分类方法研究-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

基于认知机理和语义层次的文本分类方法研究

项目名称：基于认知机理和语义层次的文本分类方法研究
项目类别：面上项目
批准号：60673109
申请代码：F020509
项目来源：国家自然科学基金
研究期限：2007-01-01-2009-12-31

项目负责人：江铭虎
负责人职称：教授
依托单位：清华大学
批准年度：2006

中文摘要：

本研究将近期脑认知的实验结果引入到特征提取和文本分类中，探讨相应的适合于汉语文本分类的有效特征集，利用训练专家知识库方法进行主题概念的统计，由此提出主题概念的抽取算法和层次树的构造，将分类方法从词语层面提高到语义层面，通过机器学习改善文本特征的性能，使其所得到的上下文相关概念和语义特征更符合人的思维方式。基于人的认知过程是通过"学习－实践－再学习－再实践"有监督的主动学习模式来认识客观的事实，将自组织学习与反馈学习策略引入到文本分类中，把分类系统扩展为"训练－分类－反馈学习"的模式，由异构神经网络通过无监督和有监督的学习完成，自组织映射网络通过竞争与合作的无监督学习，将概念语义特征进行自组织学习来获得输入数据之间的规律性和相互关系，然后通过有监督的反馈学习调整分类模型的参数，从而提高系统的分类性能，为语言信息处理提供神经网络的生物学模型。

中文主题词：文本分类;神经网络;认知机理;语义特征;

成果综合统计