本研究将近期脑认知的实验结果引入到特征提取和文本分类中,探讨相应的适合于汉语文本分类的有效特征集,利用训练专家知识库方法进行主题概念的统计,由此提出主题概念的抽取算法和层次树的构造,将分类方法从词语层面提高到语义层面,通过机器学习改善文本特征的性能,使其所得到的上下文相关概念和语义特征更符合人的思维方式。基于人的认知过程是通过"学习-实践-再学习-再实践"有监督的主动学习模式来认识客观的事实,将自组织学习与反馈学习策略引入到文本分类中,把分类系统扩展为"训练-分类-反馈学习"的模式,由异构神经网络通过无监督和有监督的学习完成,自组织映射网络通过竞争与合作的无监督学习,将概念语义特征进行自组织学习来获得输入数据之间的规律性和相互关系,然后通过有监督的反馈学习调整分类模型的参数,从而提高系统的分类性能,为语言信息处理提供神经网络的生物学模型。