为提取较为完备的蒙古人名特征,以内蒙古大学语料库及网页人名句为基础,采用量化分析的方法,建立普通人名知识库及兼类人名知识库,将知识库归并为14个特征,进行特征选择实验,在直接保留"汉语姓氏映射表"及"汉语人名映射表"等特征集后,鉴于对正确率和召回率的贡献,去除了地名词典、地名后缀词典、机构名后缀词典等3个特征集,保留了9个作为最大熵模型的特征集,从实验结果看,予以保留的特征影响并不相同。