组织机构代码工作经过20多年的发展已经积累了上千万份档案,随着国家商事制度的改革,商事主体数量和规模日益增多,组织机构代码数字档案势必呈现爆发式增长,如何实现数字档案的管理,同时对档案内容进行深度挖掘,为国家、管理部门提供有价值的、具有决策性质的信息是需要重点考虑的问题。本文基于已有组织机构代码数字档案数据库工作,在大数据平台Hadoop上,使用Map Reduce程序实现对组织机构代码数字档案的数据库操作,并通过实验验证了相较于传统的关系型数据库Oracle,大数据在管理组织机构代码数字档案数据库中的优势;此外,本文根据组织机构代码数字档案的特点,在自然语言处理的基础上,提出了一种基于深度学习理论挖掘组织机构代码数字档案的技术方法。