知识表示是研究知识从自然记载形式过渡到适合计算机处理的表示形式,并在此基础上实现对知识的处理。基于知识元的中医古籍计算机知识表示方法,目标是建立一种深入文献内部的知识组织方法,为数字化时代的中医古籍文献整理研究开辟一条新路,创立一套新方法与新技术。项目申请人柳长华教授在主持国家中医药管理局"中医药古代文献数字化关键问题研究"课题中,在深入分析中医古文献知识结构、内容特点的基础上,提出了构建"基于知识元的中医古籍知识表示方法"的构想。该方法包括了知识元、知识体、语义成分等一系列赋予全新内涵的概念以及以此为基础构建的中医古籍知识表示体系。近年来,该方法在中医古籍知识库建设中得到尝试应用,预示出良好的应用前景。本项目拟通过理论分析和实验检测,研究建立基于知识元的中医古籍计算机知识表示方法体系,解决建设结构化中医古籍知识库中的关键技术问题,从而为探索中医古籍知识发现新技术提供基础。
Knowledge Unit;Knowledge Representation;Digitalization of TCM ABs;Knowledge Base;Standard and Specification
中医古籍是中医学全部知识的主要载体,通过传统的古籍整理的方法,历代学者源源不断地从中医古籍中汲取知识,使中医学得以传承发展。信息化时代,古籍数字化相关理论与技术的应用,推动了传统古籍整理工作的变革,促进了中医知识的管理水平和应用效率。这一目标的实现,依赖于对古籍自然文本进行标引,标引工作的顺利开展,必须要有与中医古籍领域知识相适应的知识表示方法的理论作为指导。本项目通过理论分析和实验论证,研究建立基于知识元的中医古籍计算机知识表示方法体系,解决建设结构化中医古籍知识库中的关键技术问题,从而为探索中医古籍知识发现新技术提供基础。(一)本研究综合运用中医学、文献学、计算机与信息科学、语义学等理论与方法,深入研究分析了中医古籍知识的特点,在此基础上构建了以“知识元”为核心的知识表示方法理论体系。该理论体系包括①论述了知识元、知识体、语义成分、中医古籍元数据等核心概念的定义、实体构成、特性分析、知识分类等;②从以知识体为单元的知识组织结构和以语义关联为核心的知识语义网络两个角度全面阐释了理论构架,其中包括对知识元和知识体的结构化定义;③追溯了理论产生的渊源与基础。(二)本研究过程中,制定了一系列指导古籍数字化建设的技术标准及规范,同时还根据中医古籍知识分类体系,结合古籍标引实践,编制了针对各类古籍知识的标引手册。 ①技术标准及规范(5种),分别为《中医古籍数字化文本校勘整理规范》、《中医古籍疑难字处理规范》、《中医古籍图像采集管理规范》、《中医古籍元数据规范》、《中医古籍数字化工作质量控制规范》;②标引手册(4种),分别为《本草知识标引手册》、《方剂知识标引手册》、《病证知识标引手册》、《医案知识标引手册》。(三)本研究给出了可行的中医古籍知识库建设方案,并完成了一定规模的中医古籍数字化建设工作。 ①研发古籍数字化建设的加工软件(2个),分别为“中医古籍标引系统”(已获软件著作权登记)、“叙词表自动生成与知识网络构建系统”;②研发数字化成果展示与知识共享系统(1个)“神黄百科”。 “基于知识元的中医古籍计算机知识表示理论”指导下的中医古籍标引工作,将记载于古籍中的、体现在字里行间的中医学理论与经验,按照各类知识的模型分别进行重新的结构化和逻辑化,使之成为可以借助于计算机进行管理的科学数据,为中医知识的高效利用以及知识发现奠定了基础。