慢性阻塞性肺疾病(COPD)病机复杂,目前尚无统一的证候分类及诊断标准。基于已完成的COPD急性加重期常见证候及特征,拟研究内容为①采用全国九家省级中医院为期2年调查的1768例COPD急性加重期患者资料所建立的数据库,运用关联规则、决策树及贝叶斯网络三种方法进行数据挖掘,分析COPD急性加重期症状间、症状与证候间的关联关系及组合规律,构建其关联模式,建立COPD急性加重期常见证候诊断标准。②使用关联规求得症状之间的关联关系,构建症状间关联模式。在此基础上运用决策树C4.5算法对症候进行分类学习,形成证候、症状决策树;最后按照决策树结构,形成贝叶斯网络图求得症状与证候间的关联关系,构建症状与证候间关联模式。构建COPD急性加重期症状间、症状与证候间关联模式为研究众多疾病证候诊断标准提供依据,同时关联规则、决策树、贝叶斯网络三种方法联合运用为构建症状间、症状与证候间关联模式提供方法学参考。
Association rules;Decision tree;Bayesian network;Syndrome;Chronic obstructive pulmonary disease
慢性阻塞性肺疾病(慢阻肺)病机复杂,目前尚缺统一且规范化的证候诊断标准。本项目在中医基础理论指导下,基于慢阻肺急性加重期常见证候(风寒束肺证、外寒内饮证、痰热壅肺证、痰湿阻肺证、痰蒙神窍证及血瘀证)及特征。运用IBM SPSS Modeler14.2软件,数据为既往开展的全国九家省级中医院为期2年调查所提供的1768份患者资料。通过数据转化等预处理,建立数据挖掘数据库;采用关联规则求得症状间的关联关系及症状对相应证候的贡献度;采用决策树构建症状及证候的规则集,并筛选出证候的所属症状,在此基础上采用贝叶斯网络构建症状与证候的因果关系,建立症状间、症状与证候间的关联模式,为修订完善以增强诊断标准的实用性与科学性奠定基础。关联规则运用Apriori模型,选取最小支持度为10%,最小置信度为80%,得到症状间的关联规则;分别把各个证候作为后项,相应的症状群作为前项,设置最小支持度为10%,置信度为100%,得到症状组对证候的支持度。如风寒束肺证有3516条规则,当提升度大于1时,筛选出2947条。关联规则如下咳嗽和喘息的支持度及置信度均是最高(80%以上),提升度为1.007;发热、恶寒与无汗有3条规则,支持度范围49.18%~62.2965%,置信度中恶寒 and 无汗T发热的置信度最低(74.671%);恶寒、发热、无汗与肢体酸痛有4条规则,任意三项作为前项,而另外一项作为后项的支持度范围44%~47%,置信度90%以上;鼻塞、涕清稀有2条规则,支持度为43.238%、55.123%,置信度为80.297%、88.152%;脉浮、脉浮紧的支持度为43.238%、45.287%,置信度为84.163%、88.152%。症状组对风寒束肺证的支持度咳嗽、喘息最高(83.197%);其次是发热、肢体酸痛、无汗、恶寒(43.443%~50.615%);鼻塞、流清涕为34.262%。 决策树运用C5.0算法得到6个证候的规则集及树形图。如血瘀证有4条规则,即口唇青紫;无口唇青紫,舌有瘀斑;无口唇青紫,无舌有瘀斑,舌下静脉迂曲粗乱;无口唇青紫,无舌有瘀斑,无舌下静脉迂曲粗乱,舌质紫暗。贝叶斯网络采用TAN模型及马尔科夫毯模型得到6个证候的有向无环图及条件概率表,筛选出症状与证候的因果关系。如通过马尔科夫毯得到痰蒙神窍证的症状组成为神志异常或肢体瘛疭甚则抽搐。