申请人为美国宾夕法尼亚大学医学院临床流行病学和生物统计系终身教授,在用于高维关联数据分析的统计方法的研究上具有世界领先地位。除了在非参数函数数据分析和非稳态时间序列分析上具有很高的知名度外,还在统计计算,含有缺失元的纵向分析和降维研究上作出过突出贡献。在观察实验中,感兴趣的因素对结果的作用往往会受干扰变量的影响,当干扰变量的维数很高时,如何通过降维的方式消除其对统计推断的影响一直是国际统计界关心的问题。近年来遗传学的研究中采用了很多观察实验,其中干扰变量的数目极大,发展一套通过降维方式消除干扰变量的偏差对于遗传学的研究意义重大。而现有的方法非常简陋并且建立在许多假设之上。申请人提出一种非参数方法,在降维的同时,保留了感兴趣的信息。同时提出了一种渐近的推断检测治疗效果的方法。现正在与复旦大学金力教授合作开发一系列控制干扰变量的降维方法,并将其应用到泰州人群大型队列的数据分析之中。
Confounding Variables;Sufficient Dimension Reduction;Nonparametric Analysis;Traditional Chinese Herbal Med;Chromatographic Fingerprinting
在观察实验中,感兴趣的因素对结果的作用往往会受干扰变量的影响,当干扰变量的维数很高时,如何通过降维的方式消除其对统计推断的影响一直是国际统计界关心的问题。近年来遗传学的研究中采用了很多观察实验,其中干扰变量的数目极大,发展一套通过降维方式消除干扰变量的偏差的方法对于遗传学研究的意义重大。本研究建立了一种非参数的方法,结合现今比较流行的充分降维方法,将干扰变量投影到响应变量及有效变量所张成的空间中,计算消除了干扰因素对统计推断的影响。这种方法在对混淆因素进行降维的同时保留了所研究变量对输出结果影响。另一方面,在中药成分分析中,如何高效的提取出其中的有效成分一直是中药研究中的热点问题。本研究提出了一直通过提取共有成分分析中药有效成分的分析方法:通过建立不同产地品系的中药样品的高效液相指纹图谱,定位其中的峰值点,利用峰值点坐标及指纹图谱数据的精确性建立窗宽模型,通过计算峰值点的显著性提取其中的共有成分。这种中药有效成分分析方法有广泛的适用性,为以后的中药有效成分分析提供了一套标准的分析流程。