位置:立项数据库 > 立项详情页
生命健保数据的统计质量控制的若干研究
  • 项目名称:生命健保数据的统计质量控制的若干研究
  • 项目类别:青年科学基金项目
  • 批准号:11101306
  • 申请代码:A0111
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2014-12-31
  • 项目负责人:訾雪旻
  • 依托单位:天津职业技术师范大学
  • 批准年度:2011
中文摘要:

近年来国际上在线监控生命数据,尤其是基因表达数据的质量监控问题日益得到重视。本项目的研究目标是发展一套适用于各种复杂的生命科学实验的数据质量监控与诊断的新方法、新理论及软件或程序包。本课题围绕生命科学中各种复杂数据的过程控制方法,集中研究如下五方面的内容(1)复杂高维数据的统计过程监控及诊断提出一能够自动识别超高维数据飘移方向并快速有效实施的序贯检验诊断方法;提出一具有稀疏性质的充分数据降维方法,与多元检验及EWMA平滑方法相结合,显著地提高传统基于PCA多元控制方法的检测和诊断效率;(2)超高维微点阵数据的异常点检验和变点探查,拟提出一基于支撑向量机的检验,并与SPC Phase I的常用算法相结合,提供一该问题的完整解决方案;(3)微点阵试验的多阶段过程建模及其监控和诊断;(4)生命数据的Profile建模及SPC方法;(5)综合图像处理和序贯检验的基因表达数据的SPC解决方案。

结论摘要:

项目生命健保数据的统计质量控制主要在如下方面取得了很大进展 1. 针对复杂profile数据设计有效的控制图,我们提出了一个基于多元符号EWMA控制图用于监控一般线性模型的非参数控制图,该方法其在过程分布为厚尾或偏斜分布的情况下具有明显的优势,尤其是维数较高时; 2. 我们提出了一种新的非参数统计过程控制图监控参数向量,结合带有方向性的多元空间符号检验和指数加权移动平均控制图进行在线监控; 3. 针对设计稳健的非参数函数估计和检验方法问题,我们提出了一种与分布无关的控制图,方法的可行之处在于利用了概率控制限,这种控制限设计与时间有关并由数据驱动;我们提出了一种全新的非参极大似然方法检验多变点问题,变点个数由BIC确定,同时利用动态算法以及利用似然函数固有的秩结构估计变点位置。在一般条件下,新方法以最优速率给出了一致估计; 4. 关于某种疾病率是否发生变化的监控问题,我们提出了指数加权移动似然(损失)的概念,且证明了相应参数估计的Wills定理,并由此构建了统一的EWMA架构,解决了变化样本量的疾病发生率的监控问题; 5.在多阶段数据的统计过程控制方面,我们结合BIC 和自适应LASSO变量选择的方法给出了对于二元相应变量统计过程控制的诊断方法; 6.我们在非正规设计广义最小低阶混杂准则的基础上,给出了一种方法在非正规设计中寻找整区部分和子区部分,并通过计算机搜索得到了水平组合为12,16,20以及24的两水平最优裂区因析设计。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 37
  • 1
  • 0
  • 0
  • 0
相关项目
期刊论文 3 会议论文 5 获奖 1 著作 1
期刊论文 17 会议论文 6
訾雪旻的项目