2.3 简化模型的建立与验证 以完整模型中意义较大的6个蛋白质峰作为预测变量,构建简化血清诊断模型,ROC曲线下面积为0.948,预测准确率为94.00%(94/100),灵敏度为88.24%(30/34),特异度为96.97%(64/66),阳性预测值为93.75%(30/32),阴性预测值为94.12%(64/68)。以测试集数据验证模型,ROC曲线下面积、预测准确率、灵敏度、特异度、阳性预测值及阴性预测值分别为0.865、93.75%(60/64)、81.82%(18/22)、100.00%(42/42)、100.00%(18/18)和91.30%(42/46)。病例与对照在简化决策树模型中的分组情况见图1。
2.4 完整模型与简化模型预测准确率、灵敏度及特异度比较 完整模型与简化模型之间预测准确率(95.00% vs 94.00%)、灵敏度(100.00% vs 88.24%)及特异度(92.42% vs 96.97%)经检验,χ2值分别为0.756、2.391和0.603,P值分别为0.756、0.122和0.437,差异均无统计学意义。
图1 简化决策树模型中病例与对照的分布(略)
Figure 1 Distribution of cases and controls in the model
3 讨论
VSD是最常见的CHD类型(广西VSD占CHD的41.52%[1]),尽管现有的影像学诊断方法,对VSD的识别都具有较高的灵敏度及特异度,但不便用于筛查,不能从人群中快速筛检出VSD患儿并对其早期干预。而血清中所包含的大量的、可作为疾病标志物的蛋白质或多肽[2,3],以及被视为各种疾病血清蛋白质组学研究及发展疾病血清学诊断技术的重要工具[4]的SELDITOFMS技术的日益完善,为发展VSD的血清学诊断技术提供了条件。
本研究采用病例对照研究的方法,利用SELDITOFMS技术获取VSD患儿与非VSD患儿(儿科常见病患儿及其他CHD患儿)的血清蛋白质谱,并以筛选出的血清差异蛋白为预测变量,构建血清诊断模型,分析模型区分病例与对照的能力,探讨利用血清蛋白质谱诊断VSD的价值,探索发展一种简单有效的血清学诊断方法的可能性。
血清诊断模型分为完整模型和简化模型,前者以所有有差异的蛋白质峰作为预测变量,评价各变量在模型中的意义,为建立简化模型打基础;后者以完整模型中意义较大的几个蛋白质峰作为预测变量,突出诊断模型的实用性。这一方面是由于生命的复杂性,单一标志往往无法区分样本人群,需要一个多标志的复杂模型[5];另一方面考虑到临床应用的可行性,模型中不可包含过多变量。从所构建模型的结果来看,完整模型各项指标中阳性预测值最低,为87.18%,灵敏度和阴性预测值均达到100.00%;简化模型中各项指标也在88.24%~96.97%之间,且完整模型与简化模型的主要诊断指标(预测准确率、灵敏度及特异度)均无统计学差异(P>0.05),简化模型可以替代完整模型。对简化模型的验证结果也比较理想,各项诊断指标在81.82%~100.00%之间,说明其准确性和可靠性高,能够较好地将VSD患儿与非VSD患儿区分开来,具有一定的发展和应用前景。
为了保证所建诊断模型具有较高的质量,笔者等在研究设计、实验操作、数据处理及建模等整个过程中采取了严格而全面的质量控制。所有研究对象均经过彩色超声心动图检查;从多家医院选取研究对象;以儿科常见疾病和其他CHD患儿作为对照,排除疾病炎性反应的干扰[6]并避免试验准确度被过高估计[7];保持实验过程中操作的一致性;所有数据经过统一校正、去除基线噪音及标化,并弃去0~2 000 Da的数据,避免各种可能因素的干扰[8];分层随机抽样的方法抽取蛋白质质谱原始数据形成训练集和测试集,降低选择性偏倚。但由于条件所限,本研究只选择了1种较为常用的弱阳离子蛋白质芯片检测病例与对照的血清蛋白质谱,且所构建的血清诊断模型的稳定性还需进一步验证,这些不足之处有待于在后续研究中予以完善。
【参考文献】
[1] 仇小强,覃益敏,谢晓宇,等. 1 286例先天性心脏病患儿致病因素的调查研究 [J]. 同济医科大学学报, 1999,28(5):399401.
[2] Liotta LA, Ferrari M, Petricoin E. Clinical Proteomice: Written in blood [J]. Nature, 2003,425(6961):905.
[3] Thadikkaran L, Siegenthaler MA, Crettaz D, et al. Recent advances in bloodrelated proteomics [J]. Proteomics, 2005,5(12):30193034.
[4] Bons JA, Wodzig WK, van DieijenVisser MP. Protein profiling as a diagnostic tool in clinical chemistry: a review [J]. Clin Chem Lab Med, 2005,43(12):12811290.
[5] Seibert V, Wiesner A, Buschmann T, et al. Surfaceenhanced laser desorption ionization timeofflight mass spectrometry (SELDI TOFMS) and ProteinChip technology in proteomics research [J]. Pathol Res Pract, 2004,200(2):8394.
[6] Seibert V, Ebert MP and Buschmann T. Advances in clinical cancer proteomics: SELDIToFmass spectrometry and biomarker discovery [J]. Brief Funct Genomic Proteomic, 2005,4(1):1626.
[7] Zhou X, Obuchowski NA, Mcclish DK. Statistical methods in diagnostic medicine [M]. New York: Wiley, 2002.
[8] Malyarenko DI, Cooke WE, Adam BL, et al. Enhancement of sensitivity and resolution of surfaceenhanced laser desorption/ionization timeofflight mass spectrometric records for serum peptides using timeseries analysis techniques [J]. Clin Chem, 2005,51(1):6574.