首页 栏目首页 > 规模 > 正文

多模型融合预测IF:5.2 (26字)


(资料图)

2023年6月16日,美国学者在《Cancers (Basel)》(二区,IF=5.2)发表题为:Predicting Chemotherapy Benefit across Different Races in Early-Stage Breast Cancer Patients Using the Oncotype DX Score.的研究论文。 这项研究我们将随机森林生存模型应用于SEER-Oncotype队列数据。我们旨在研究 Oncotype DX评分预测化疗获益的最佳阈值及其种族差异 。结果表明, 我们确定了乳腺癌患者Oncotype DX复发评分测试的关键化疗敏感性阈值,并提供证据表明,某些患者可能从接受低于当前临床指南建议的阈值的化疗中获益。

摘要与主要结果

一、摘要

背景:Oncotype DX检测是一种多基因分子检测,已广泛用于乳腺癌复发风险分层和指导化疗。然而,Oncotype DX评分预测化疗获益的最佳阈值及其种族差异尚未被研究。

方法:在本研究中,我们将随机森林生存模型应用于SEER-Oncotype队列数据(乳腺癌患者的监测,流行病学和最终结果与Oncotype DX检测信息),并确定不同种族的早期,雌激素受体阳性(ER+)和HER2阴性(HER2-)患者的化疗获益阈值。 结果:我们的研究结果表明,早期ER+、HER2-和LN-/LN+患者可能从较低的Oncotype DX评分(复发评分,RS > 25或RS > 30)接受化疗中获益。根据我们模型估计的化疗敏感性阈值,目前可能因Oncotype DX检测结果而不推荐化疗的淋巴结阴性(LN-)患者的2.05-2.72倍和淋巴结阳性(LN+)患者的2.08-5.02倍实际上可能从化疗中获益。此外,我们的模型显示了化疗获益的种族差异:当早期ER+/LN-肿瘤患者的Oncotype DX评分分别大于19.9、37.2和18.0时,白人、黑人和亚洲女性从化疗获益。 结论:我们的研究提供了一种校准多基因分子测试的方法,以帮助指导种族和民族不同的癌症患者的治疗决策。具体来说,我们确定了乳腺癌患者Oncotype DX复发评分测试的关键化疗敏感性阈值,并提供证据表明,某些患者可能从接受低于当前临床指南建议的阈值的化疗中获益。 二、研究结果1.用线性Cox比例风险回归刻画重要临床参数在我们的早期、ER阳性(ER+)、HER2阴性(HER2−)淋巴结阴性(LN−)乳腺 癌症患者队列中,一个多变量Cox比例风险模型用于研究年龄、分期、分级、肿瘤亚型、 种族、肿瘤DX分级和化疗状态对乳腺癌特异性生存率(BCSS)的影响。风险比是从Cox系数中提取的,如图1A所示。高和中等癌型DX评分(与低癌型DX分数相比)、黑人(与白人相比)、低/中分化(与高分化)、II期(与I期相比)和年龄都表现出显著增加的风险比。亚裔(与白人相比)的风险比显著降低,而未分化/变性分级(与分化良好)和化疗状态没有显著影响。纳入Oncotype DX分类通过评估一致性指数提高了模型的准确性,一致性指数是预测得分之间等级相关性的衡量标准。在有肿瘤型DX评分的模型中,与没有肿瘤型DX的模型相比,一致性指数(CI)为0.77(CI=0.75)(补充图S2A)。然后,我们分析了患者队列中的肿瘤DX型评分数据。与白人和亚裔患者相比,黑人患者的DX型肿瘤评分具有统计学意义(p<0.01)(图1B)。与白人和亚裔患者相比,黑人患者的低癌型DX分类比例较低,高癌型DX分型比例较高(图1C)。患有高肿瘤DX型评分的黑人患者的比例为8.6%,而白人患者和亚裔患者的比例分别为6.3%和6.5%。此外,与白人(CI=0.78)和亚裔(CI=0.80)女性相比,黑人女性(CI=0.73)的肿瘤型DX评分显示出更差的预后价值(补充图S2B)。 2.肿瘤DX评分高的患者可能受益于化疗虽然Cox比例风险回归是捕捉和分析线性关系的有力工具,但该模型无法捕捉非线性关系。如图1A所示,当对所有患者进行分析时,接受化疗与生存获益无关,因为中型和高型肿瘤DX评分的风险比分别为2.09(95%CI:1.62-2.71)和4.42(95%CI:3.13–6.24)。缺乏益处可能是因为具有不利肿瘤特征的患者更有可能接受化疗。当按照DX型肿瘤分类对患者进行分层时,与DX型肿瘤中、低组患者相比,DX型肿瘤高组3178名患者的风险比较低(图2)。虽然在包括所有患者的队列和包括白人患者的队列中,所有组中的高肿瘤型DX评分亚组风险比都超过了1,但化疗的风险比从低到中等再到高逐渐降低。这种逐步模式在所有患者和白人患者队列中都有观察到,但在黑人或亚裔患者队列中没有观察到。 3.随机森林生存模型确定采用化疗的最佳肿瘤类型DX评分阈值接下来,我们使用Oncotype DX评分、患者种族、年龄和化疗状态建立了一个随机森林生存模型(见图S1),以模拟BCSS,并在我们的49443例I期/II期、ER+、HER2−、LN−乳腺癌症患者队列中捕捉非线性关系。基于拟合模型,我们为每个患者计算了两个风险评分,即risk.yes和risk.no,以分别指示患者接受化疗和未接受化疗时的预测BCSS。值得注意的是,在真实数据中,患者只能接受化疗或不接受化疗。然而,通过利用我们拟合的随机森林生存模型,我们可以通过重置处理变量(从是到否,反之亦然)来估计risk.yes和risk.no,同时保留所有其他变量。图3A–D显示了平均风险((risk.no+risk.yes)/2)和相对风险(risk.yes−risk.no)与肿瘤型DX评分的关系图。当平均风险线中的“无风险”线超过“有风险”线时,或者当相对风险线超过零时,患者从化疗中受益的阈值就会出现。队列之间存在定性差异,包括所有患者和按患者种族分层的队列。 为了量化这些差异并确定阈值的置信区间,我们通过随机选择70%的数据子集10次并确定该迭代的阈值来进行自举分析。对于包括所有患者在内的队列,确定接受化疗的预测益处超过接受化疗的预期风险的阈值出现在肿瘤DX评分中位数为22.47(IQR:22.40–22.99)的情况下(图3E)。分别对白人、黑人和亚裔患者重复分析,阈值分别出现在肿瘤学类型DX评分中位数为19.86(IQR:19.85–19.86)、37.24(IQR:37.05–37.52)和18.05(IQR:17.99–18.09)时,使用Wilcoxon符号秩检验,所有比较都是显著的(p<0.001)。根据我们的研究结果,与目前肿瘤类型DX评分建议应接受化疗的患者组(分别为RS>25和RS>30)相比,整个队列的患者可能从接受化疗中获益的人数增加了2.05-2.72倍,白人患者增加了2.07-4.27倍,黑人患者增加了0.42-1.93倍,亚裔患者增加了2.006-5.39倍(图3F)。 4.随机森林生存模型显示LN+患者的化疗益处在 SEER数据库中,9858名患者为I\/II期、ER+期、HER2-期和LN+期,肿瘤型DX评分,我们重复了上述随机森林模型生存分析,以确定肿瘤型DX得分是否有助于LN+患者队列中的化疗获益预测。该患者队列在使用Cox比例风险回归对任何一个肿瘤型DX组(图4A)进行化疗。此外,与白人患者相比,黑人患者的Oncotype DX评分在统计学上更高(p<0.01),但在黑人和亚裔患者或白人和亚裔患者之间没有观察到显著差异(图4B)。然后,我们使用肿瘤类型DX评分、患者种族、年龄和化疗状态建立了一个随机森林生存模型,以对BCSS进行建模,并捕捉该队列中的非线性关系。如上所述进行自举分析,该队列中所有患者的化疗获益阈值发生在肿瘤学DX评分中位数18.41(IQR:17.27-19.88)时,平均和相对风险图如图4C所示。基于这些结果,与RS>25的患者组相比,该队列中接受化疗的患者可能多2.08倍(图4D)。此外,当使用SEER数据库中用于定义高危患者的RS>30临界值时,该队列中可能有5.02倍以上的患者受益于接受化疗。

设计与统计学方法

一、研究设计P(Population)研究对象:监测、流行病学和最终结果(SEER)数据库的乳腺癌患者。 E(exposure)暴露因素:不同种族的早期,雌激素受体阳性(ER+),HER2阴性(HER2-),淋巴结阴性(LN-)和淋巴结阳性(LN+)患者。 O(Outcome)结局:乳腺癌患者化疗后的获益。 S(Study design)研究类型:队列研究 二、统计方法1 .所有分析均在R(版本4.2.2)中进行。从 单变量和多变量Cox比例风险回归模型中提取 一致性指数(C指数)。使用ggpubr R软件包(版本0.5.0)中的“compare_m均值”函数计算 Wilcoxon符号秩检验。使用随机选择70%原始数据的10次迭代的自举方法来确定化疗获益阈值置信区间,每次迭代的精确阈值使用R中的“优化”函数确定。使用 LOESS回归生成平均风险图和相对风险图,LOESS回归是一种使用多元回归预测局部y值的非参数方法。使用forestploter R软件包(版本1.0.0)生成森林图。 2.使用R生存(3.4.0版)和randomForestSRC(3.1.1版)软件包进行生存分析。使用“coxph”函数进行 单变量和多变量Cox比例风险回归,并从单变量和多元模型中提取肿瘤DX评分的风险比。利用“rfsrc”函数生成了1000棵树的 随机森林生存曲线模型;使用“predict.rfsrc”函数生成预测(补充图S1)。随机森林生存模型是一种非参数集成机器学习(ML)工具,由多个独立决策树(本研究中n=1000)构建,每棵树接收一个随机样本子集,然后在每个分支点随机选择一个变量子集进行预测。该模型做出的最终预测是每个单独树的预测的平均值。随机森林模型的使用绕过了对数据的基本分布施加约束(参数或非参数)的需要,从而允许随机森林生存模型处理变量中的高阶相互作用和高阶项,以提高预测精度。 一个专门做公共数据库的公众号,关注我们‍

关键词:

最近更新

关于本站 管理团队 版权申明 网站地图 联系合作 招聘信息

Copyright © 2005-2023 创投网 - www.xunjk.com All rights reserved
联系我们:39 60 29 14 2@qq.com
皖ICP备2022009963号-3