科学家利用机器学习方法解开临床癌症样本中的基因组密码

来源 :科技部生物中心 访问次数 : 发布时间 :2022-11-07

分析癌症基因组中的突变过程有助于在早期发现和准确诊断癌症,并可以揭示某些癌症患者对治疗产生耐药性的原因。

临床癌症样本是一个巨大的资源,可以为分子诊断技术提供更全面的支持,使特定的癌症患者与适合的癌症疗法相匹配,从而达到最好的治疗效果。然而,由于临床癌症样本中的DNA质量较差(如福尔马林会对DNA造成严重损伤),导致这一宝贵的信息资源目前无法用于分子诊断。因此,分析临床组织中癌症基因组遇到了不可避免的挑战。

近日,发表在《Nature Communications》上的一项新研究中,来自赫尔辛基大学的研究团队提出了一种准确分析癌症活检中基因组学数据的方法。该工具使用机器学习方法纠正了受损DNA,从而揭示出肿瘤样本中的真实突变过程。该研究有助于在数百万个癌症样本中发掘巨大的医学价值。

癌症是渐进式发展的。分析纵向样本中的突变过程有助于识别临床信息预测因子,并对每个肿瘤阶段进行诊断。在这项新研究中,该团队开发了名为FFPEsig的机器学习方法。FFPEsig可以准确揭示福尔马林如何使DNA突变。实验显示,正常情况下,如果不进行噪声消除,几乎一半的癌症过程将被忽略。然而,使用FFPEsig,90%以上的癌症过程能够被准确预测。

FFPEsig使研究人员可以从在室温下保存了几十年的肿瘤活检标本中鉴定临床相关的特征。随着对福尔马林如何影响癌症基因组的深入了解,该研究为利用成本效益高的大型存档样本转化已确认的特征检测分析提供了巨大的机会。

研究人员指出,FFPEsig目前还不能完全消除表现出批次效应的FFPE样本中出现的人为影响,并且其性能因癌症类型而异,因此必须对任何发现进行谨慎解读。不过该团队表示,这种新方法显著加快了临床应用的发展,或将直接影响未来癌症患者的治疗结果。他们还将进一步优化该方法,并将其应用于更广泛的样本。

论文链接:

https://www.nature.com/articles/s41467-022-32041-5

注:此研究结果摘自《Nature Communications》,文章内容不代表本网站观点和立场,仅供参考。