当前位置：首页 > news >正文

Cancer Cell发表医学AI综述，聚焦于人工智能与转化癌症研究的交叉领域

news 来源：原创 2025/4/26 2:03:32

小罗碎碎念

这篇发表于Cancer Cell的综述聚焦于人工智能与转化癌症研究的交叉领域。在癌症研究中，多组学技术的发展产生了海量复杂数据，而AI在处理这些数据、推动研究进展方面发挥着关键作用。

文章详细阐述了AI在多组学分析中的计算方法，包括单细胞和空间组学分析以及整合多模态分析，还介绍了Transformer在癌症生物学中的应用，为从事医学AI研究的人员提供了全面的技术参考。

Figure 1. Artificial intelligence in multiomics analysis

从研究成果转化角度，AI助力下的多组学分析在转化癌症研究中成果丰硕。它推动了基础生物学发现，帮助识别癌症生物标志物、进行患者分层以及加速药物发现进程。

Figure 2. The role of AI in translational oncology

在临床应用方面，AI虽然在拓展精准肿瘤学和癌症诊断成像等领域取得了一定进展，但距离广泛且成熟的临床应用仍有距离，面临着诸多挑战。

Figure 3. Challenges and opportunities for AI in translational oncology

针对这些挑战，文章指出，AI在临床应用中面临可重复性、模型解释性、复杂性以及数据和方法标准化等问题。解决这些问题需要多方面努力，如进行严格的计算和实验验证、发展可解释性AI方法、采用知识蒸馏等技术简化模型，以及加强合作和制定标准化流程。

交流群

欢迎大家加入【医学AI】交流群，本群设立的初衷是提供交流平台，方便大家后续课题合作。

目前小罗全平台关注量61,000+，交流群总成员1400+，大部分来自国内外顶尖院校/医院，期待您的加入！！

由于近期入群推销人员较多，已开启入群验证，扫码添加我的联系方式，备注姓名-单位-科室/专业，即可邀您入群。

知识星球

对推文中的内容感兴趣，想深入探讨？在处理项目时遇到了问题，无人商量？加入小罗的知识星球，寻找科研道路上的伙伴吧！

一、文献概述

《New horizons at the interface of artificial intelligence and translational cancer research》由Josephine Yates和Eliezer M. Van Allen撰写。

文章探讨了人工智能（AI）在癌症多组学分析和转化研究中的应用、挑战与机遇，指出AI有潜力推动精准肿瘤学发展，但在临床整合等方面仍面临难题。

1-1：AI在癌症多组学分析中的计算方法

单细胞和空间组学分析

肿瘤异质性需单细胞和空间分析，AI可处理高维数据。

如scRNA-seq借助AI整合数据集、注释细胞类型等；空间转录组学利用AI识别细胞龛和细胞间相互作用，预测药物反应。

整合多模态分析

整合多组学能全面了解肿瘤发生过程。

GNN、VAE等模型可整合多组学数据，有助于推断基因调控网络。

Transformer基础模型可学习细胞表示，但在癌症研究中的实用性仍需探索。

1-2：计算多组学分析对转化癌症研究的影响

基础生物学发现

多组学分析借助AI揭示癌症异质性和细胞状态，推动对疾病机制的理解，为治疗提供方向。

生物标志物发现和患者分层

AI助力识别早期癌症和治疗反应的生物标志物，通过分析单细胞和空间数据，可进行患者分层，改善治疗决策。

药物发现

AI在计算机辅助药物发现中至关重要，通过基于靶点和表型的方法，加速新药研发。

1-3：AI在临床护理中的现状

拓展精准肿瘤学

精准肿瘤学依赖基因改变，多组学可发现更多生物标志物。

scRNA-seq工具潜力大，但多组学药物推荐模型仍在发展。

癌症诊断中的成像和计算病理学

AI成像技术在临床有应用成果，计算病理学中AI模型在癌症检测等任务表现良好，但AI在临床成像的实施面临监管等挑战。

1-4：挑战与应对策略

转化研究成果

单细胞和空间数据规模增加，但临床转化面临可重复性和验证问题，需进行计算、实验和临床验证，确保结果可靠。

提高可解释性

AI模型的黑箱性影响临床应用，XAI可提高透明度，但当前方法存在可靠性问题，需平衡准确性和可解释性。

简化模型

现有AI模型复杂，知识蒸馏和稀疏建模可简化模型，利用临床数据推断生物标志物，促进临床应用。

合作与标准化

AI在医学应用中需标准化分析协议和报告指南，加强合作，使用高质量数据集，确保模型可靠实用。

二、关键概念

2-1：生物学中基于人工智能的模型是什么？

人工智能与统计模型之间的区别仍是一个有争议的话题。

人工智能广义上是指执行通常与人类智能相关任务的工具，但这一定义存在模糊性。

例如，由于降维并非人类认知过程，像主成分分析（PCA）这类技术通常被视为统计方法而非人工智能方法。

然而，自编码器（AE）在某些条件下可被视为PCA的重新参数化形式，却常被归类为人工智能。

同样，分类是一项类似人类的任务，但Transformer被标记为人工智能，而逻辑回归则被视为统计模型。

统计方法和基于人工智能的方法可以相互补充，在某些情况下，更简单的统计模型可能优于深度学习方法。

2-2：生物学中常见的人工智能模型

神经网络（NN）：一种深度学习模型，由相互连接的节点构成，模仿大脑的处理方式来学习模式并近似函数。
变分自编码器（VAE）：一种概率生成式深度学习模型，将数据编码到潜在空间，同时强制形成结构化分布，实现高效采样和重构。在生物学中，常见的变体是条件变分自编码器（CVAE），它使潜在空间独立于特定条件变量，实现更可控的数据生成和分析。
图神经网络（GNN）：一种深度学习模型，通过迭代聚合和转换节点与边的特征来处理图结构数据，以学习表示形式。
卷积神经网络（CNN）：一种针对网格结构数据优化的深度学习模型，利用卷积层提取分层空间特征。
循环神经网络（RNN）：一种为处理序列数据而设计的深度学习模型，使用反馈连接捕捉时间依赖性和动态模式。
变换器与注意力机制：一种神经架构，利用自注意力机制并行处理序列，捕捉所有输入元素之间的上下文关系。注意力机制为输入组件分配权重，使模型能够动态聚焦于相关信息。
隐马尔可夫模型（HMM）：一种概率模型，用于表示具有可观测输出的序列，这些输出由根据马尔可夫过程演变的隐藏状态生成。
最优传输（OT）：一种数学框架，用于计算将一种概率测度重新分配为另一种概率测度的最高效方式，在传输计划上最小化成本函数。
强化学习（RL）：机器学习的一种范式，智能体通过与环境交互学习做出决策，基于反馈通过试错最大化累积奖励。
基于扩散的方法：利用信息或信号在图或网络中迭代传播的技术，使用随机游走或热扩散等机制推断缺失数据、改进表示形式或解决优化问题。

三、多组学分析中的人工智能

多组学分析整合来自细胞成分的数据，如基因组学、表观遗传学、转录组学、蛋白质组学和代谢组学，利用多种模态，包括整体、单细胞、空间和成像方法（如组织病理学）。

如本综述所强调，这种方法显著推动了癌症研究的关键领域，包括早期检测、生物标志物识别、患者分层、药物反应建模、药物发现以及人工智能驱动的诊断。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3-1：多组学（Multionics）及模态（Modalities）

多组学组成

包括基因组学（Genomics，以DNA双螺旋图标表示）、表观遗传学（Epigenetics ）、转录组学（Transcriptomics ）、蛋白质组学（Proteomics ）、代谢组学（Metabolomics ）。

这些组学从不同层面提供细胞分子信息，如基因组学研究基因序列，转录组学关注RNA转录情况等。

模态分类

涵盖整体（Bulk ）、单细胞（Single - cell ）、空间（Spatial ）和成像（Imaging，如组织病理学图像示例）等。

不同模态提供不同尺度和维度的数据，整体模态反映样本总体特征，单细胞模态聚焦单个细胞，空间模态强调细胞空间位置关系，成像模态提供直观图像信息。

3-2：应用领域

早期癌症检测（Early cancer detection）：借助人工智能整合多组学数据，捕捉早期癌症细微分子特征和影像变化，实现癌症早筛。
生物标志物发现和分层（Biomarker discovery and stratification）：分析多组学数据寻找与癌症发生、发展、预后相关生物标志物，并对患者分层，指导精准治疗。
药物反应预测和发现（Drug response prediction and discovery）：利用多组学和人工智能预测患者对药物反应，加速新药研发，筛选潜在药物靶点。
诊断（Diagnostics）：结合多组学数据和影像信息，通过人工智能算法辅助医生更准确诊断癌症。

四、人工智能在转化肿瘤学中的作用

人工智能正在变革癌症研究和治疗的多个方面。

在癌症早期检测中，人工智能驱动的单模态和多模态分析有助于发现促进早期诊断的生物标志物。

对于生物标志物的发现和分类，人工智能能够在日益庞大和复杂的数据集里识别共有的癌细胞状态，这需要先进的建模技术。

在药物反应预测与发现方面，人工智能通过优化基于靶点和基于表型的发现方法，加速药物研发，助力检测癌前病变和恶性肿瘤。

最后，人工智能通过整合分子和组织病理学数据增强癌症诊断，提高诊断准确性。

4-1：早期癌症检测

原理：利用人工智能对各类生物数据（如DNA、细胞分子特征等）进行单模态和多模态分析。通过挖掘这些数据，寻找与早期癌症相关的生物标志物。例如分析血液中游离DNA的特征、细胞表面蛋白表达变化等。
引用文献：列出了Carpenter等（2023）、Gehrung等（2021）等多篇相关研究文献，表明这些研究在该领域做出贡献。

4-2：生物标志物发现与患者分层

原理：处理多个数据集（Dataset₁、Dataset₃等），运用人工智能算法识别癌细胞的不同状态（State₁、State₂ ）。通过分析不同状态下的基因表达（g₁ - gₘ ）等分子特征，对患者进行分层，为精准治疗提供依据。
引用文献：包括Kleppe等（2022）、Helmink等（2020）等研究，体现不同研究在生物标志物挖掘和患者分层方面的成果。

4-3：药物反应预测与发现

原理：针对小分子药物（Small molecule ）和蛋白质靶点（Protein - Target ），利用人工智能模型预测药物反应。一方面通过分析药物与靶点结合的分子特征，另一方面研究药物对细胞表型的影响，优化药物研发过程，探索新的药物靶点和治疗方案。
引用文献：如Schneuing等（2022）、Popova等（2018）等研究，展示在药物研发各环节借助人工智能取得的进展。