#最新
超过 GPT-4V，哈佛医学院 AI 聊天机器人登上 Nature，肿瘤识别率接近 90%

智库(路路) AIGC专题

2024-07-09 0 8,585

WHO 表示，1/3 的癌症可以通过早发现、早治疗得以治愈。

当前，癌症已经成为全球人口死亡的主要原因之一，每年有数百万人死于癌症。世界卫生组织曾提出，三分之一的癌症可以通过早发现、早治疗得以治愈。

然而，癌症检查一直是医疗领域面临的一大难题，尤其在病理学分析中，精确识别和诊断肿瘤对于患者的治疗至关重要，但传统的病理检查在很大程度上依赖于专家的经验和专业知识。

随着 GPT-4 等大模型的发展，利用人工智能（AI）辅助病理诊断的研究逐渐兴起，但许多 AI 系统在实际应用中仍然存在性能不足和交互性差的问题。

近日，来自来自哈佛医学院的研究团队及其合作者开发了一个用于人类病理学的视觉语言通用 AI 助手——PathChat。该系统能够在近 90% 的情况下从活检切片中正确识别疾病，其表现优于 GPT-4V 等目前市面上的通用 AI 模型和专业医疗模型。

相关研究论文以 “A Multimodal Generative AI Copilot for Human Pathology” 为题，已发表在科学期刊 Nature 上。

超过 GPT-4V，哈佛医学院 AI 聊天机器人登上 Nature，肿瘤识别率接近 90%

值得注意的是，这一突破性技术不仅能够识别肿瘤，还能与用户进行互动交流，为病理学的诊断和研究提供了新的工具和视角。

01 PathChat：多模态病理检测 AI 助手

多年来，计算病理学在病理形态数据分析、分子检测数据分析等领域取得了长足进步，这一由病理学与 AI、计算机视觉等技术交叉形成的细分研究领域正逐渐成为医学图像分析领域的研究热点。

计算病理学是利用图像处理与 AI 技术构建 AI 计算病理模型，获取组织病理学图像，并对组织病理学图像形态外观进行初步评估，以实现通过自动图像分析技术辅助诊断、定量评估及决策。

目前，随着以 ChatGPT 为代表的生成式 AI 技术爆炸式增长，多模态大语言模型（MLLM）越来越多地应用于计算病理学研究和病理学临床实践中。但在专业度较高的解剖病理学子领域，针对病理学构建通用、多模态 AI 助手的研究仍处于初级阶段。

在这项工作中，研究团队设计了一款专门用于人类病理学研究的多模态生成式 AI 助手——PathChat。他们通过自我监督学习对来自 100 万多张切片的 1 亿多个细胞组织图像片段进行预训练，并与一种 SOTA 纯视觉编码器 UNI 相结合，生成一个能对视觉和自然语言输入进行推理的 MLLM，在对 45 万多条指令数据集进行微调后，构建出了 PathChat。

超过 GPT-4V，哈佛医学院 AI 聊天机器人登上 Nature，肿瘤识别率接近 90%