{"text":[[{"start":8.31,"text":"最新研究显示,两款AI医疗工具在多项诊断和治疗决策上与医生表现相当甚至更优,表明专科健康大语言模型距离证明其临床价值又近了一步。"}],[{"start":20.33,"text":"根据周三发表在《自然》(Nature)上的结果,由德国研究人员开发的Mira在包括胰腺癌和肺炎在内的疾病分析中表现优于医生,而谷歌(Google)的Amie制定的治疗和检查方案也比人类更加精确。"}],[{"start":34.019999999999996,"text":"研究表明,专业的健康AI工具在给出医疗建议方面,可能比面向普通消费者的通用AI模型表现更好。但这些工具的发明者和独立专家都警告说,相关测试是在可控的模拟环境中进行的,这并不意味着这些工具已经可以用于真实的临床场景。"}],[{"start":53.78,"text":"雅各布•卡特表示,他在德累斯顿工业大学(TUD Dresden University of Technology)和海德堡大学(Heidelberg University)的科研团队参与了Mira的联合开发。他说:“我们现在看到的是AI可能如何改变医学的预览。”"}],[{"start":66.64,"text":"他补充说:“我认为AI智能体类似于飞机上的自动驾驶系统。这些系统可以通过接管日常事务来为医务人员提供支持、减轻负担,但最终责任始终在医生身上。”"}],[{"start":80.23,"text":"Mira利用电子健康记录系统中的患者数据,可以在8万5千多种操作中进行选择,包括开具诊断检查、处方用药和安排各类医疗操作。研究人员用500多例急诊科临床病例的信息对其进行了测试,这些信息是通过与充当患者的AI智能体聊天传递给Mira的。"}],[{"start":101.29,"text":"据刊登在《自然》杂志上的论文显示,Mira在包括阑尾炎和肺栓塞在内的八种病症上的诊断准确率为87.1%。相比之下,由六名不同专科医生组成的小组的准确率为78.1%。"}],[{"start":117.9,"text":"Amie使用谷歌的Gemini AI模型来回应由扮演患者的演员提供的数据。科研人员根据当前英国的临床实践指南和药物用药建议,设计了100个多次就诊案例场景,对Amie与21名全科医生的表现进行了对比测试。"}],[{"start":135.84,"text":"研究人员发现,在患者管理方面的推理能力上,Amie可与真实临床医生相匹敌,而且它制订的治疗方案比这些医生的方案更符合指南要求。在处理疑难病例时,Amie在用药推理方面也优于人类专业人士。"}],[{"start":152.58,"text":"两款AI模型都存在局限性,其发明者承认了这一点。研究人员表示,Mira仍会对“占比虽小但并非为零”的一部分患者给出“偏离最佳实践”的护理建议。"}],[{"start":166.03,"text":"他们补充说,AI智能体提供的病例信息可能“比急诊科患者的真实表述更有结构性”,遗漏和前后不一致的情况也更少。"}],[{"start":175.48,"text":"Amie研究是一座“里程碑”,但该研究中使用的病例构成和基于文本的患者情景都不能代表真实的临床环境,开发这一AI工具的研究人员表示。"}],[{"start":186.70999999999998,"text":"科学家表示,Amie已经展现出“有前景的能力”,但“尚未准备好向现实世界场景转化应用”,仍需投入更多工作来抑制潜在推理错误等问题。"}],[{"start":197.27999999999997,"text":"未参与相关研究的其他学者称赞了研究的严谨性,但也同样提醒,这两项研究都是建立在对患者情况进行严格设定的模拟之上。"}],[{"start":207.51999999999998,"text":"牛津大学(University of Oxford)医学社会学教授凯瑟琳•波普(Catherine Pope)表示:“这和日常医疗健康中那个混乱、复杂、充满人性的世界还有一段距离。”"}],[{"start":216.90999999999997,"text":"爱丁堡大学(University of Edinburgh)健康信息学与数据科学讲席教授朱莉•贾科(Julie Jacko)表示,很多有关AI模型表现更优的报告案例,体现的主要是其提供方案在“精确性和完整性”方面的优势,而不是在“临床正确性上存在明显差异”。"}],[{"start":233.09999999999997,"text":"贾科表示:“总体而言,这是一项有力的实验研究,也是向前迈出的重要一步,但它展示的是在结构化标准下的表现,而未能充分反映真实临床决策的复杂性。”"}],[{"start":246.07999999999996,"text":"谢菲尔德大学(University of Sheffield)数理科学学院助理教授Wei Xing表示,由于在某项基准测试中通用型AI模型取得了相近分数,人们也在“质疑Amie的优势究竟来自何处”。"}],[{"start":257.63999999999993,"text":"他说:“这表明,Amie的优势更多反映了AI模型整体的快速进步,而不是围绕它构建的特定系统本身。”"}]],"url":"https://audio.ftcn.net.cn/album/a_1781766193_5726.mp3"}