健康
你的AI医疗助手可能在编造病历:安大略省审计揭露惊人真相
你有没有过这种经历——医生低头看病历,问了你一些问题,然后抬起头来复述你的病情?但你有没有想过,那份医生正在看的"病历",可能是AI编的?
这听起来像科幻小说,但安大略省的审计报告告诉我们:这已经是现实了。
事情是这样的
最近,安大略省审计长发布了一份报告,调查了省政府批准使用的20家AI医疗抄写器(AI Medical Scribe)。这些工具的本意是帮医生减轻文书负担——让AI听对话、自动写病历,医生就能把更多时间花在病人身上。
结果呢?这20家供应商,没有一家是靠谱的。
具体来说:
- 9家会在病历里产生幻觉信息——编造根本不存在的东西
- 12家会错误记录信息——你吃了什么药、做了什么检查,它能给你记错
- 17家会遗漏心理健康问题的关键细节——这对患者来说可能是致命的
更离谱的是,这些AI会自己编造血液检查结果、编造转诊建议。想象一下:你根本没做过某个检查,但AI在你的病历里写了个检查结果;或者医生让AI记下"患者提到最近很焦虑",但AI把这事给漏了。
这不只是"小毛病"——这可能直接决定一个人的治疗方案。
为什么这个问题这么严重
医疗记录不是普通的文字文档。它是医生做诊断的核心依据,是其他医护人员了解你病情的窗口,也是万一出事时判断责任的关键证据。
当AI开始在病历里"创作"内容时,整个医疗系统的信任基础就被动摇了。
更让人担忧的是,医生和患者可能都发现不了这些问题。医生在忙碌的门诊中很难逐一核对AI生成的每一条记录,而患者压根看不到AI在后台写了什么。等问题被发现时,可能已经过去好几个月——你的病历里已经被塞进了一堆不存在的信息,而它们可能已经影响了后续的诊疗。
安大略省卫生部门的一位负责人说,他们当初批准这些工具时,主要是看功能和价格,根本没有足够的测试环节。"我们以为市场会自己优胜劣汰,"他说,"结果我们错了。"
AI"幻觉"是怎么跑到医疗记录里的
你可能会问:AI不是挺聪明的吗?怎么会胡编乱造?
这其实是个技术问题。AI医疗抄写器的工作原理是:听医患对话,然后用自然语言理解能力把对话内容转成文字,再整理成病历格式。问题出在"理解"和"整理"这两个环节。
当对话内容不完整、有歧义、或者涉及到AI训练数据中很少见的病症时,AI就会开始"填空"——用自己觉得"合理"的内容来补完信息。这就是所谓的"幻觉"(hallucination)。在普通的聊天场景里,AI编个无关紧要的故事可能只是烦人;但在医疗场景里,这个"合理猜测"可能就是一条关乎性命的错误记录。
还有一个问题:这些AI工具往往是在云端运行的,要通过互联网传输数据。这不仅带来了隐私方面的担忧——你的病情对话可能正在被第三方AI系统处理——而且网络延迟或中断时,生成的病历质量更难以保证。
监管滞后:政府还没跟上AI的脚步
安大略省这次审计揭示了一个更大的问题:政府在AI医疗工具方面的监管已经严重滞后。
这些AI抄写器被大规模推广和使用,但安大略省一直没有建立专门的评估体系。审计报告指出,政府在批准这些工具时,没有要求供应商提供准确性数据,没有独立的第三方测试,甚至没有建立问题反馈机制。
对比一下其他领域:药品上市前要经过严格临床试验,医疗器械要获得认证才能进医院。但AI医疗软件呢?可能只是签个合同、做个演示,就能直接上岗了。
这不只是安大略省的问题。在全球范围内,AI医疗工具的监管都是个难题。传统的医疗监管框架是针对"确定性"产品的——药品的化学成分是固定的,器械的规格是不变的。但AI系统是动态的、不断学习的,同样的工具在不同的医院、不同的患者群体上表现可能完全不一样。
有人在尝试解决
面对这些问题,一些机构和公司开始行动了。
美国FDA已经开始要求AI医疗工具的开发商提交更详细的安全性数据,包括模型在真实环境中的表现追踪。欧盟的AI法案将医疗AI列为"高风险"类别,要求更高的透明度。
技术层面,一些研究者提出了"AI病历审核"的概念——不指望AI完全不出错,但可以训练第二个AI来审核第一个AI生成的病历,标记出可能有问题的地方。类似"AI检阅AI"的双重检查机制。
还有一些医院开始要求AI生成的病历必须有人工复核环节——AI可以提高效率,但最终签字的还是得是医生。这样至少能确保错误的病历不会直接流向后续的诊疗流程。
普通人能做什么
如果你或家人在看医生时,发现病历记录和实际情况有明显出入——不要犹豫,直接指出来。这是你的权利,也是对自己负责。
另外,如果你知道医生正在使用AI抄写器,可以主动问一句:"这段对话会被怎么记录?"了解工具的存在,本身就是一种监督。
对于考虑购买或订阅AI医疗工具的医疗机构,审计报告的建议是:在采购前,应该模拟真实场景进行测试,而不只是看演示或相信供应商的宣传材料。
一个值得思考的问题
AI进入医疗,是大势所趋。它确实有巨大的潜力:帮医生省下文书时间,让他们能看更多病人;帮不发达地区获得更好的医疗资源;让医疗系统更高效。
但安大略省的审计告诉我们:技术成熟不等于应用成熟。一项AI技术在实验室里表现再好,也不代表它能在真实医疗环境中万无一失。
AI医疗工具现在面临的,其实是一个老问题:我们如何确保效率提升不以牺牲安全为代价?
这个问题没有简单的答案。但至少,我们需要更多的测试、更严格的监管、以及更诚实的评估——而不是急着把AI塞进医疗系统,然后祈祷不出事。
参考来源: