ChatGPT对近75%的药物相关查询未能给出“满意”的答复:研究

商业作者 / 花爷 / 2024-12-28 17:08
"
      一项新研究显示,流行的人工智能工具ChatGPT在有关处方药的问题中,有近75%答错了,其中一些回答对用户造成了潜在伤

  

  

  一项新研究显示,流行的人工智能工具ChatGPT在有关处方药的问题中,有近75%答错了,其中一些回答对用户造成了潜在伤害。

  据CNBC首次报道的这项研究显示,长岛大学的药剂师向OpenAI的免费聊天机器人提出了39个与药物相关的问题,其中只有10个回答被认为是“满意的”。

  在12月3日至12月7日于加州阿纳海姆举行的美国卫生系统药剂师研究会议上,刘的研究人员提出了其他29个问题的答案,要么没有直接回答问题,要么不准确,要么不完整。

  “医疗保健专业人员和患者应该谨慎使用ChatGPT作为药物相关信息的权威来源,”该研究的负责人、刘医学院药学实践副教授萨拉·格罗斯曼(Sara Grossman)说。

  格罗斯曼和她的团队以一个关于COVID-19抗病毒药物Paxlovid和降血压药物维拉帕米之间关系的问题为例。

  Pharmacists at Long Island University posed 39 drug-related questions to OpenAI's free ChatGPT model. o<em></em>nly 10 respo<em></em>nses were deemed 3

  当被问及Paxlovid和维拉帕米之间是否存在药物相互作用时,ChatGPT回应说,这种药物组合没有相互作用的报道。

  格罗斯曼说:“实际上,这些药物可能会相互作用,联合使用可能会导致血压过度降低。”“如果不了解这种相互作用,患者可能会遭受不必要的、可预防的副作用。”

  《华盛顿邮报》已向刘和OpenAI寻求置评。

  LIU的研究人员要求ChatGPT为其每个回答提供参考,以进行验证。

  39个回复中只有8个包含参考文献。

  刘报告说,所有的参考资料都“不存在”,这证明ChatGPT可能不是解决药物相关问题的首选资源。

  OpenAI的使用政策表明,其技术不应用于“告诉某人他们有或没有某种健康状况,或提供如何治愈或治疗健康状况的说明”。

  该指南还警告说:“OpenAI的模型没有经过微调,无法提供医疗信息。你不应该使用我们的模型为严重的医疗状况提供诊断或治疗服务。”

  LIU researchers pointed out that ChatGPT said there was no drug interaction between the COVID-19 antiviral Paxlovid and the blood-pressure lowering medication verapamil, though this is not actually the case. 3

  然而,自从ChatGPT于2022年11月首次亮相以来,它一直是人工智能和包括医学在内的不相关领域发展的开创性项目。

  今年6月,在模拟妇产科考试中,聊天机器人的表现超过了人类候选人——甚至在移情沟通和展示专业知识等领域都表现出色。

  新加坡国立大学的一项研究显示,ChatGPT在妇产科专家考试中的平均得分为77.2%,而人类考生的平均得分仅为73.7%。

  该研究指出,ChaptGPT每站平均用时不到3分钟,远低于10分钟的时间限制。

  同月,医学杂志JAMA Network的一项研究表明,ChatGPT被认为比人类医生更有爱心和同情心。

  《美国医学会杂志》的研究人员在Reddit论坛r/AskDocs上随机选择了195个交流。

  在每次交流中,一位经过认证的医生都会回答Reddit用户提出的健康问题。

  然后,同样的问题被发布到ChatGPT。

  结果不会让医生太高兴:《美国医学会杂志》发现,ChatGPT在78.6%的情况下给出了更好的答案。在大多数情况下,它的答复也更长、更全面。

  Previous studies a<em></em>bout ChatGPT's medical abilities have been conflicted, with some suggesting that the tech could replace doctors while others note the AI bot's 3

  也许最糟糕的是,聊天机器人给出最具同理心的回应的频率是人类的近10倍。

  然而,医生们并没有为此担心太久,因为仅仅两个月后,ChatGPT就被用于另一项与医学相关的研究,并推出了包含正确和错误信息的“潜在危险”混合的癌症治疗方案。

  今年8月,哈佛医学院(Harvard Medical School)旗下布莱根妇女医院(Brigham and Women’s Hospital)的研究人员促使OpenAI广受欢迎的聊天机器人提供符合美国国家综合癌症网络(National Comprehensive Cancer Network)制定的指导方针的治疗建议。

  该研究发现,虽然所有ChatGPT的输出“至少包括1种符合nccn的治疗方法”,但约34%的输出也包含不正确的治疗建议。

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读