ChatGPT对近75%的药物相关查询未能给出“满意”的答复：研究

商业作者 / 花爷 / 2024-12-28 17:08

　　　　　　一项新研究显示，流行的人工智能工具ChatGPT在有关处方药的问题中，有近75%答错了，其中一些回答对用户造成了潜在伤

　　一项新研究显示，流行的人工智能工具ChatGPT在有关处方药的问题中，有近75%答错了，其中一些回答对用户造成了潜在伤害。

　　据CNBC首次报道的这项研究显示，长岛大学的药剂师向OpenAI的免费聊天机器人提出了39个与药物相关的问题，其中只有10个回答被认为是“满意的”。

　　在12月3日至12月7日于加州阿纳海姆举行的美国卫生系统药剂师研究会议上，刘的研究人员提出了其他29个问题的答案，要么没有直接回答问题，要么不准确，要么不完整。

　　“医疗保健专业人员和患者应该谨慎使用ChatGPT作为药物相关信息的权威来源，”该研究的负责人、刘医学院药学实践副教授萨拉·格罗斯曼(Sara Grossman)说。

　　格罗斯曼和她的团队以一个关于COVID-19抗病毒药物Paxlovid和降血压药物维拉帕米之间关系的问题为例。

Pharmacists at Long Island University posed 39 drug-related questions to OpenAI's free ChatGPT model. only 10 responses were deemed 3

　　当被问及Paxlovid和维拉帕米之间是否存在药物相互作用时，ChatGPT回应说，这种药物组合没有相互作用的报道。

　　格罗斯曼说:“实际上，这些药物可能会相互作用，联合使用可能会导致血压过度降低。”“如果不了解这种相互作用，患者可能会遭受不必要的、可预防的副作用。”

　　《华盛顿邮报》已向刘和OpenAI寻求置评。

　　LIU的研究人员要求ChatGPT为其每个回答提供参考，以进行验证。

　　39个回复中只有8个包含参考文献。

　　刘报告说，所有的参考资料都“不存在”，这证明ChatGPT可能不是解决药物相关问题的首选资源。

　　OpenAI的使用政策表明，其技术不应用于“告诉某人他们有或没有某种健康状况，或提供如何治愈或治疗健康状况的说明”。

　　该指南还警告说:“OpenAI的模型没有经过微调，无法提供医疗信息。你不应该使用我们的模型为严重的医疗状况提供诊断或治疗服务。”

　　 LIU researchers pointed out that ChatGPT said there was no drug interaction between the COVID-19 antiviral Paxlovid and the blood-pressure lowering medication verapamil, though this is not actually the case. 3

　　然而，自从ChatGPT于2022年11月首次亮相以来，它一直是人工智能和包括医学在内的不相关领域发展的开创性项目。

　　今年6月，在模拟妇产科考试中，聊天机器人的表现超过了人类候选人——甚至在移情沟通和展示专业知识等领域都表现出色。

　　新加坡国立大学的一项研究显示，ChatGPT在妇产科专家考试中的平均得分为77.2%，而人类考生的平均得分仅为73.7%。

　　该研究指出，ChaptGPT每站平均用时不到3分钟，远低于10分钟的时间限制。

　　同月，医学杂志JAMA Network的一项研究表明，ChatGPT被认为比人类医生更有爱心和同情心。

　　《美国医学会杂志》的研究人员在Reddit论坛r/AskDocs上随机选择了195个交流。

　　在每次交流中，一位经过认证的医生都会回答Reddit用户提出的健康问题。

　　然后，同样的问题被发布到ChatGPT。

　　结果不会让医生太高兴:《美国医学会杂志》发现，ChatGPT在78.6%的情况下给出了更好的答案。在大多数情况下，它的答复也更长、更全面。

Previous studies about ChatGPT's medical abilities have been conflicted, with some suggesting that the tech could replace doctors while others note the AI bot's 3

　　也许最糟糕的是，聊天机器人给出最具同理心的回应的频率是人类的近10倍。

　　然而，医生们并没有为此担心太久，因为仅仅两个月后，ChatGPT就被用于另一项与医学相关的研究，并推出了包含正确和错误信息的“潜在危险”混合的癌症治疗方案。

　　今年8月，哈佛医学院(Harvard Medical School)旗下布莱根妇女医院(Brigham and Women’s Hospital)的研究人员促使OpenAI广受欢迎的聊天机器人提供符合美国国家综合癌症网络(National Comprehensive Cancer Network)制定的指导方针的治疗建议。

　　该研究发现，虽然所有ChatGPT的输出“至少包括1种符合nccn的治疗方法”，但约34%的输出也包含不正确的治疗建议。

分享到

声明：本文为用户投稿或编译自英文资料，不代表本站观点和立场，转载时请务必注明文章作者和来源，不尊重原创的行为将受到本站的追责；转载稿件或作者投稿可能会经编辑修改或者补充，有异议可投诉至本站。

ChatGPT对近75%的药物相关查询未能给出“满意”的答复：研究

最新文章

热文导读

斯蒂芬·A·史密斯在和迈卡·帕森斯打篮球后被送往医院