AI幻觉问题日益严重,未来或持续恶化

自然科学作者 / 花爷 / 2025-06-21 13:39
"
  近期研究发现,以ChatGPT和Gemini为代表的AI聊天机器人虽然持续进行推理能力升级,但其"幻觉"问题反而呈现加剧趋势。所谓"幻

  近期研究发现,以ChatGPT和Gemini为代表的AI聊天机器人虽然持续进行推理能力升级,但其"幻觉"问题反而呈现加剧趋势。所谓"幻觉",是指AI系统输出错误信息或与问题无关的答案,这一问题自AI诞生以来就存在。OpenAI技术报告显示,其2024年4月发布的O3和O4-mini模型在事实总结任务中的幻觉率分别达到33%和48%,远高于去年末发布的O1模型16%的水平。类似情况也出现在其他公司的产品中,如DeepSeek开发的R1模型。

  业内专家对此现象持不同看法。OpenAI认为推理过程本身并非问题根源,正在努力降低新模型的幻觉率。而Vectara公司的测试数据显示,推理模型与非推理模型的幻觉率差异不大。值得注意的是,部分幻觉属于"良性"错误,即答案虽不符合要求但逻辑自洽。研究人员指出,当前基于文本总结的测试方法存在局限,无法全面反映AI在其他任务中的表现。

  普林斯顿大学专家指出,AI错误不仅限于幻觉,还包括依赖不可靠来源和使用过时信息等问题。随着AI应用场景的扩展,其错误可能带来严重后果,如法律领域的错误引用可能造成严重后果。虽然增加训练数据和算力并非根本解决方案,但在某些场景下,AI仍能提高工作效率。专家建议,对于需要准确事实的场合,最好避免完全依赖AI系统。这表明,人类可能需要长期与存在缺陷的AI系统共存。

  人工智能的幻觉越来越严重,而且会持续下去

  滚动播报

  上海库帕思科技CTO王长冕:西岸人工智能企业加速行业融合

  6月10日,一场以“2025活力西岸:从城市焕新到人居范本”为主题的对话活动在上海西岸智塔成功举办。本次活动由上海市徐汇区营商服务中心指导,每日经济新闻、龙华街道办事处、上海西岸开发(集团)有限公司共同主办。徐汇区营商服务中心主任徐晖、龙华...

  每日经济新闻|2025-06-16 08:48

  广西打造智能科技新平台

  近日,广西壮族自治区正式发布《广西人工智能开放创新平台建设工作指引》,同时印发《关于申报建设2025年首批广西人工智能开放创新平台的通知》,全面启动人工智能开放创新平台建设工作。这一举措旨在推动人工智能技术创新和产业融合发展,为广西数字经济...

  财联社|2025-06-16 07:36

  工信部推动AI赋能制造业计量 硅基流动获阿里亿元投资

  本周硬科技领域投融资动态活跃,多地政府出台支持政策推动科技产业发展。工信部发布制造业计量创新发展意见,强调要加强人工智能、大数据等技术在制造业计量领域的应用,推进计量数字化和网络化服务能力建设。北京市出台时尚产业高质量发展方案,支持开发人工...

  财联社|2025-06-16 07:36

  广西打造AI开放创新平台

  近日,广西正式发布了《广西人工智能开放创新平台建设工作指引》,同时印发了《关于申报建设2025年首批广西人工智能开放创新平台的通知》,标志着广西人工智能开放创新平台建设工作的全面启动。这一举措旨在推动人工智能技术在广西的深入应用和发展。根据...

  界面新闻|2025-06-16 07:24

  AI专家:人工智能会变得更聪明,但永远无法超越人类

  这篇文章基于中国科学院外籍院士、图灵奖得主约瑟夫·希发基思的访谈,深入探讨了人工智能(AI)的现状、局限及其对社会的影响。约瑟夫指出,当前社会对AI存在过度乐观的误解,混淆了信息与知识的本质区别。他强调,AI系统虽然能处理海量数据,但缺乏真...

  Edu指南|2025-06-12 14:50

  中国人民大学设立人工智能治理研究机构

  近日,中国人民大学人工智能治理研究院正式成立,并同期举办了首届人工智能治理学术研讨会。该活动在北京举行,吸引了来自学界、业界和司法界的多位专家学者共同参与。中国人民大学校长林尚立在会上强调了构建以人为本、安全可信的人工智能治理体系的重要性,...

  滚动播报|2025-06-11 22:32

  谷歌CEO:现有技术还造不出真正的人工智能

  谷歌母公司Alphabet的CEO桑达尔·皮查伊近日接受了彭博社的专访,分享了他对人工智能发展的看法。在采访中,皮查伊坦言,以目前的技术水平还无法实现通用人工智能(AGI)。他认为虽然AI技术持续进步,但谷歌搜索在短期内仍有发展空间。皮查伊...

  IT之家|2025-06-11 22:16

  中国科学家首次发现AI可自主产生类人认知

  这篇研究探讨了一个关于人工智能发展的重要问题:大语言模型是否能像人类一样理解物体的概念。长期以来,人类对物体的认知不仅包括物理特征识别,还涉及功能、情感和文化层面的理解。随着ChatGPT等大模型的兴起,科学家开始关注这些AI系统是否具备类...

  滚动播报|2025-06-11 21:56

  华为任正非:AI或成人类最后技术革命,核聚变或成终极能源

  近日,华为首席执行官任正非在深圳总部接受了媒体采访,就当前科技领域的热点话题发表了自己的见解。任正非认为,人工智能技术可能是人类社会面临的最后一次重大技术革命,其影响力将延续数十年甚至数百年之久。在谈到技术发展前景时,任正非特别提到了核聚变...

  财联社|2025-06-11 11:48

  中国制造业AI应用加速 本土模型崛起

  近日,华为首席执行官任正非在深圳总部接受媒体采访时,就人工智能发展现状和未来趋势发表了自己的见解。他认为,当前人工智能算法的核心驱动力并非来自IT技术人员,而是来自各行各业的专业人才。任正非特别指出,电力、基建、煤炭、医药等领域的专家才是真...

  财联社|2025-06-11 11:40

  苏州征集AI技术备战"苏超" 体育科技新赛道引关注

  苏州市人工智能行业协会近期启动了一项创新计划,旨在通过人工智能技术提升苏州足球队的训练水平和比赛表现。该计划面向2025年江苏省城市足球联赛,重点征集三大领域的AI解决方案:智能训练辅助、运动员健康管理和比赛战术优化。具体包括运动姿态分析系...

  财联社|2025-06-11 11:32

  数字化时代下的人力资源精细化管理

  近年来,人工智能技术在人力资源管理领域的应用日益广泛,为企业带来了显著的效率提升和模式创新。从招聘筛选到员工培训,从绩效管理到人才发展,人工智能正在重塑传统的人力资源管理模式,成为企业提升核心竞争力的重要工具。在招聘环节,人工智能技术通过自...

  清华管理评论?|2025-06-10 12:56

  本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/59403/

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读