AI幻觉问题日益严重，未来或持续恶化

自然科学作者 / 花爷 / 2025-06-21 13:39

　　近期研究发现，以ChatGPT和Gemini为代表的AI聊天机器人虽然持续进行推理能力升级，但其"幻觉"问题反而呈现加剧趋势。所谓"幻

　　近期研究发现，以ChatGPT和Gemini为代表的AI聊天机器人虽然持续进行推理能力升级，但其"幻觉"问题反而呈现加剧趋势。所谓"幻觉"，是指AI系统输出错误信息或与问题无关的答案，这一问题自AI诞生以来就存在。OpenAI技术报告显示，其2024年4月发布的O3和O4-mini模型在事实总结任务中的幻觉率分别达到33%和48%，远高于去年末发布的O1模型16%的水平。类似情况也出现在其他公司的产品中，如DeepSeek开发的R1模型。

　　业内专家对此现象持不同看法。OpenAI认为推理过程本身并非问题根源，正在努力降低新模型的幻觉率。而Vectara公司的测试数据显示，推理模型与非推理模型的幻觉率差异不大。值得注意的是，部分幻觉属于"良性"错误，即答案虽不符合要求但逻辑自洽。研究人员指出，当前基于文本总结的测试方法存在局限，无法全面反映AI在其他任务中的表现。

　　普林斯顿大学专家指出，AI错误不仅限于幻觉，还包括依赖不可靠来源和使用过时信息等问题。随着AI应用场景的扩展，其错误可能带来严重后果，如法律领域的错误引用可能造成严重后果。虽然增加训练数据和算力并非根本解决方案，但在某些场景下，AI仍能提高工作效率。专家建议，对于需要准确事实的场合，最好避免完全依赖AI系统。这表明，人类可能需要长期与存在缺陷的AI系统共存。

　　人工智能的幻觉越来越严重，而且会持续下去

　　滚动播报

　　上海库帕思科技CTO王长冕：西岸人工智能企业加速行业融合

　　6月10日，一场以“2025活力西岸：从城市焕新到人居范本”为主题的对话活动在上海西岸智塔成功举办。本次活动由上海市徐汇区营商服务中心指导，每日经济新闻、龙华街道办事处、上海西岸开发（集团）有限公司共同主办。徐汇区营商服务中心主任徐晖、龙华...

　　每日经济新闻｜2025-06-16 08:48

　　广西打造智能科技新平台

　　近日，广西壮族自治区正式发布《广西人工智能开放创新平台建设工作指引》，同时印发《关于申报建设2025年首批广西人工智能开放创新平台的通知》，全面启动人工智能开放创新平台建设工作。这一举措旨在推动人工智能技术创新和产业融合发展，为广西数字经济...

　　财联社｜2025-06-16 07:36

　　工信部推动AI赋能制造业计量硅基流动获阿里亿元投资

　　本周硬科技领域投融资动态活跃，多地政府出台支持政策推动科技产业发展。工信部发布制造业计量创新发展意见，强调要加强人工智能、大数据等技术在制造业计量领域的应用，推进计量数字化和网络化服务能力建设。北京市出台时尚产业高质量发展方案，支持开发人工...

　　财联社｜2025-06-16 07:36

　　广西打造AI开放创新平台

　　近日，广西正式发布了《广西人工智能开放创新平台建设工作指引》，同时印发了《关于申报建设2025年首批广西人工智能开放创新平台的通知》，标志着广西人工智能开放创新平台建设工作的全面启动。这一举措旨在推动人工智能技术在广西的深入应用和发展。根据...

　　界面新闻｜2025-06-16 07:24

　　AI专家：人工智能会变得更聪明，但永远无法超越人类

　　这篇文章基于中国科学院外籍院士、图灵奖得主约瑟夫·希发基思的访谈，深入探讨了人工智能（AI）的现状、局限及其对社会的影响。约瑟夫指出，当前社会对AI存在过度乐观的误解，混淆了信息与知识的本质区别。他强调，AI系统虽然能处理海量数据，但缺乏真...

　　Edu指南｜2025-06-12 14:50

　　中国人民大学设立人工智能治理研究机构

　　近日，中国人民大学人工智能治理研究院正式成立，并同期举办了首届人工智能治理学术研讨会。该活动在北京举行，吸引了来自学界、业界和司法界的多位专家学者共同参与。中国人民大学校长林尚立在会上强调了构建以人为本、安全可信的人工智能治理体系的重要性，...

　　滚动播报｜2025-06-11 22:32

　　谷歌CEO：现有技术还造不出真正的人工智能

　　谷歌母公司Alphabet的CEO桑达尔·皮查伊近日接受了彭博社的专访，分享了他对人工智能发展的看法。在采访中，皮查伊坦言，以目前的技术水平还无法实现通用人工智能（AGI）。他认为虽然AI技术持续进步，但谷歌搜索在短期内仍有发展空间。皮查伊...

　　IT之家｜2025-06-11 22:16

　　中国科学家首次发现AI可自主产生类人认知

　　这篇研究探讨了一个关于人工智能发展的重要问题：大语言模型是否能像人类一样理解物体的概念。长期以来，人类对物体的认知不仅包括物理特征识别，还涉及功能、情感和文化层面的理解。随着ChatGPT等大模型的兴起，科学家开始关注这些AI系统是否具备类...

　　滚动播报｜2025-06-11 21:56

　　华为任正非：AI或成人类最后技术革命，核聚变或成终极能源

　　近日，华为首席执行官任正非在深圳总部接受了媒体采访，就当前科技领域的热点话题发表了自己的见解。任正非认为，人工智能技术可能是人类社会面临的最后一次重大技术革命，其影响力将延续数十年甚至数百年之久。在谈到技术发展前景时，任正非特别提到了核聚变...

　　财联社｜2025-06-11 11:48

　　中国制造业AI应用加速本土模型崛起

　　近日，华为首席执行官任正非在深圳总部接受媒体采访时，就人工智能发展现状和未来趋势发表了自己的见解。他认为，当前人工智能算法的核心驱动力并非来自IT技术人员，而是来自各行各业的专业人才。任正非特别指出，电力、基建、煤炭、医药等领域的专家才是真...

　　财联社｜2025-06-11 11:40

　　苏州征集AI技术备战"苏超" 体育科技新赛道引关注

　　苏州市人工智能行业协会近期启动了一项创新计划，旨在通过人工智能技术提升苏州足球队的训练水平和比赛表现。该计划面向2025年江苏省城市足球联赛，重点征集三大领域的AI解决方案：智能训练辅助、运动员健康管理和比赛战术优化。具体包括运动姿态分析系...

　　财联社｜2025-06-11 11:32

　　数字化时代下的人力资源精细化管理

　　近年来，人工智能技术在人力资源管理领域的应用日益广泛，为企业带来了显著的效率提升和模式创新。从招聘筛选到员工培训，从绩效管理到人才发展，人工智能正在重塑传统的人力资源管理模式，成为企业提升核心竞争力的重要工具。在招聘环节，人工智能技术通过自...

　　清华管理评论?｜2025-06-10 12:56

　　本信息来自互联网，不代表导读网立场，如若转载，请注明出处：http://www.frfey.com/news/59403/

分享到

声明：本文为用户投稿或编译自英文资料，不代表本站观点和立场，转载时请务必注明文章作者和来源，不尊重原创的行为将受到本站的追责；转载稿件或作者投稿可能会经编辑修改或者补充，有异议可投诉至本站。

AI幻觉问题日益严重，未来或持续恶化

最新文章

热文导读