

周四,meta平台发布了其最新大型语言模型Llama 3的早期版本,以及在用户输入提示时实时更新图片的图像生成器,以追赶生成式人工智能市场的领导者OpenAI。
这些模型将被整合到其虚拟助理元人工智能中,该公司称其为免费使用的同类产品中最复杂的,并将其与Alphabet旗下的谷歌(Google)和法国初创公司Mistral AI等竞争对手的产品在推理、编码和创意写作等科目上的表现进行了比较。
更新后的meta AI助手将在meta的Facebook、Instagram、WhatsApp和Messenger应用程序中获得更突出的位置,以及一个新的独立网站,使其能够更直接地与微软支持的OpenAI的突破性产品ChatGPT竞争。
4
在这个网站上,一个欢迎访问者的登陆页面提示他们尝试让助手创建一个度假行装清单,和他们一起播放20世纪90年代的音乐琐事,提供家庭作业帮助,并画出纽约市的天际线。
meta一直在争先恐后地向其数十亿用户推出生成式人工智能产品,以挑战OpenAI在该技术方面的领先地位,包括对计算基础设施进行昂贵的彻底改革,并整合之前截然不同的研究和产品团队。
作为追赶努力的一部分,这家社交媒体巨头一直在公开发布其Llama模型,供开发人工智能应用程序的开发者使用,因为一个强大的免费选项可能会阻碍竞争对手从其专有技术中获取收入的计划。这一策略引起了批评者的安全担忧,他们担心不道德的行为者可能会利用这种模式来制造什么。
meta首席产品官克里斯·考克斯在接受采访时表示,meta为Llama 3配备了新的计算机编码能力,并在这次训练中为其提供了图像和文本,尽管目前该模型只输出文本。
他补充说,更高级的推理能力,比如制定更长的多步骤计划的能力,将在随后的版本中出现。meta在博客中表示,计划在未来几个月发布的版本还将具备“多模态”功能,这意味着它们既可以生成文本,也可以生成图像。
4
考克斯说:“最终的目标是帮助你把事情从你的工作中解脱出来,让你的生活更轻松,无论是与企业互动,还是写作,还是计划旅行。”
考克斯表示,在“羊驼3”的训练中加入图像将加强今年推出的雷邦元智能眼镜的更新,这是一款与眼镜制造商依视路Luxoticca合作生产的产品,使元人工智能能够识别佩戴者看到的物体并回答有关它们的问题。
meta股价周四收涨1.5%。
meta还宣布与谷歌合作,将其实时搜索结果包含在助手的回答中,以补充与微软必应搜索引擎的现有协议。
4
随着更新,这款元人工智能助手将扩展到美国以外的十几个市场,包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。考克斯说,meta“仍在努力在欧洲找到正确的方法来做到这一点”,欧洲的隐私规则更为严格,即将出台的《人工智能法案》(AI Act)也准备提出披露模型训练数据等要求。
生成式人工智能模型对数据的贪婪需求已经成为该技术发展的主要紧张来源。
meta首席执行官马克·扎克伯格在一段视频中承认了与OpenAI的竞争,他在视频中称meta AI是“你可以自由使用的最智能的人工智能助手”。
4
扎克伯格说,目前推出的两个较小版本的Llama 3,分别有80亿个和700亿个参数,在通常用于评估模型质量的性能基准上,比其他免费模型得分更高。他说,最大版本的美洲驼3仍在训练中,有4000亿个参数。
专注于人工智能的风投公司Air Street Capital的创始人内森·贝纳奇(Nathan Benaich)表示,这些结果“无疑令人印象深刻”,但也表明免费模型和专有模型之间的性能差距越来越大。
开发人员抱怨说,之前的“羊驼2”版本无法理解基本的环境,将如何“杀死”计算机程序的请求与执行谋杀指令的请求混淆在一起。竞争对手谷歌(Google)也遇到了类似的问题,最近暂停了Gemini人工智能图像生成工具的使用,此前该工具因对历史人物的描绘不准确而受到批评。
meta表示,它通过使用“高质量数据”让模型识别细微差别,减少了羊驼3中的这些问题。该公司没有详细说明所使用的数据集,但表示,向“羊驼3号”输入的数据是“羊驼2号”的7倍。