首页 > 资讯 > 综合 > 正文
2023-12-11 15:21

谷歌开放了双子座的访问权限,竞相追赶OpenAI

Alphabet旗下的谷歌发明了支撑当前人工智能热潮的技术,但其产品的受欢迎程度落后。这家搜索巨头希望通过发布备受期待的Gemini来改变这种状况,Gemini是该公司迄今为止打造的“最大、最强大的人工智能模型”。

自从OpenAI去年凭借会话聊天机器人ChatGPT取得巨大成功以来,越来越多的公司开始试验生成式人工智能,这种技术可以根据用户的要求自动完成编码、总结报告或创建营销活动等任务。在周三发布该产品之前的一次展示会上,谷歌强调Gemini是该公司生产的最灵活的机型,因为它有不同的尺寸,其中一个版本可以直接在智能手机上运行。这使该项目有别于其他竞争对手。

广告

继续往下读

人工智能模型是一种用于支持各种生成式人工智能应用程序的系统,将有三个版本。它们是Gemini Ultra, Gemini Pro和Gemini Nano。谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)表示,这种多样性意味着Gemini“能够在从移动设备到大型数据中心的所有设备上运行”。

柯林斯在与记者的电话中说:“长期以来,我们一直想建立新一代的人工智能模型,灵感来自于人们理解世界和与世界互动的方式——一种更像是一个有用的合作者,而不是一个智能软件的人工智能。”“双子座让我们离这个愿景更近了一步。”

在该机型发布之前,该公司对Gemini进行了一系列标准的行业基准测试,并表示在八次测试中有六次,Gemini Pro的表现优于OpenAI的GPT-3.5机型。谷歌表示,在对通用语言理解、推理、数学和编码进行测试的8项基准测试中,Gemini在7项上的表现也超过了OpenAI通用模型的最新版本GPT-4。与此同时,谷歌估计,该公司最新的可解释和生成代码的生成式人工智能产品AlphaCode 2在竞争性编程领域超过了85%的竞争对手。该公司正在发布一份技术报告,更深入地解释Gemini的模型架构、培训过程和评估。

从周三开始,想要为智能手机和平板电脑开发基于gemini的应用程序的安卓开发者将能够注册这种人工智能模型的“纳米”版本,它可以直接在这些设备上运行。谷歌还表示,将立即在其旗舰手机Pixel 8 Pro上启用Gemini,它将为新的生成式人工智能功能提供支持,比如从电话录音中总结要点的能力。谷歌表示,下周,该公司将通过其Vertex AI和AI Studio平台向云客户提供Gemini Pro。

Gemini Ultra是谷歌人工智能模型的最大版本,将首先在一个面向开发者和企业公司的早期访问计划中推出,有关该计划的细节将于下周公布。它将在明年初更广泛地向公众推出。

双子座还将能够通过公司的会话聊天机器人巴德与谷歌的大量应用程序和服务集成,这是OpenAI的ChatGPT的竞争对手。此前,巴德使用的是谷歌的PaLM 2模型,这是该公司在5月份的年度开发者大会上宣布的一种大型语言模型。

在过去的一年里,谷歌一直面临着重塑其核心搜索业务、应对可以生成内容的人工智能程序崛起的压力。尽管该公司一直被视为人工智能研究的先驱,但一些人批评其管理层对人工智能产品的市场反应迟缓,尤其是在ChatGPT和图像生成器Dall-E等产品获得病毒式成功之后。自从今年3月OpenAI的GPT-4发布以来,谷歌一直在争先恐后地重申其在该领域的领导地位,包括向其成熟的搜索业务注入这项新技术。

Gemini是该公司对这种市场压力的回应。谷歌表示,该人工智能模型是“天生的多模式”,这意味着它从一开始就经过了预先训练,可以处理来自用户的基于文本和图像的提示。例如,在一个视频演示中,谷歌展示了家长如何帮助孩子完成家庭作业,方法是上传一张数学题的图片,以及在工作表上尝试解决问题的照片。

“双子座不仅可以解决这些问题,”谷歌软件工程师泰勒·阿普尔鲍姆(Taylor Applebaum)在演示中说,“它还可以阅读答案,理解什么是对的,什么是错的,并解释需要进一步澄清的概念。”该公司还表示,其“搜索生成体验”——谷歌搜索引擎的实验版本,使用其生成式人工智能技术——将在明年整合Gemini的新功能。

广告

继续往下读

不过,该公司的代表警告说,Gemini仍然容易产生“幻觉”,即生成式人工智能产生的虚假或虚构信息。柯林斯称这种现象是“一个尚未解决的研究问题”。该公司向记者展示的演示是预先录制的。

柯林斯表示,双子座“拥有谷歌所有人工智能模型中最全面的安全评估”。他说,为了评估Gemini的安全性,谷歌对人工智能模型进行了对抗性测试,这意味着提示模仿一个试图利用该程序的坏人。测试包括“真正的毒性提示”,这是艾伦人工智能研究所(Allen Institute for AI)开发的一项测试,包含了从网络上提取的超过10万个提示,旨在帮助人工智能研究人员检查大型语言模型中的仇恨言论和政治偏见。

该公司还强调,该工具将是快速的。该公司表示,Gemini采用了一种新的底层超级计算机架构和更新的处理芯片,这使得它比早期的小型型号运行得更快。谷歌正在使用其云芯片的新版本,云张量处理单元(tpu),它是内部设计的,可以比以前的模型快2.8倍。谷歌机器学习副总裁阿明·瓦达特(Amin Vahdat)表示,这种方法让谷歌“对未来的标准人工智能基础设施有了新的看法”。他补充说,该公司仍在使用第三方人工智能芯片来运行其双子座模型。

Gemini将被整合到谷歌今年3月推出的生成式人工智能聊天机器人Bard中,使其能够使用谷歌最受欢迎的服务,包括Gmail、地图、Docs和YouTube。从周三开始,巴德将由Gemini Pro提供支持,它将实现高级推理、规划、理解和其他能力。它将能够在170个国家和地区使用英语运营,但值得注意的是,在欧洲和英国,该公司表示正在与当地监管机构合作。

明年年初,该公司计划发布Bard Advanced,它将由功能更强大的Gemini Ultra型号提供动力。谷歌表示,它将很快推出一个可信赖的测试程序,以便在向公众推出更广泛的产品之前改进Bard Advanced。

谷歌负责Bard产品的副总裁萧茜茜(Sissie Hsiao)表示:“有了Gemini, Bard将获得迄今为止最大、最好的升级,它将为人们创造、互动和协作开辟新的途径。”

©2023彭博社