您好,欢迎访问开博网站!

集团动态

联系开博

开博
联系人:杜经理
手机:18755199984
电话:0551-82601881
邮箱:sale.zcjd@qq.com
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
开博首页>>开博新闻>>集团动态>>开博-全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型—新闻—科学网

开博-全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型—新闻—科学网

发布日期:2024-06-19 作者:开博

被OpenAI争先一天后,科技巨子谷歌不甘示弱,推出了本身的最新多模态AI(人工智能)产物。

本地时候5月14日,在谷歌I/O开辟者年夜会上的主题演讲中,谷歌展现了由进级后Gemini模子驱动的AI助手项目Project Astra、对标Sora的文生视频模子Veo,和在硬件方面发布的第六代Tensor处置器单位(TPU)Trillium芯片。按照发布会最后的官方统计,完全聚焦在AI的这场主题演讲总共提到了121次AI。

完全聚焦在AI的这场主题演讲总共提到了121次AI。 来历:谷歌I/O主题演讲

谷歌CEO桑达尔 皮查伊(Sundar Pichai)暗示,谷歌的所有工作都在环绕生成式AI模子Gemini睁开,“我们但愿每一个人都能从Gemini所做的工作中受益”。

14日当天,谷歌(Nasdaq:GOOGL)股价收在每股171.93美元,涨0.6%,总市值2.12万亿美元。

AI搜刮撑持视频输入,Gemini、Gemma上新

作为搜刮引擎巨子,AI搜刮恰是谷歌所做工作中的一部门。

据介绍,在最新Gemini的加持下,谷歌搜刮将具有多步调推理能力,可以一次性处置带有多个限制前提的长问题、帮忙用户进行脑筋风暴,并撑持视频搜刮,让用户经由过程拍摄视频来搜刮解决方案。这些功能将先在美国推出,谷歌估计会在本年年末前将其带给跨越10亿人。

谷歌AI搜刮将具有多步调推理能力。来历:谷歌

谷歌的Gemini以超长的上下文窗口而出名。在年夜会上,谷歌重点强调了年夜模子Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国度地域的Gemini Advanced定阅者供给最新模子、具有100万个token的Gemini 1.5 Pro,撑持跨越35种说话,订价为每100万token 3.5美元。

据皮查伊介绍,Gemini 1.5会供给“迄今为止所有根本模子中最长的上下文窗口”。Gemini 1.5 Pro将在本年晚些时辰将会把窗口进一步扩年夜至200万token,拓展同步处置多模态信息的鸿沟。

从本年炎天最先,Gemini将撑持语音及时交互,并在本年晚些时辰上线及时视频交互。将来几个月内,谷歌也将推出近似在GPTs的自界说AI助手功能,名为Gems,可以与整套“谷歌全家桶”联动。

别的,对一些需要快速响应的场景,谷歌推出了Gemini 1.5 Flash模子。Flash将是API中速度最快的Gemini模子,针对年夜范围、多量量的高配使命进行了优化,也具有100万token的长上下文窗口。

谷歌也在发布会上带来了旗下开源年夜模子Gemma的最新版本Gemma 2。据介绍,Gemma 2采取全新架构,参数上到达27B,具有冲破性的机能和效力。

AI助手Project Astra叫板GPT-4o

在OpenAI推出可以或许实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra也重磅登场。

在演示视频中,Astra可以或许经由过程手机摄像头或智能眼镜看到的内容来阐发响应语音号令。它成功地辨认出代码序列、为电路图提出改良建议、可以或许经由过程镜头“看到”伦敦国王十字区,并提示用户智能眼镜的放置位置。

Project Astra是谷歌对将来AI助手的瞻望。来历:谷歌

谷歌AI助手将可以或许经由过程智能眼镜和用户一路不雅察世界。来历:谷歌

据介绍,谷歌在Gemini的根本上开辟了Astra的原型,可以经由过程持续编码视频帧、将视频和语音输入组合到事务时候线中以实现更快地处置信息。经由过程语音模子,谷歌也强化了智能助手的措辞能力,让其可以或许给出更快速的回应。

不外,在演示视频中,谷歌AI助手的回应速度仿佛仍是会比GPT-4o稍慢一些,语音所表示出的豪情色采也平平一些。

皮查伊暗示,谷歌打算从本年最先将Astra的功能添加到其Gemini利用法式和其产物中。不外,他也强调,固然终究方针是“让Astra在公司的软件中实现无缝毗连”,但该产物将被谨严推出,而且“贸易化之路将由质量驱动”。

除在AI助手范畴的竞争外,谷歌还经由过程文生视频模子Veo来还击OpenAI的Sora。Veo可以或许按照文字、图片和视频的提醒来生成高质量的1080p视频,创作“一致且联贯”的镜头,用户可以对光照、镜头说话、视频色彩气概等进行自界说设置。不外,谷歌没有公布Veo的具体推出时候。

来历:谷歌I/O主题演讲

另外,谷歌还公布了一系列与图象、音乐有关的生成式AI东西,包罗可以或许表示更高细节程度的文生图东西Imagen 3,还与Youtube和音乐家合作的AI音乐师具“AI音乐沙盒”。

在硬件方面,谷歌将在本年晚些时辰推出交付第六代数据中间AI芯开博体育片TPU Trillium。皮查伊暗示,每块芯片的计较机能将比第五代晋升4.7倍,谷歌经由过程扩年夜芯片的矩阵乘法单位(MXU)和提高整体时钟速度来实现这一方针。另外,第六代将比第五代芯片节能67%,谷歌还将Trillium芯片的内存带宽提高了一倍。

发布会后,闻名AI学者吴恩达(Andrew Ng)对谷歌暗示庆祝,称小我很等候“具有200万个token的上下文窗口和对装备上AI进行更好撑持的Gemini”,认为其会为利用法式构建者带来新的机遇。

英伟达高级研究科学家范麟熙(Jim Fan)暗示:“谷歌正在做的一件事是准确的:他们终究在当真将AI整合到搜刮中......谷歌最壮大的护城河是分销。Gemini纷歧定要成为最好的模子,而是可以成为世界上最经常使用的模子。”

此前,在5月9日播出的一档节目中,谷歌CEO桑达尔 皮查伊接管采访时谈和公司与微软和OpenAI的竞争。他暗示,虽然谷歌在聊天机械人范畴的起步较晚,但他对公司的持久竞争力其实不耽忧,AI海潮尚处初期。

4月25日,谷歌母公司Alphabet发布了截至3月31日的2024年第一季度财报。财报显示,Alphabet第一季度实现营收805.39亿美元,同比增加15%,是自2022年头以来公司营收增加最快的一个季度。非美国通用管帐准则下(Non-GAAP)净利润为236.62亿美元,同比增加57%;摊薄后每股收益为1.89美元,高在市场预期的1.51美元。

特殊声明:本文转载仅仅是出在传布信息的需要,其实不意味着代表本网站不雅点或证实其内容的真实性;如其他媒体、网站或小我从本网站转载利用,须保存本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或联系转载稿费等事宜,请与我们联系。


开博
专业 规范 诚信 共赢 创新 发展

18755199984/0551-82601881

( 服务咨询热线 )
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
Copyright © 2022 All Rights Reserved.
技术支持:无忧资源网   皖ICP备2023013513号-1