一共突围,谷歌昨晚更新了一大波大模子产物
这次,谷歌要凭「量」打败其他竞争对手。
当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 Axion 等等。
Gemini 1.5 Pro 是 Google 功能最强大的生成式 AI 模型,现已在 Google 以企业为中心的 AI 开发平台 Vertex AI 上提供公共预览版。这是谷歌面向企业的 AI 开发平台。它能处理的上下文从 12.8 万个 token 增加到 100 万个 token。100 万个 token 大约相当于 70 万个单词,可能者大约 3 万行代码。这大致是 Anthropic 的旗舰模型 Claude 3 能作为输入处理的数据量的四倍,也大约是 OpenAI 的 GPT-4 Turbo 最大上下文量的八倍。
官方原文链接:https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
该版本首次提供了本地音频(语音)理解功能和全新的文件 API,使文件处理变得更加简单。Gemini 1.5 Pro 的输入模态正在拓展,包括在 Gemini API 和 Google AI Studio 中增加对音频(语音)的理解。此外,Gemini 1.5 Pro 现在能够对在 Google AI Studio 中上传的视频的图像(帧)和音频(语音)进行(Carry Out)推理。
可以上传一个讲座的录音,比如这个由 Jeff Dean 进行(Carry Out)的超过 117000 个 token 的讲座,Gemini 1.5 Pro 可以将其转换成一个带有答案的测验。(演示已加速)
谷歌在 Gemini API 方面也进行(Carry Out)了改进,主要有以下三个内容:
1. 系统指令:现在可以在 Google AI Studio 和 Gemini API 中使用系统指令来指导模型的响应。定义角色、格式、目标和规则,以针对您的特定用例指导模型的行为。
在 Google AI Studio 中轻松设置系统指令
2.JSON 模式:指示模型仅输出 JSON 对象。这种模式使从文本可能图像中提取结构化数据成为可能。现在可以使用 cURL,Python SDK 支持即将推出。
3. 对函数调用的改进:现在可以选择模式来限制模型的输出,提高可靠性。选择文本、函数调用可能仅函数本身。
此外,谷歌将发布下一代文本嵌入模型,其性能优于同类模型。从今天(Today)开始,开发者将能够通过 Gemini API 访问下一代文本嵌入模型。这个新模型,text-embedding-004(在 Vertex AI 中为 text-embedding-preview-0409),在 MTEB 基准测试中达成了更强的检索性能,并且超越了具有可比维度的现有模型。
在 MTEB 基准测试中,使用 256 dims 输出的 Text-embedding-004(又名 Gecko)优于所有较大的 768 dims 输出模型
不过,需要注意的是,Gemini 1.5 Pro 对于没有访问 Vertex AI 和 AI Studio 权限的人来说是不可用的。目前(Currently),大多数人通过 Gemini 聊天机器人来接触 Gemini 语言模型。Gemini Ultra 驱动了 Gemini Advanced 聊天机器人,虽然它功能强大,也能理解长命令,但它的速度不如 Gemini 1.5 Pro。
在 2024 年的 Google Cloud Next 大会上,该公司推出多个开源工具,主要用于支持生成式 AI 项目和基础设施。其一是 Max Diffusion,它是各种扩散模型参考达成的集合,可在 XLA(加速线性代数)设备上运行。
GitHub 地址:https://github.com/google/maxdiffusion
其二是 Jetstream,一个运行生成式 AI 模型的新引擎。目前(Currently),JetStream 只支持 TPU,将来可能会兼容 GPU。谷歌声称,JetStream 可为谷歌自己的 Gemma 7B 和 Meta 的 Llama 2 等模型提供高达 3 倍的性价比。
GitHub 地址:https://github.com/google/JetStream
第三个是 MaxTest,这是一个针对云中的 TPUs 和 Nvidia GPUs 的文本生成 AI 模型的集合。MaxText 现在包括 Gemma 7B、OpenAI 的 GPT-3、Llama 2 和来自 AI 初创公司 Mistral 的模型,谷歌表示所有这些模型都可以根据开发人员的需求进行(Carry Out)定制和微调。
GitHub 地址:https://github.com/google/maxtext
首款自研 Arm 处理器 Axion
谷歌云宣布推出其首款自主研发的 Arm 处理器,名为 Axion。其基于 Arm 的 Neoverse 2,专为数据中心设计。谷歌表示其 Axion 实例的性能比其他竞争对手如 AWS 和微软的基于 Arm 的实例高出 30%,与相应的基于 X86 的实例相比,性能提高了最多 50%,能效提高了 60%。
谷歌在周二的发布会上强调,由于 Axion 建立在一个开放的基础上,谷歌云的客户将能够将他们(They)现有的 Arm 工作负载带到谷歌云,而无需任何修改。
不过,目前(Currently)谷歌还没有发布对此进行(Carry Out)详细介绍的内容。
代码补全、生成利器 ——CodeGemmaCodeGemma 以 Gemma 模型为基础,为社区带来了强大而轻量级的编码功能。该模型可分为专门处理代码补全和代码生成任务的 7B 预训练变体、用于代码聊天和指令跟随的 7B 指令调优变体、以及在本地计算机上运行快速代码补全的 2B 预训练变体。
CodeGemma 具有以下几大优势:
智能代码补全和生成:补全行、函数,甚至生成整个代码块,无论你是在本地还是云上工作;
更高准确性:CodeGemma 主要使用来自网站文档、数学和代码的 5000 亿 token 的英语语言数据进行(Carry Out)训练,生成的代码不仅语法更正确,语义也更有意义,有助于减少错误和 debug 时间;
多语言能力:支持 Python、JavaScript、Java 和其他流行编程语言;
简化工作流程:将 CodeGemma 集成到你的开发环境中,以减少编写的样板代码,并更快地编写重要、有趣且差异化的代码。
CodeGemma 与其他主流代码大模型的一些比较结果(Result)如下图所示:
CodeGemma 7B 模型与 Gemma 7B 模型在 GSM8K、MATH 等数据集上的比较结果(Result)。
更多技术细节和实验结果(Result)请参阅谷歌同步放出的论文。
论文地址:https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf
开放语言模型 ——RecurrentGemmaGoogle DeepMind 还发布了一系列开放权重语言模型 ——RecurrentGemma。RecurrentGemma 基于 Griffin 架构,通过将全局注意力替换为局部注意力和线性循环(linear recurrences)的混合,在生成长序列时达成快速推理。
技术报告:https://storage.googleapis.com/deepmind-media/gemma/recurrentgemma-report.pdf
RecurrentGemma-2B 在下游任务上达成了卓越的性能,可与 Gemma-2B(transformer 架构)媲美。
同时,RecurrentGemma-2B 在推理过程中达成了更高的吞吐量,尤其是在长序列上。
Google Vids 是一款 AI 视频创建工具,是 Google Workspace 中添加的新功能。
谷歌表示,借助 Google Vids,用户可以与文档和表格等其他 Workspace 工具一起制作视频,并且可与同事实时协作。
Gemini Code Assist 是一款面向企业的 AI 代码完成和辅助工具, 对标 GitHub Copilot Enterprise。Code Assist 将通过 VS Code 和 JetBrains 等流行编辑器以插件的形式提供。
图源:https://techcrunch.com/2024/04/09/google-launches-code-assist-its-latest-challenger-to-githubs-copilot/
Code Assist 由 Gemini 1.5 Pro 提供支持。Gemini 1.5 Pro 拥有百万 token 的上下文窗口,这使得谷歌的工具能够比竞争对手引入更多的上下文。谷歌表示,这意味着 Code Assist 能够提供更准确的代码建议,并具备推理和更改大段代码的能力。
谷歌表示:「Code Assist 使客户能够对整个代码库进行(Carry Out)大规模更改,从而达成以前不可能达成的人工智能辅助代码转换。」
智能体构建器 ——Vertex AIAI 智能体是今年(This Year)一个热门的行业发展方向。谷歌现在宣布推出一款帮助企业构建 AI 智能体的新工具 ——Vertex AI Agent Builder。
谷歌云首席执行官 Thomas Kurian 表示:「Vertex AI Agent Builder 使人们能够非常轻松、快速地构建和部署可用于生产的、由人工智能驱动的生成式对话智能体,并且能够以指导人类的方式指导智能体,以提高模型生成结果(Result)的质量和正确性。」
参考链接:
https://techcrunch.com/2024/04/09/google-open-sources-tools-to-support-ai-model-development/
https://developers.googleblog.com/2024/04/gemma-family-expands.html?utm_source=twitter utm_medium=unpaidsoc utm_campaign=fy24q2-googlecloudtech-blog-next_event-in_feed-no-brand-global utm_content=- utm_term=- linkId=9603600
本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:关注大模型的,36氪经授权发布。
该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
+13好文章,需要你的鼓励
机器之心特邀作者7收 藏+10评 论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微 博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章抖音(Tik Tok):搜索一响,黄金万两联想不想输,但AI PC难成救命稻草并购、裁员、翻新,25亿美金的App 工厂如何杀出重围?创新or“噱头”?智己新车宣称搭载“固态电池”,续航突破1000公里,售价不超33万元Apple修改审核国策,模拟器真能迎来春天?9 亿人的蹭网神器,成了流氓软件App Store 允许下载游戏(Game)模拟器,复古玩家的 iPhone 时刻真要来了?Meta 下一代智能眼镜曝光,将融合 AR 与 AI为什么纳德拉的微软是最好的微软?最新文章推荐小米汽车(Car)被市场“捶打”的时间还有很多中达新材披露北交所一轮问询回复:被问外销收入是否稳定可持续马云反思阿里这五年:改掉我们(We)最喜欢的坏习惯抖音(Tik Tok):搜索一响,黄金万两晓谈数据工程2-数据存储努力(Effort)的人已经通过海选出道了暴雪与网易复合,今夏国服回归,漂泊的玩家账号能复原吗?北交一季度总结:个股赚钱效应低迷,题材股成唯一赢家看云计算如何赋能人工智能通过港交所聆讯,出门问问还在“大炼模型”?![](http://static.36krcdn.com/36kr-web/static/qr_img.bd73a0ad.png?x-oss-process=image/resize,p_5/blur,r_3,s_2)
专业的人工智能媒体和产业服务平台
发表文章501篇最近内容全面突围,谷歌昨晚更新了一大波大模型产品1小时前英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡1小时前不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局昨天(Yesterday)阅读更多内容,狠戳这里下一篇英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡Gaudi 3 AI 加速器即将在第三季度出货。
1小时前
热门标签泡泡英语福特t型车我国新型城镇化规划财务软件金蝶云企业平台沙滩车市场准入负面清单方辉云电脑(Computer)马路牙子长城皮卡坦途皮卡五十铃皮卡半衰期爱莉杨宁非虚构文学都市女孩李滨金融大数据蒋韬钢球防弹玻璃高中(High School)物理艾莎安娜闪聊品骏快递普萘洛尔ptsd关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴![阿里云](http://static.36krcdn.com/36kr-web/static/aly.e9118f2f.png)
![火山引擎](http://static.36krcdn.com/36kr-web/static/bytey.7484dc04.png)
![高德](http://static.36krcdn.com/36kr-web/static/gaodi.9e9d6741.png)
![个推](http://static.36krcdn.com/36kr-web/static/getui.d2af25d2.png)
![星球日报(Daily)](http://static.36krcdn.com/36kr-web/static/dailyPlanet.783b0e10.png)
![鲸准](http://static.36krcdn.com/36kr-web/static/logo_jz@2x.525a51f1.png)
![氪空间](http://static.36krcdn.com/36kr-web/static/logo_kkj@2x.47737e8d.png)
![富途牛牛](http://static.36krcdn.com/36kr-web/static/ftnn.4f5db2d2.png)
![企服点评](http://static.36krcdn.com/36kr-web/static/logo_qifudianping@2x.c5635d6a.png)
![人人都是产品经理](http://static.36krcdn.com/36kr-web/static/renren@2x.f6ecd8fa.png)
![](http://static.36krcdn.com/36kr-web/static/code_production.72d61993.png)
![36氪](http://static.36krcdn.com/36kr-web/static/logoWhite.2a5eceda.png)
![](http://static.36krcdn.com/36kr-web/static/code_production.72d61993.png)
![](http://static.36krcdn.com/36kr-web/static/kr.ad0c1158.jpg)
推送和解读前沿、有料的科技(Technology)创投资讯
![](http://static.36krcdn.com/36kr-web/static/jingzhun.9a251862.jpg)
一级市场金融信息和系统服务提供商
![](http://static.36krcdn.com/36kr-web/static/krSpace.7efbe7d3.jpg)
聚焦全球优秀创业者,项目融资率接近97%,领跑行业
- 赞(284) 踩(42) 阅读数(2587) 最新评论 查看所有评论
-
加载中......
- 发表评论
-