欧洲杯体育
12 月初,亚马逊云科技一年一度的 re:Invent 大会在好意思国拉斯维加斯大会召开,来自寰宇各地的超 6 万名参会者,他们脖子上佩带着不同豪情的牌子,穿梭于各个会场之间。
re:Invent 大会一直就以求实著称,但这一届发布的居品之多,连许多连气儿参会的资深人人齐嗅觉到信息过载——只是在三天期间里,亚马逊云科技 CEO Matt Garman 与高档副总裁 Peter DeSantis、AI 和数据副总裁 Swami 博士就发布了罕见 30+ 新品,涵盖推理芯片、AI 工作器、谣言语模子、生成式 AI 诱骗器具等等。
在切身感受这些密集的居品发布过程,可以昭着地索求出亚马逊云科技开会和演讲的套路,那即是——在工作客户过程中咱们发现了 XX 问题,于是咱们就推出了 XX 器具,特殊肤浅直给。
行为亚马逊云科技最早、亦然运用最真切的客户,亚马逊 CEO Andy Jassy 时隔多年再次亮相 re:Invent,此次他不仅一语气发布了 6 款 Amazon Nova 模子(包括 4 款基础模子,1 款图像生成模子和 1 款视频生成模子),更是行为亚马逊云科技最早、亦然运用最真切的客户(据他表现,亚马逊里面已构建或正在构建近 1000 个生成式 AI 运用才智),他共享的对于亚马逊运用 AI 的三个中枢问题——取舍、老本和需求,完全可以行为厚实本次大会的基本逻辑。搞懂了这三个问题,再看这 30 多个居品发布的背后念念路就很昭着了。
更解放的取舍
"当你尝试构建某些东西或者作念决策时,频频需要在 A 和 B 之间作念取舍吗?这种取舍其实放纵了你的念念路。在亚马逊云科技,咱们不这样念念考问题。"亚马逊云科技一年一度的 re:Invent 大会上,亚马逊云科技 CEO Matt Garman 在主题演讲时,这样抒发了对时候运用的厚实。
Matt 以为,"作念取舍"践诺上制造了失实领域,"让你速即驱动想我方必须选 A 或者选 B,但咱们鼓动团队去念念考奈何同期实现 A 和 B,就可以让人人换一种姿色念念考"。
在 Matt 眼中,诱骗者与客户永远有取舍最优居品的权益。这是亚马逊云科技建造时袭取的理念,无论是一两百款 EC2,照旧上百款数据库——亚马逊云科技一直齐以为,客户的需求大于一切,那么需求的各样性就决定了选项的各样性。
亚马逊云科技愿景文献撰写于 2003 年。彼时,盛大科技公司纷繁构建紧缚式的管制决策,试图大包大揽。最终酿成的是弘远而单一的管制决策,虽功能全面却仅达及格水准。但及格不应是追求的至极,东谈主们的确渴慕的是最优组件。若能将通盘顶尖元素整合一体,那才号称齐全。"基于此念,亚马逊云科技应时而生。" Matt 说。往常 18 年,纯确切时候构建模块,也成为亚马逊云科技工作迟缓朝上的捏念。
这一理念也表面前时下热议的大模子工作上。"在亚马逊里面构建状貌中所使用模子的各样性令东谈主惊诧。赐与了诱骗者自主取舍的权益,底本以为人人齐会选用 Anthropic 的 Claude 模子,毕竟往常一年多它在全球属于性能顶尖的模子,确乎有许多里面诱骗者在使用 Claude 模子,但他们也会采用 Llama 模子、Mistral 模子,以至会使用自行研发的模子。" Andy Jassy 演讲时谈及亚马逊落地生成式 AI 的资历,"因为一直齐在罗致归并个申饬,那即是永远不会出现一种器具能在某个范围一统六合的情况。就像数据库范围,磋商了 10 年,人人会使用各式各样的相关型数据库或者非相关型数据库;就像大数据范围盘问了很久是不是 TensorFlow 会一统六合,成果 PyTorch 更受接待。"
Amazon Bedrock Marketplace 是 Swami 博士在现场发布的其中一款新品。这是一个领有 100 多个当先大模子的"市集",Amazon Bedrock 中的协调体验极大简化模子诱骗责任经过,给用户带来了前所未有的纯真度,将让模子推理从"非 A 即 B "的取舍达到老本与蔓延的"好意思妙均衡"。
"对一个身分的优化频频需要对另一个身分进行息争,这是因为老本和响应蔓延与谈德准确性呈反比相关,因为功能更遒劲、高度智能的模子会花费更多的资源。" Swami 博士叙述从客户了解到的需求。而在更新的 Bedrock 上,新模子蒸馏功能,使得用户可以将特定学问从更大、更准确的模子回荡到更小、更高效的专科模子,使其速率提高 500%,老本裁减 75%。
然而多元化的取舍,也未免濒临一些自然存在的竞合相关,比如亚马逊云科技在向客户提供模子市集、模子诱骗平台的同期,也推出了我方的基础模子。不外,亚马逊云科技一直以来齐是怒放性的看待这种竞合相关。
对于亚马逊云科技的模子策略,Andy Jassy 作念了这样的回应:"咱们一直以来的绸缪即是为人人提供取舍,现实情况是,人人在不同的期间、出于不同的原因,齐会使用不同的模子。
这其实反馈了现实寰宇的运行限定。就好比东谈主类不会只找一个东谈主去获取各个范围的专科学问相同,不同的东谈主在不同的方面各有长处。有时候人人会侧重于优化编码,有时候关注数学,有时候敬重与检索增强生成(RAG)的集成,有时候聚焦智能需求,还有时候介意更低的蔓延或老本问题。大多半情况下,是各式身分的组合决定的。
在亚马逊云科技,咱们会为人人提供这些身分组合之后,怡悦需求的取舍。咱们以为,最近又为这个组合增添了一些特殊真谛的模子。好音问是,通盘这些模子齐能在 Amazon Bedrock 中使用,人人可以按照我方生机的任何组合去使用它们,进行磨练,并说明情况作念出相应的逶迤。"
可接管的老本
云诡计的老本问题,一直是 Matt 最为温煦的问题。
2018 年,亚马逊云科技已经作念过一个纵容且颇具争议的决定:诱骗我方的芯片。即 Amazon Graviton,以期在 ARM 内核变得越来越快、越来越遒劲的布景下提供各异化价值。面前,Amazon Graviton 被险些每个亚马逊云科技客户无为使用。Amazon Graviton 提供比 x86 高 40% 的性价比、减少 60% 的动力花费,也极大缩减了云诡计老本。
以图片共享网站 Pinterest 为例。在转向 Amazon Graviton 之前,Pinterest 运行着数千个 x86 实例来运营他们的业务。转向 Amazon Graviton 之后,Pinterest 将诡计老本裁减了 47%,碳排放减少了 62%。"他们并不孤苦,90% 的前 1000 个 Amazon EC2 客户齐驱动使用 Amazon Graviton。" Matt 说。
面前,生成式 AI 时间来了,当下最大的诡计问题齐与 AI 规划。诚然与 NVIDIA 有着长达 14 年的勾通相关(搭载 NVIDIA 新 Blackwell 芯片的 Amazon EC2 P6 工作器将于来岁岁首推出),亦然 NVIDIA 的大型生成式 AI 集群时局,但 GPU 依然成了亚马逊云科技为诡计降本的新绸缪:推出一款专为顶端生成式 AI 教师和推理这类高条件责任负载而联想的 GPU。
会上,亚马逊云科技最强 Amazon EC2 Trn2 诡计实例发布。配备 16 个 Trainium2 芯片,一个 Amazon EC2 Trn2 实例可在单个诡计节点提供 20.8 petaflops 的诡计才智,Amazon EC2 Trn2 实例提供比面前 GPU 工作器跨越 30% 到 40% 的性价比,这些芯片通过一种称为 NeuronLink 的高带宽、低蔓延互连承接在所有。
AI 大模子公司 Anthropic 合伙首创东谈主兼首席诡计官 Tom Brown12 月 2 日在 re:Invent 演讲时就地晓示,下一代的 Claude 模子将在 Project Rainier 上进行教师,他示意这将是一个新的诡计集群,领罕有十万个 Amazon Tranium2 芯片。优化完成后,该集群预测将成为迄今为止寰宇上最大的 AI 诡计集群,可供 Anthropic 构建和部署其将来模子。
"数十万个芯片意味着数百个密集的亿次浮点运算,比咱们已经使用过的任何集群齐多五倍以上。这意味着客户将可以更低的价钱、更快的速率取得更多的智能。有了 Amazon Tranium2 和 Project Rainier,咱们不单是是在构建更快的东谈主工智能,还在构建可膨胀的、值得信托的东谈主工智能。" Tom Brown 示意。
Andy Jassy 在演讲时也屡次谈及"老本",他以为当生成式 AI 运用才智达到一定例模时,诡计老本的枢纽性就突显出来了,人人齐要紧但愿取得更高的性价比,即既能适度好蔓延,也要具备合理的老本结构。据他不雅察,从全球范围来看,那些运用 AI 最为奏效的公司,主要体面前老本秘籍和分娩力栽植方面,而且许多公司在这两方面齐取得了阐扬。但值得一提的是,亚马逊云科技的老本适度,是体面前整场的居品鼎新上,而非肤浅的价钱。
需求导向,实用 AI
若是一定要给亚马逊云科技的 AI 计谋作念一个界说,需求导向的实用 AI 未必更为精准。
"许多时候,东谈主们用上可以的模子作念了些责任,就以为打造出很棒的生成式 AI 运用才智了,但践诺上可能只完成了大略 70% 的责任,而客户不会心爱存在那 30% 问题的运用才智。" Andy Jassy 示意。以亚马逊我方为例,加入生成式 AI 这个"聪惠大脑"之后,亚马逊聊天机器东谈主客户惬意度栽植了 500 个基点,"这即是实用 AI 的体现。" Andy Jassy 说。
客户至尚和逆向责任法,是亚马逊云科技 DNA 的一部分。亚马逊云科技创业初期,由于合规性、审计、监管、安全、加密等考量,大部分的银行客户示意繁盛采用云诡计,但称可能永远不会上云。亚马逊云科技莫得毁灭这些金融客户,而是接下来花了十年来管制银行客户清单上的每一个问题。"今天,我很自爱地说,许多大型金融公司齐是咱们的客户。因此,当你在鼎新时,枢纽的是要记着,你确切要从客户驱动。你要问他们什么对他们枢纽,但你不单是是托福客户条件的东西。你要为他们发明。" Matt 说。
AI 时间亦然同理:要为客户发明好用的 AI 器具。
会上,Swami 博士发布了新一代 Amazon SageMaker。从功能上看,SageMaker AI 与客户的数据强规划,是一个聚首了数据调用、数据分析、大模子教师的一站式平台,定位上发生了首要的变化。
"许多客户向咱们反馈,他们的分析和 AI 责任负载越来越多地围绕相通的数据和相通的责任经过进行交融。这正在改革其对分析工作的概念,因为事实讲明,他们不再只是独处时使用分析和 AI 器具,他们正在使用历史分析数据来教师机器学习模子,何况越来越多地将相通的数据纳入其生成式 AI 运用才智中。" Matt 谈及从一个客户案例中取得的启发。这也不难厚实,因为数据才是企业的中枢钞票,才是各异化的竞争力,而非模子,将企业完全上风的数据和大模子整合在一个平台上,才会有上风。
详细来看,对客户来说,AI 落地的器具越来越多;对亚马逊云科技来说,他们又用一年的期间把 AI 生态这个木桶通盘的木板齐加长了一大截;对行业来说,这个市集又被卷紧了好几圈,竞争的焦点也迟缓从大模子自己回荡到了器具和落地上。
附:亚马逊云科技 re:Invent2024 居品发布全景(笔者现场整理)
(本文首发于钛媒体 APP,作家 | 秦聪敏欧洲杯体育,裁剪 | 刘湘明)