英伟达曝AI算力 GPT速度提高30倍
发布时间:2023-03-22 10:02:47 所属栏目:产品 来源:
导读:ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后,为 AI 提供心脏的英伟达成了背后的大赢家,也让今年的 GTC 注定成为有史以来最受关注的一届。
「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。
「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。
ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后,为 AI 提供心脏的英伟达成了背后的大赢家,也让今年的 GTC 注定成为有史以来最受关注的一届。 「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。 基于英伟达的 Hopper 架构,H100 采用 Transformer 引擎,被设计用于专门处理类似 GPT 这样的模型。与用于 GPT-3 处理的 HGX A100 相比,一个搭载四对 H100 和 NVLINK 的标准服务器的处理速度快 10 倍。根据官网数据,H100 的综合技术创新。可以将大型语言模型的速度提高 30 倍。 此外,在过去的十年里,云计算每年增长 20%,成为一个 1 万亿美元的行业。为了 AI 和 云计算,英伟达设计了 Grace CPU,在新的架构下,GPU 负责处理 AI 的工作负载,Grace CPU 负责采样,二者之间通过一个 900 GB/s 的高速传输设备连接在一起。 某种意义上来说,计算成本已经成为今天阻碍生成式 AI 发展的核心问题,OpenAI 为此烧掉了数十亿乃至上百亿美元,微软也出于成本考虑始终没有向更大范围的公众开放Bing,甚至限制用户每天的对话次数。 实际上,这并不是英伟达第一次公布 DGX Cloud。此前英伟达四季报发布时,黄仁勋就向外界透露英伟达将与云服务厂商展开合作,让客户可以通过 NVIDIA DGX云实现 DGX计算机的使用,训练和部署大型语言模型或者完成其它 AI工作负载,并使其可以通过 web浏览器使用 DGX计算机。 英伟达已经与甲骨文展开合作,预计下个季度微软 Azure 也会开始托管 DGX 云,而谷歌云也将在不久之后加入这一行列,以托管的方式向那些有意构建新产品和发展 AI 战略的企业提供 DGX 云服务。 ChatGPT 和 GPT-4 为代表的大语言模型在过去几个月火遍全球,但对英伟达来说,ChatGPT 和大模型并不是 AI 的全部。会上,黄仁勋还分享了更多英伟达在 AI 领域的探索和他本人的观察。 为了加速那些寻求利用生成 AI 的人的工作,英伟达宣布成立 NVIDIA AI Foundations,这是一个云服务和代工厂,面向需要构建、改进和定制 LLM 和生成AI 的用户,这些客户使用其专有数据训练特定领域的 AI。 另一个案例是与芯片公司的合作。随着中美科技战,大多数人都知道了光刻机这个半导体产业的关键设备。但人们却鲜为人知的是,随着制造工艺技术的不断进步,芯片设计上对于算力的需求,也是半导体界的一大痛点。 今天计算光刻是芯片设计和制造领域最大的计算工作负载,每年需要消耗数百亿 CPU 小时,并且随着算法越来越复杂,计算光刻的成本也在提高。 对此,英伟达宣布推出 cuLitho——一个计算光刻库。并与 ASML、台积电等巨头展开合作,能大大降低芯片设计过程中算力的耗损,节省能源并降低能源的排放。 事实上,减少能源消耗,提高计算效率,是黄仁勋眼中 AI 技术将为人类社会带来的另一大价值。而在摩尔定律失效的当下,加速计算和 AI 的到来恰逢其时。 (编辑:汽车网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐