英伟达曝AI算力 GPT速度提高30倍

发布时间：2023-03-22 10:02:47 所属栏目：产品来源：

导读：ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后，为 AI 提供心脏的英伟达成了背后的大赢家，也让今年的 GTC 注定成为有史以来最受关注的一届。

「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。

ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后，为 AI 提供心脏的英伟达成了背后的大赢家，也让今年的 GTC 注定成为有史以来最受关注的一届。

「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。

基于英伟达的 Hopper 架构，H100 采用 Transformer 引擎，被设计用于专门处理类似 GPT 这样的模型。与用于 GPT-3 处理的 HGX A100 相比，一个搭载四对 H100 和 NVLINK 的标准服务器的处理速度快 10 倍。根据官网数据，H100 的综合技术创新。可以将大型语言模型的速度提高 30 倍。

此外，在过去的十年里，云计算每年增长 20%，成为一个 1 万亿美元的行业。为了 AI 和云计算，英伟达设计了 Grace CPU，在新的架构下，GPU 负责处理 AI 的工作负载，Grace CPU 负责采样，二者之间通过一个 900 GB/s 的高速传输设备连接在一起。

某种意义上来说，计算成本已经成为今天阻碍生成式 AI 发展的核心问题，OpenAI 为此烧掉了数十亿乃至上百亿美元，微软也出于成本考虑始终没有向更大范围的公众开放Bing，甚至限制用户每天的对话次数。

实际上，这并不是英伟达第一次公布 DGX Cloud。此前英伟达四季报发布时，黄仁勋就向外界透露英伟达将与云服务厂商展开合作，让客户可以通过 NVIDIA DGX云实现 DGX计算机的使用,训练和部署大型语言模型或者完成其它 AI工作负载,并使其可以通过 web浏览器使用 DGX计算机。

英伟达已经与甲骨文展开合作，预计下个季度微软 Azure 也会开始托管 DGX 云，而谷歌云也将在不久之后加入这一行列，以托管的方式向那些有意构建新产品和发展 AI 战略的企业提供 DGX 云服务。

ChatGPT 和 GPT-4 为代表的大语言模型在过去几个月火遍全球，但对英伟达来说，ChatGPT 和大模型并不是 AI 的全部。会上，黄仁勋还分享了更多英伟达在 AI 领域的探索和他本人的观察。

为了加速那些寻求利用生成 AI 的人的工作，英伟达宣布成立 NVIDIA AI Foundations，这是一个云服务和代工厂，面向需要构建、改进和定制 LLM 和生成AI 的用户，这些客户使用其专有数据训练特定领域的 AI。

另一个案例是与芯片公司的合作。随着中美科技战，大多数人都知道了光刻机这个半导体产业的关键设备。但人们却鲜为人知的是,随着制造工艺技术的不断进步,芯片设计上对于算力的需求,也是半导体界的一大痛点。

今天计算光刻是芯片设计和制造领域最大的计算工作负载，每年需要消耗数百亿 CPU 小时，并且随着算法越来越复杂，计算光刻的成本也在提高。

对此，英伟达宣布推出 cuLitho——一个计算光刻库。并与 ASML、台积电等巨头展开合作，能大大降低芯片设计过程中算力的耗损,节省能源并降低能源的排放。

事实上，减少能源消耗，提高计算效率，是黄仁勋眼中 AI 技术将为人类社会带来的另一大价值。而在摩尔定律失效的当下，加速计算和 AI 的到来恰逢其时。

（编辑：汽车网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!