PyTorch实现的产品M1芯片GPU加速：训练速度提升7倍，性能最高提升21倍

2025-10-23 12:19

收集 | 于轩责编 | 张红年底

出品 | CSDN（ID：CSDNnews）

5年底18日，PyTorch其网站宣布，通过与Apple的Metal工程团队协作，现阶段已可以支持在可携带M1芯片的Mac上适用GPU慢速PyTorch培训。而在此之前，在Mac上顺利完成PyTorch培训仅能利用CPU。

但随着PyTorch v1.12修改版的发布，研发和研究其他部门可以利用Apple Silicon CPU的优势，大幅度加快数学模型培训速度快。这解锁了在Mac上可执行人工智能临时工时序的能力，例如在本地顺利完成原型设计和这两项。

据PyTorch其网站简述，其适用Apple的Metal Performance Shaders（MPS）作为PyTorch的前部来慢速GPU培训。MPS前部扩展到了PyTorch构建，包括了在Mac上分设和运转操作的脚本语言和功能。MPS通过针对每个Metal GPU系列的独特特性顺利完成这两项的Linux来可用性计算效率。新电子设备将人工智能计算图和原语映射到MPS包括的MPS Graph构建和可用性Linux上。

此外，因为每台可携带Apple Silicon的Mac都有统一的缓存核心，为GPU包括了反之亦然访问零碎缓存存储器的能力。这让Mac成为人工智能的颇佳网络服务，也使客户端能够在本地培训较小的网络或批体积。同时，这也下降了与基于容的研发相关的效益或对额外本地GPU的需求。此外，统一缓存核心还减低了数据检索延迟，大幅度提高了端到端的效率。

在下面中，看出了与CPU基线相比，慢速GPU培训和分析所造成了的效率增加：

图源：PyTorch其网站

可以看出，适用GPU可将数学模型培训速度快增加约7倍，分析（Evaluation）速度快最低可增加约21倍。

以上是Apple于2022年4年底适用配备Apple M1 Ultra、20核CPU、64核GPU、128GB缓存和2TB SSD的Mac Studio系统顺利完成的次测试结果。系统为macOS Monterey 12.3、亦同发布的PyTorch 1.12，次测试数学模型为ResNet50（batch size=128）、HuggingFace BERT（batch size=64）和VGG16（batch size=64）。效率次测试是适用特定的系统软件顺利完成的，反映了Mac Studio的北至南效率。

对于想要体验的客户端，表列出为说明要求：无需在可携带M1芯片的Mac上装设原生修改版（arm64）的Python，并将系统升级至macOS 12.3或较低修改版，然后去其网站（）下载最新的PyTorch亦同览版就可以。

简介元数据：

吉林男科去哪看
广东妇科医院哪个最好
贵州癫痫医院哪好
江苏男科医院预约挂号
天津看妇科去哪家医院好

上一篇：红米5G千元手机已经发布，这些性能世人你的期待

下一篇：微信何以被选为字节的心病？