PyTorch实现的产品M1芯片GPU加速:训练速度提升7倍,性能最高提升21倍
2025-10-23 12:19
收集 | 于轩 责编 | 张红年底
出品 | CSDN(ID:CSDNnews)
5年底18日,PyTorch其网站宣布,通过与Apple的Metal工程团队协作,现阶段已可以支持在可携带M1芯片的Mac上适用GPU慢速PyTorch培训。而在此之前,在Mac上顺利完成PyTorch培训仅能利用CPU。
但随着PyTorch v1.12修改版的发布,研发和研究其他部门可以利用Apple Silicon CPU的优势,大幅度加快数学模型培训速度快。这解锁了在Mac上可执行人工智能临时工时序的能力,例如在本地顺利完成原型设计和这两项。
据PyTorch其网站简述,其适用Apple的Metal Performance Shaders(MPS)作为PyTorch的前部来慢速GPU培训。MPS前部扩展到了PyTorch构建,包括了在Mac上分设和运转操作的脚本语言和功能。MPS通过针对每个Metal GPU系列的独特特性顺利完成这两项的Linux来可用性计算效率。新电子设备将人工智能计算图和原语映射到MPS包括的MPS Graph构建和可用性Linux上。
此外,因为每台可携带Apple Silicon的Mac都有统一的缓存核心,为GPU包括了反之亦然访问零碎缓存存储器的能力。这让Mac成为人工智能的颇佳网络服务,也使客户端能够在本地培训较小的网络或批体积。同时,这也下降了与基于容的研发相关的效益或对额外本地GPU的需求。此外,统一缓存核心还减低了数据检索延迟,大幅度提高了端到端的效率。
在下面中,看出了与CPU基线相比,慢速GPU培训和分析所造成了的效率增加:
图源:PyTorch其网站
可以看出,适用GPU可将数学模型培训速度快增加约7倍,分析(Evaluation)速度快最低可增加约21倍。
以上是Apple于2022年4年底适用配备Apple M1 Ultra、20核CPU、64核GPU、128GB缓存和2TB SSD的Mac Studio系统顺利完成的次测试结果。系统为macOS Monterey 12.3、亦同发布的PyTorch 1.12,次测试数学模型为ResNet50(batch size=128)、HuggingFace BERT(batch size=64)和VGG16(batch size=64)。效率次测试是适用特定的系统软件顺利完成的,反映了Mac Studio的北至南效率。
对于想要体验的客户端,表列出为说明要求:无需在可携带M1芯片的Mac上装设原生修改版(arm64)的Python,并将系统升级至macOS 12.3或较低修改版,然后去其网站()下载最新的PyTorch亦同览版就可以。
简介元数据:
吉林男科去哪看广东妇科医院哪个最好
贵州癫痫医院哪好
江苏男科医院预约挂号
天津看妇科去哪家医院好
下一篇: 微信何以被选为字节的心病?
-
浅谈融媒体氛围下记者的转型
楚雄副刊 胡远松 随着开端的变迁和香港媒体高效率的其发展,我国当今世界的接收者生态呈现出了不一样的景观,从单独的传布模式迅速演变为个人化表达方式结合的开端。香港媒体高效率带给的表达
-
让孩子“见证东亚飞天梦”
近来,文化路晩社区积极开展“便是中华飞天梦”基调活动,邀请区科协大学本科人员为辖区内孩童讲解“月球样品001号·便是中华飞天梦”线上展览馆,通过亲手实践,让孩子们体验五彩缤纷的科学全球性。 本