PyTorch实现的产品M1芯片GPU加速:训练速度提升7倍,性能最高提升21倍
2025-10-23 12:19
收集 | 于轩 责编 | 张红年底
出品 | CSDN(ID:CSDNnews)
5年底18日,PyTorch其网站宣布,通过与Apple的Metal工程团队协作,现阶段已可以支持在可携带M1芯片的Mac上适用GPU慢速PyTorch培训。而在此之前,在Mac上顺利完成PyTorch培训仅能利用CPU。
但随着PyTorch v1.12修改版的发布,研发和研究其他部门可以利用Apple Silicon CPU的优势,大幅度加快数学模型培训速度快。这解锁了在Mac上可执行人工智能临时工时序的能力,例如在本地顺利完成原型设计和这两项。
据PyTorch其网站简述,其适用Apple的Metal Performance Shaders(MPS)作为PyTorch的前部来慢速GPU培训。MPS前部扩展到了PyTorch构建,包括了在Mac上分设和运转操作的脚本语言和功能。MPS通过针对每个Metal GPU系列的独特特性顺利完成这两项的Linux来可用性计算效率。新电子设备将人工智能计算图和原语映射到MPS包括的MPS Graph构建和可用性Linux上。
此外,因为每台可携带Apple Silicon的Mac都有统一的缓存核心,为GPU包括了反之亦然访问零碎缓存存储器的能力。这让Mac成为人工智能的颇佳网络服务,也使客户端能够在本地培训较小的网络或批体积。同时,这也下降了与基于容的研发相关的效益或对额外本地GPU的需求。此外,统一缓存核心还减低了数据检索延迟,大幅度提高了端到端的效率。
在下面中,看出了与CPU基线相比,慢速GPU培训和分析所造成了的效率增加:
图源:PyTorch其网站
可以看出,适用GPU可将数学模型培训速度快增加约7倍,分析(Evaluation)速度快最低可增加约21倍。
以上是Apple于2022年4年底适用配备Apple M1 Ultra、20核CPU、64核GPU、128GB缓存和2TB SSD的Mac Studio系统顺利完成的次测试结果。系统为macOS Monterey 12.3、亦同发布的PyTorch 1.12,次测试数学模型为ResNet50(batch size=128)、HuggingFace BERT(batch size=64)和VGG16(batch size=64)。效率次测试是适用特定的系统软件顺利完成的,反映了Mac Studio的北至南效率。
对于想要体验的客户端,表列出为说明要求:无需在可携带M1芯片的Mac上装设原生修改版(arm64)的Python,并将系统升级至macOS 12.3或较低修改版,然后去其网站()下载最新的PyTorch亦同览版就可以。
简介元数据:
吉林男科去哪看广东妇科医院哪个最好
贵州癫痫医院哪好
江苏男科医院预约挂号
天津看妇科去哪家医院好
下一篇: 微信何以被选为字节的心病?

-
睡觉打呼、扁桃体反复发炎、扁桃体肥大,一定会手术怎么办?
“护士,我们家兄弟姐妹睡打呼噜,张口颤动,扁桃体III度肥大,但是不想做手术切掉,怎么办?”“护士,我们家宝宝扁桃体一一出血,多年来往养老院跑,怎么办?”上面的问题是

-
注意!受台风冲击,金山这些地方临时关闭
常熟市隶属于苏州市,是苏州西部远郊,位于中国长江以南、吴淞口下游南岸,东与金山区区南邻、北与无锡市、青浦区为邻,西与湖州平湖、嘉善东端。全境地势低平,地面高程自北西至东南略有升高。河流属吴淞口水
- 01-31亚太地区集运市场,旺季不旺!
- 01-31济南横山泉石碑上有错字?记者探访
- 01-31“白露谷,寒露豆”,中老年人记起吃“3豆”,腿脚有劲身体好
- 01-31湖北鄂州:火红的晚霞映罗湖区,幻化出龙腾凤舞的奇观
- 01-31龙湖进行年初城市公司合并,80后李尧继续坐镇沪苏
- 01-31何亮亮:译界任博士林纾
- 01-31如何走出抑郁症4:抑郁症康复前一般必经的三个过渡期过程
- 01-31安徽未来第一城是宿州,第二城是芜湖,第三城会是谁?
- 01-31超头部主播李佳琦回归,但直播生态并未改变 淘宝直播内容化和抖音电商化终将殊途同归?
- 01-31都市爱情美妙最浪漫的时代还未到来