您的位置：首页 >访谈 >

特斯拉D1 AI芯片细节盘点：500亿晶体管、400W热设计功耗

时间：2021-08-22 21:46:07 | 来源：cnBeta

原标题：特斯拉D1 AI芯片细节盘点：500亿晶体管、400W热设计功耗来源：快科技

近日的特斯拉AI日活动上，特斯拉公布了最新的AI训练芯片“D1”，规模庞大，令人称奇。该芯片采用台积电7nm工艺制造，核心面积达645平方毫米，仅次于NVIDIA Ampere架构的超级计算核心A100(826平方毫米)、AMD CDNA2架构的下代计算核心Arcturus(750平方毫米左右)，集成了多达500亿个晶体管，相当于Intel Ponte Vecchio计算芯片的一半。

其内部走线，长度超过11英里，也就是大约18公里。

它集成了四个64位超标量CPU核心，拥有多达354个训练节点，特别用于8×8乘法，支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式，都是AI训练相关的。

特斯拉称，D1芯片的FP32单精度浮点计算性能达22.6TFlops(每秒22.6万亿次)，BF16/CFP8计算性能则可达362TFlops(每秒362万亿次)。

为了支撑AI训练的扩展性，它的互连带宽非常惊人，最高可达10TB/s，由多达576个通道组成，每个通道的带宽都有112Gbps。

而实现这一切，热设计功耗仅为400W。

特斯拉D1芯片可通过DIP(Dojo接口处理器)进行互连，25颗组成一个训练单元(Training Tile)，而且多个训练单元可以继续互连，单个对外带宽高达36TB/s，每个方向都是9TB/s。

如此庞然大物，耗电量和发热都是相当可怕的，电流达18000A，覆盖一个长方体散热方案，散热能力高达15kW。

特斯拉展示了实验室内部的一个训练单元，运行频率2GHz，计算性能最高9PFlops(每秒9千万亿次)。

特斯拉还用D1芯片，打造了一台AI超级计算机“ExaPOD”，配备120个训练单元、3000颗D1芯片、1062000个训练节点，FP16/CFP8训练性能峰值1.1EFlops(每秒110亿亿次计算)。

建成后，它将是世界上最快的AI超算，对比特斯拉现在基于NVIDIA方案的超算，成本差不多，但拥有4倍的性能、1.3倍的能效比、1/5的体积。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

猜你喜欢

相关推荐

最新推荐

火爆！“面条经济”沸腾了！门店数涨涨涨涨！为啥成资本“香饽饽”？能否跑出餐饮巨头？

火爆！“面条经济”沸腾了！门店数涨涨涨涨！为啥成资本“香饽饽”？能否跑出餐饮巨头？

江苏宜兴：有序开放文化旅游体育等经营场所

江苏宜兴：有序开放文化旅游体育等经营场所

房地产中介会被“取缔”吗？

房地产中介会被“取缔”吗？

三大运营商将齐聚，中国移动披露招股说明书，回A拟募560亿

三大运营商将齐聚，中国移动披露招股说明书，回A拟募560亿

比亚迪半导体遭遇飞来横祸，队友拖累上市意外中止

比亚迪半导体遭遇飞来横祸，队友拖累上市意外中止

新型毒品伪报“保健品” 固体废纸伪报正常货物多地海关严查入境物品

新型毒品伪报“保健品” 固体废纸伪报正常货物多地海关严查入境物品

美国从阿富汗疏散人员的行动，又受到ISIS威胁了？！

美国从阿富汗疏散人员的行动，又受到ISIS威胁了？！

河南发布暴雨红色预警 22日8地部分地区大暴雨

河南发布暴雨红色预警 22日8地部分地区大暴雨

热门文章

精彩内容

警惕！近30年来中国居民死亡十大原因，排第二的疾病是它！这些人是高危人群→

2021-08-22
被裹挟的“自动驾驶”

2021-08-22
邮件显示如果V社不掺和 Epic计划占领一半的PC游戏市场

2021-08-22
瑞典首相勒文表示将在今年11月辞去首相职务

2021-08-22
宁夏清水营煤矿冒顶事故救援进展：井下被困人员向家人报平安

2021-08-22
塔利班请求俄罗斯大使馆出面，与阿富汗北部武装团体议和

2021-08-22
台当局，继续疯。

2021-08-22
伤害不大，羞辱极强！塔利班这一做法把美国人气炸

2021-08-22