新闻
起首:机器之心Pro开yun体育网
机器之心报说念
剪辑:泽南、杜伟
老黄:科技公司的芯片需求让我夜不行寐。
「咱们的 Blackwell 芯片存在遐想颓势,固然不错平日使用,但该遐想颓势导致良率低下,」黄仁勋浮现。「这 100% 是英伟达的错。」
自 3 月份发布以来,环球科技公司齐在放浪求购的 Blackwell AI 芯片,似乎终于要到了出货的时辰。
本周三,在与高盛(Goldman Sachs)进行的会议中,英伟达浮现 Blackwell GPU 中影响良率的遐想颓势已宣告建造,B100/B200 搞定器的纠正版行将干涉量产。
据路透社等外媒报说念,英伟达 CEO 黄仁勋本周承认,该颓势系数由英伟达变成,并浮现该面前已在台积电的实时匡助下建造了颓势。
本年 8 月,当联系英伟达最新一代芯片 Blackwell 遐想颓势的第一批报说念出刻下,一些媒体称台积电容许担包袱 —— 并示意这可能导致英伟达与其代工相助伙伴之间的关系垂危。
黄仁勋浮现,事实并非如斯。他还挑剔了联系两家公司关系垂危的报说念,并称其为「假新闻」。为了让 Blackwell 预计打算开垦平日责任,英伟达遐想了七种不同类型的芯片,并同期干涉出产。
英伟达的 Blackwell 芯片接受全新一代架构,台积电 4NP 工艺打造,领有 2080 亿个晶体管,在实施大模子推理等任务时后果较前代晋升了 30 倍,因而备受科技公司期待。
此种面积的芯片,光显不行再通过传统表情来打造。Blackwell 的 B100 和 B200 GPU 两个型号使用台积电的 CoWoS-L 封装时期连气儿两个芯片,该时期依赖于配备局部硅互连(LSI)桥接器的 RDL 中介层(以驱散约 10 TB/s 的数据传输速率)。
英伟达浮现,双芯片的 GPU 莫得内存局部性问题或缓存问题,CUDA 将其视为单块 GPU,可见这些芯片的桥接器至关伏击。但是,GPU 芯片、LSI 桥接器、RDL 中介层和主板基板之间的热推广特质可能不匹配,导致系统蜿蜒和故障。
图源:Nvidia
因此,英伟达在 8 月承认了其 Blackwell GPU 的良品率低,需要修改 GPU 硅片的顶部金属层和凸片,以提高出产良率。其时,英伟达在一份声明中浮现,「公司如故对 Blackwell GPU 的掩膜实施了建造。」
不外,英伟达也重申,公司在第二季度与客户一齐对 Blackwell GPU 进行了抽样查验,并承认必老出产「低良率 Blackwell 材料」才气心仪对 Blackwell 搞定器的需求。
同期,黄仁勋在 2025 财年第二季度财报电话会议上浮现,公司针对 Blackwell B100 和 B200 GPU 的遐想进行了通盘必要的变更,从而有望在第四季度驱散量产。
英伟达 Blackwell GPU 不同型号的参数规格。
其果真半导体行业中,影响良率的 bug 以及要紧功能问题并不是什么簇新事。经常,公司通过修改金属层(或两层)等新步进(stepping)来建造这些问题。
据此前报说念,英特尔的 Sapphire Rapids 有 500 个 bug。因此,英特尔发布了粗略十几个步进来建造通盘 bug(其中五个是基础重置)。每个新步进粗略需要三个月才气完成(包括识别问题、建造问题和出产新版块芯片)。
图源:Intel
从这少许来看,英伟达和台积电建造 Blackwell GPU 的速率果真令东说念主印象长远。
面前,已建造的用于 AI 和超等预计打算机的 Blackwell GPU 瞻望将于最近几天干涉量产,并在 2025 年头启动发货(仍在英伟达 2025 财年内)。
此外,字据英伟达在本年头裸露的音信,AWS、谷歌、Meta 和微软是其主要客户(算计收入占比高达 40%),为心仪他们对其新一代 AI 算力的需求,该公司必须在本年度出货一些当先低良率的 Blackwell GPU。不外,2024 年究竟会有若干 Blackwell GPU 被「送」往数据中心,咱们不知所以。
周三好意思股收盘,刚刚创下历史新高的英伟达股票收跌 2.81 %,回落到 140 好意思元以下。
参考实质:
https://www.tomshardware.com/pc-components/gpus/nvidia-adresses-significant-blackwell-yield-issues-production-ramp-in-q4
https://www.reuters.com/technology/artificial-intelligence/nvidias-design-flaw-with-blackwell-ai-chips-now-fixed-ceo-says-2024-10-23/
https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-jensen-huang-admits-ai-chip-design-flaw-was-100-percent-nvidias-fault-tsmc-not-to-blame-now-fixed-blackwell-chips-are-in-production开yun体育网