近日,闪迪 SanDisk公布了一项新专利HBF,可能是存储史上的一个重要转折,先科普一下什么叫存储角,AI跑大模型的时候,数据要从存储里读到计算芯片里,但存储的速度追不上芯片,导致算力被浪费。这就是AI行业头疼了十几年的存储墙。

之前行业的解法是HBM,但HBM单组容量只有32~64 GB, 跑万亿参数大模型至少需要64HBM堆叠,功耗和成本都极高。闪迪的新思路是直接用NAND闪存堆叠在计算芯片正下方,配合HBM一起工作,最高能到4 TB, HBM64倍。

这意味着什么?单个AI GPU就能跑1.8万亿参数的大模型推理,首次令牌生成时间降低41倍,存储终于从 等算力变成了 喂算力

为此,闪迪正积极探索新方案,先是推出HBF高带宽闪存方案,模仿HBM垂直堆叠思路,依靠TSV硅通孔多层互联,将多个NAND层垂直堆叠,HBF单堆容量最高可达4TB,明显高于当前HBM水平。

不过,该方案目前仅停留在专利阶段,封装复杂度、散热功耗、量产成本都是待攻克难题,商业化面临多重挑战。

该方案的关键在于CBA堆叠工艺。CBA全称CMOS directly Bonded to Array(控制电路直接键合存储阵列),是闪迪和铠侠联合研发的新一代3D闪存堆叠技术,其优势在于,存储与控制晶圆分开制作,互不干扰,闪存堆叠层数、读写性能大幅提升,但对晶圆纳米级贴合精度要求极高,设备与双片硅片将大幅拉高制造成本,量产良率管控难度大。

另外,根据美股大数据 StockWe.com 获悉,成本问题同样严峻,初步估算采用该架构的AI加速器单价将上涨40%,这可能限制其在消费级市场的推广。散热设计也需要重新构建,垂直堆叠结构无疑会增加热点密度。

你们觉得这项专利会是它冲击AI存储市场的王牌吗?

Fullscreen Image