发布时间:2025-09-10 09:31:57 | 浏览量:293
【导语】9月10日,英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX,其独立GPU显存达128GB,具备超强计算与注意力能力,将作为Vera Rubin平台(tái)一(yī)部(bù)分(fēn)于(yú)2026年(nián)底(dǐ)面(miàn)世(shì),英(yīng)伟(wěi)达(dá)称(chēng)其(qí)将(jiāng)为(wèi)客(kè)户(hù)带(dài)来(lái)高(gāo)效(xiào)回(huí)报(bào)。

9 月(yuè) 10 日(rì)消(xiāo)息(xi),英(yīng)伟(wěi)达(dá)宣(xuān)布(bù)推(tuī)出(chū)新(xīn)产(chǎn)品(pǐn)Rubin CPX,这(zhè)是(shì)一(yī)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下(xià)文处(chù)理(lǐ)而(ér)设(shè)计(jì)的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。
该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。
该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。
从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含128GB 的(de) GDDR7 显(xiǎn)存(cún)。英(yīng)伟达承诺,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。
英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了比较,他说:“正如 RTX 革新了图形和物理 AI,Rubin CPX 是首款专为大规(guī)模(mó)上(shàng)下(xià)文 AI 设计的 CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。
英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用(yòng)于(yú)设(shè)备(bèi)端(duān)应(yīng)用(yòng),到(dào) Super 用(yòng)于(yú)单(dān) GPU 设(shè)置(zhì),再(zài)到(dào) Ultra 用(yòng)于(yú)大(dà)型(xíng)数(shù)据(jù)中(zhōng)心(xīn)。
英(yīng)伟(wěi)达(dá)表(biǎo)示(shì),预(yù)计(jì) Rubin CPX 将(jiāng)于(yú)2026 年(nián)底(dǐ)推(tuī)出(chū)。
————THE END