AI推理|驅動儲存大變革 Sandisk高層解析HBF新架構潛力

    隨著 AI 推理需求急速增長,傳統 DRAM 與 HBM 在容量、成本與能耗方面的限制逐漸浮現,業界正尋求以高頻寬快閃記憶體(HBF)等新型架構,支撐未來數據中心及邊緣運算發展。Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫文章,深入分析現有記憶體架構的瓶頸,並闡述 HBF 如何透過更高容量、頻寬及能效,重塑 AI 推理時代的儲存解決方案。

    以下內容由 Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫

    人工智能(AI)正席捲整個運算領域,勢不可擋。儘管目前全球僅約七分之一的數據中心具備承載 AI 工作負載的能力,但到 2030 年,這一比例預計將接近 70%。AI 正從超大規模數據中心遷移至企業級數據中心,並進一步部署至網絡邊緣,而邊緣 AI 應用預計將於 2030 年底將創造近 665 億美元的價值。數據是這一全新計算時代的驅動力,海量數據必須高速傳輸至需求迫切且快速擴展的 AI 運算架構中。

    然而,海量內容庫使傳統儲存架構不堪重負,其固有的架構劣勢也徹底顯現。數據中心記憶體(DRAM 及專用高頻寬記憶體 High Bandwidth Memory,HBM)在密度、儲存容量與可擴充度方面,逐漸難以應對大型 AI 模型日益增長的需求。同時,超大規模運算廠商正面對 DRAM 與 HBM 的生產成本攀升、設計複雜度上升及能耗增加。在企業級數據中心與邊緣 AI 應用場景中,這些挑戰更為嚴峻——受限於更小的物理空間,此類場景難以承受持續上漲的記憶體成本與功耗。

    同時,AI 推理亦帶來一些亟待解決的問題。作為當下主流的 AI 工作負載,AI 推理在數據管理方面的要求與 AI 訓練截然不同:推理需要儲存規模持續擴大的 AI 模型,而基於 HBM 與 DRAM 的記憶體方案已難以滿足這些新需求,其在容量與成本可擴展度上存在明顯短板。面對這些差異顯著的記憶體特性,市場亟需專為 AI 推理優化的記憶體技術。

    為何 DRAM 與 HBM 無法滿足 AI 推理工作負載需求?

    要理解為何僅 DRAM 與 HBM 並不適合 AI 的長期部署,可參考以下弊端。這些問題起初只是細微隱患,但若不加以解決,將隨時間推移不斷擴大,最終動搖以 AI 為核心的下一代儲存架構根基。

    密度瓶頸:DRAM 容量擴展已陷入停滯,而支撐 AI 推理所需的容量需求卻持續攀升。

    與 AI 推理不匹配:DRAM 在低時延、隨機存取方面的優勢不適用於 AI 推理。AI 推理的存取模式具確定性,能藉助數據預取等技術對時延有更高包容度。

    針對 AI 推理優化的記憶體架構特性

    規模達 1,200 億美元的 DRAM 產業正面對上述深層矛盾。超大規模服務商在 AI 架構領域的支出預計在 2030 年底達到 6.7 萬億美元,故迫切希望穩固自身在數據中心領域的既有地位。

    如果現在正是合適時機,徹底重新打造一款貼合應用需求的全新儲存解決方案,而非讓應用去適配現有儲存,結果會如何?一款針對 AI 而優化的儲​​存級記憶體應具備以下特性:

    .更大規模且可擴展的記憶體容量,專為推理工作負載配置
    .更高的記憶體密度(GB/mm²)
    .高頻寬,滿足 AI 推理需求
    .更低的系統級功耗
    .高性價比指標(美元 / TB)

    高頻寬快閃記憶體聚焦 AI 數據中心

    高頻寬快閃記憶體(High Bandwidth Flash,HBF™)是一款顛覆性的新型記憶體架構,專為支援推動新一代 AI 運算而設計。HBF 滿足高階運算及數據密集型應用對容量、能耗、吞吐量及可擴充度的核心要求。相較於 HBM,HBF 在維持同等頻寬的前提下,提供更高容量與儲存密度,更貼合 AI 推理的發展趨勢。作為持久性儲存媒介,HBF 在斷電時仍能保留數據,且具備熱穩定性,可支援高溫運行環境。

    為實現這些優勢,HBF 透過優化高頻寬特性與推理記憶體屬性,高效重構 NAND 快閃記憶體,並採用 CMOS 鍵合陣列(CBA)晶圓技術,進一步提升能效與頻寬。

    HBF 重塑面向 AI 應用的 NAND 快閃記憶體

    相較於傳統 NAND 快閃記憶體,HBF 透過並行架構、先進邏輯縮放工藝與客製化堆疊技術,實現更低時延與超高讀取頻寬,讓大語言模型以接近 DRAM 的速度串流讀取數據。

    HBF 亦支援大型 KV 緩存,可高效處理冗長複雜的用戶指令,以及客戶專屬與領域專屬數據,提升 AI 推理準確率。

    以記憶體為中心的 AI 延伸至企業級場景與網絡邊緣

    受密度、成本與功耗限制,HBM 通常無法用於邊緣與移動環境,而 HBF 可憑藉更大儲存容量,實現處理更複雜 AI 推理任務的價值。這為智能手機等邊緣設備打開應用空間,助其能夠即時決策並執行各類複雜任務。憑藉持久性儲存的特點,HBF 支援從歷史查詢中無縫調取過往上下文,以解決新問題。

    HBF 的優勢可同樣延伸至企業級運算場景。這類場景的用戶規模遠小於超大規模數據中心,而依托 HBM 的大型 GPU 叢集成本過高。透過採用搭載 HBF 的加速方案,小型企業有望對大型預訓練模型進行優化,以支援領域專屬應用需求。

    優化的儲存解決方案突破 AI 運算增長的阻礙

    數據中心與邊緣 AI 設備正自主運行,支撐從「晚餐食譜」查詢到「突破性科學發現」等各類任務。網站託管、企業數據管理等常規任務正逐步讓位給依托機器學習、深度學習與資料分析,以產生實用洞察的智能工作負載。

    現今的數據中心與邊緣儲存亟需重新規劃,以支撐大規模推理模型執行預測與生成任務。相較於 HBM,HBF 在具備顯著容量優勢的同時,可提供 AI 推理應用所需的高吞吐量。作為可擴展的全新系統級儲存技術,HBF 有助減少效能瓶頸,加快現代數據中心與邊緣網絡中 AI 應用的洞察生成速度。

    #AI #Sandisk

    相關文章