科技新聞

    隨著 AI 推理需求急速增長,傳統 DRAM 與 HBM 在容量、成本與能耗方面的限制逐漸浮現,業界正尋求以高頻寬快閃記憶體(HBF)等新型架構,支撐未來數據中心及邊緣運算發展。Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫文章,深入分析現有記憶體架構的瓶頸,並闡述 HBF 如何透過更高容量、頻寬及能效,重塑 AI 推理時代的儲存解決方案。

    以下內容由 Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫

    人工智能(AI)正席捲整個運算領域,勢不可擋。儘管目前全球僅約七分之一的數據中心具備承載 AI 工作負載的能力,但到 2030 年,這一比例預計將接近 70%。AI 正從超大規模數據中心遷移至企業級數據中心,並進一步部署至網絡邊緣,而邊緣 AI 應用預計將於 2030 年底將創造近 665 億美元的價值。數據是這一全新計算時代的驅動力,海量數據必須高速傳輸至需求迫切且快速擴展的 AI 運算架構中。

    然而,海量內容庫使傳統儲存架構不堪重負,其固有的架構劣勢也徹底顯現。數據中心記憶體(DRAM 及專用高頻寬記憶體 High Bandwidth Memory,HBM)在密度、儲存容量與可擴充度方面,逐漸難以應對大型 AI 模型日益增長的需求。同時,超大規模運算廠商正面對 DRAM 與 HBM 的生產成本攀升、設計複雜度上升及能耗增加。在企業級數據中心與邊緣 AI 應用場景中,這些挑戰更為嚴峻——受限於更小的物理空間,此類場景難以承受持續上漲的記憶體成本與功耗。

    同時,AI 推理亦帶來一些亟待解決的問題。作為當下主流的 AI 工作負載,AI 推理在數據管理方面的要求與 AI 訓練截然不同:推理需要儲存規模持續擴大的 AI 模型,而基於 HBM 與 DRAM 的記憶體方案已難以滿足這些新需求,其在容量與成本可擴展度上存在明顯短板。面對這些差異顯著的記憶體特性,市場亟需專為 AI 推理優化的記憶體技術。

    為何 DRAM 與 HBM 無法滿足 AI 推理工作負載需求?

    要理解為何僅 DRAM 與 HBM 並不適合 AI 的長期部署,可參考以下弊端。這些問題起初只是細微隱患,但若不加以解決,將隨時間推移不斷擴大,最終動搖以 AI 為核心的下一代儲存架構根基。

    密度瓶頸:DRAM 容量擴展已陷入停滯,而支撐 AI 推理所需的容量需求卻持續攀升。

    與 AI 推理不匹配:DRAM 在低時延、隨機存取方面的優勢不適用於 AI 推理。AI 推理的存取模式具確定性,能藉助數據預取等技術對時延有更高包容度。

    針對 AI 推理優化的記憶體架構特性

    規模達 1,200 億美元的 DRAM 產業正面對上述深層矛盾。超大規模服務商在 AI 架構領域的支出預計在 2030 年底達到 6.7 萬億美元,故迫切希望穩固自身在數據中心領域的既有地位。

    如果現在正是合適時機,徹底重新打造一款貼合應用需求的全新儲存解決方案,而非讓應用去適配現有儲存,結果會如何?一款針對 AI 而優化的儲​​存級記憶體應具備以下特性:

    .更大規模且可擴展的記憶體容量,專為推理工作負載配置
    .更高的記憶體密度(GB/mm²)
    .高頻寬,滿足 AI 推理需求
    .更低的系統級功耗
    .高性價比指標(美元 / TB)

    高頻寬快閃記憶體聚焦 AI 數據中心

    高頻寬快閃記憶體(High Bandwidth Flash,HBF™)是一款顛覆性的新型記憶體架構,專為支援推動新一代 AI 運算而設計。HBF 滿足高階運算及數據密集型應用對容量、能耗、吞吐量及可擴充度的核心要求。相較於 HBM,HBF 在維持同等頻寬的前提下,提供更高容量與儲存密度,更貼合 AI 推理的發展趨勢。作為持久性儲存媒介,HBF 在斷電時仍能保留數據,且具備熱穩定性,可支援高溫運行環境。

    為實現這些優勢,HBF 透過優化高頻寬特性與推理記憶體屬性,高效重構 NAND 快閃記憶體,並採用 CMOS 鍵合陣列(CBA)晶圓技術,進一步提升能效與頻寬。

    HBF 重塑面向 AI 應用的 NAND 快閃記憶體

    相較於傳統 NAND 快閃記憶體,HBF 透過並行架構、先進邏輯縮放工藝與客製化堆疊技術,實現更低時延與超高讀取頻寬,讓大語言模型以接近 DRAM 的速度串流讀取數據。

    HBF 亦支援大型 KV 緩存,可高效處理冗長複雜的用戶指令,以及客戶專屬與領域專屬數據,提升 AI 推理準確率。

    以記憶體為中心的 AI 延伸至企業級場景與網絡邊緣

    受密度、成本與功耗限制,HBM 通常無法用於邊緣與移動環境,而 HBF 可憑藉更大儲存容量,實現處理更複雜 AI 推理任務的價值。這為智能手機等邊緣設備打開應用空間,助其能夠即時決策並執行各類複雜任務。憑藉持久性儲存的特點,HBF 支援從歷史查詢中無縫調取過往上下文,以解決新問題。

    HBF 的優勢可同樣延伸至企業級運算場景。這類場景的用戶規模遠小於超大規模數據中心,而依托 HBM 的大型 GPU 叢集成本過高。透過採用搭載 HBF 的加速方案,小型企業有望對大型預訓練模型進行優化,以支援領域專屬應用需求。

    優化的儲存解決方案突破 AI 運算增長的阻礙

    數據中心與邊緣 AI 設備正自主運行,支撐從「晚餐食譜」查詢到「突破性科學發現」等各類任務。網站託管、企業數據管理等常規任務正逐步讓位給依托機器學習、深度學習與資料分析,以產生實用洞察的智能工作負載。

    現今的數據中心與邊緣儲存亟需重新規劃,以支撐大規模推理模型執行預測與生成任務。相較於 HBM,HBF 在具備顯著容量優勢的同時,可提供 AI 推理應用所需的高吞吐量。作為可擴展的全新系統級儲存技術,HBF 有助減少效能瓶頸,加快現代數據中心與邊緣網絡中 AI 應用的洞察生成速度。

    一年一度網絡安全界盛事——由 Palo Alto Networks 舉辦的 Ignite on Tour Hong Kong 2026 圓滿結束。本年度大會以「Secure AI」為核心主題,吸引眾多企業 IT 決策者及網絡安全專家出席。Palo Alto Networks 香港及大灣區董事總經理馮志剛(Wickie)認為,安全是推動 AI 創新的重要基石,企業可透過平台化策略,在可控可視的前提下將「AI Vision Turn Into Reality(AI 願景轉化為現實)」。 

    影子 AI 成企業最大痛點 

    AI 技術急速發展,不少企業希望藉採用 AI 提高競爭力。然而,現階段企業普遍仍對 AI 的準確度及安全性存有疑慮,導致未敢將 AI 應用於關鍵業務系統,「企業可能未用,但員工可能會用」,催生出影子 AI(Shadow AI)的問題。 

    他以日常使用生成式 AI 為例,員工透過瀏覽器使用各大科技公司提供的 GenAI 工具時,企業往往難以掌握用戶輸入了甚麼資料,甚至是否涉及敏感數據上載。此外,數據在傳輸及處理過程中亦可能面對惡意攻擊風險。Wickie 認為,企業首要建立的是「可視性」——包括是否掌握影子 AI 的存在,以及能否全面了解內部 AI 使用情況,從而制定清晰的 AI 管治策略。 

    不過,AI 的運作多發生於 API 及對話層面,傳統以網絡為本的安全架構(Network-based Security)已未必足夠。因此,企業需要進一步強化「代理型端點安全」(Agentic Endpoint Security, AES)。Palo Alto Networks 早前完成收購以色列公司 Koi,正是為加強 AES 能力,並將與 Cortex Endpoint Agent 深度整合,提升對 AI 行為的監察與防護。 

    另一方面,隨著 AI Agent 逐步融入業務流程,「身分」正迅速成為攻擊者的主要切入點。Palo Alto Networks 近期收購身分安全龍頭 CyberArk,亦標誌著其正式將 Identity Security 納入平台化戰略核心,進一步鞏固整體安全版圖。 

    Palo Alto Networks 大中華區副總裁陳文俊 Adrian(右),以及Palo Alto Networks 香港及大灣區董事總經理馮志剛 Wickie,在 Ignite on Tour Hong Kong 2026 活動中擔任演講者,向來賓分析 AI 應用普及下,為網絡安全帶來的複雜環境。

    安全瀏覽器如貼身保鑣 

    在實際部署層面,Wickie 指出,企業推動 AI 時需同時兼顧三大範疇安全,包括 AI SaaS 應用、企業自行開發的 AI 工具,以及 AI Agent。Wickie 提醒,這類基礎建設不一定建在自家數據中心,企業需要一個如 Prisma AIRS 全面的平台,提供中間端對端(end-to-end)的管理,維持安全姿態(Posture)、資料安全、權限控制等。 

    值得一提的是,Prisma AIRS 更可透過 AI Agent 自動進行 Red Teaming 測試,即持續模擬攻擊場景,主動發現潛在漏洞,令企業在 AI 時代下維持更高的防禦能力。 

    從用戶層面出發, Wickie 則建議企業部署安全瀏覽器(Secure Browser),作為最直接且有效的 AI 管控方式。透過安全瀏覽器,企業可以清楚掌握員工的數據上載行為,並識別未經授權的 AI 使用情況,大幅提升透明度與管治能力。他形容:「就好似有個 bodyguard,無論員工去到邊,都可以受到保護。」 

     Ignite on Tour Hong Kong 2026 作為一年一度網絡安全界盛事,吸引眾多企業 IT 決策者及網絡安全專家出席。

    三大平台互相協作 整合數據及能力 

    談到整體策略, Palo Alto Networks 早在數年前已提倡平台化(Platformization)概念,Wickie 直言:「Product bundle 唔代表係 Platform。」他解釋,要達致平台化,不單單是最基本的數據交換,以 Security Operation 為例,包含終端(End point)、SIEM、自動化、威脅情報等工具,能夠在同一界面使用多個功能,將數據及能力完全整合,才是真正的平台化。 

    目前,Palo Alto Networks 已建立三大平台,包括網絡安全(Strata)、安全營運及雲端(Cortex),以及身分安全(CyberArk),並透過 AI 驅動的 Precision AI 作為核心引擎,加快分析與回應速度,同時促進跨平台協作,形成更完整的安全生態。 

    面對「既要用 AI,又要確保安全」的挑戰,Wickie 認為關鍵在於先釐清 AI 風險,並明確設定應用目標。他指出,不少企業高層已理解 AI 的潛在風險,但往往對 AI 能力抱有過高期望,「AI 唔係萬能,你要清楚定義佢可以做到去邊」。當企業能準確界定 AI 的角色與範圍,自然更容易建立相應的安全策略,實現創新與風險之間的平衡。 

    隨著 AI 推理需求急速增長,傳統 DRAM 與 HBM 在容量、成本與能耗方面的限制逐漸浮現,業界正尋求以高頻寬快閃記憶體(HBF)等新型架構,支撐未來數據中心及邊緣運算發展。Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫文章,深入分析現有記憶體架構的瓶頸,並闡述 HBF 如何透過更高容量、頻寬及能效,重塑 AI 推理時代的儲存解決方案。

    以下內容由 Sandisk 執行副總裁兼首席技術總監 Alper Ilkbahar 撰寫

    人工智能(AI)正席捲整個運算領域,勢不可擋。儘管目前全球僅約七分之一的數據中心具備承載 AI 工作負載的能力,但到 2030 年,這一比例預計將接近 70%。AI 正從超大規模數據中心遷移至企業級數據中心,並進一步部署至網絡邊緣,而邊緣 AI 應用預計將於 2030 年底將創造近 665 億美元的價值。數據是這一全新計算時代的驅動力,海量數據必須高速傳輸至需求迫切且快速擴展的 AI 運算架構中。

    然而,海量內容庫使傳統儲存架構不堪重負,其固有的架構劣勢也徹底顯現。數據中心記憶體(DRAM 及專用高頻寬記憶體 High Bandwidth Memory,HBM)在密度、儲存容量與可擴充度方面,逐漸難以應對大型 AI 模型日益增長的需求。同時,超大規模運算廠商正面對 DRAM 與 HBM 的生產成本攀升、設計複雜度上升及能耗增加。在企業級數據中心與邊緣 AI 應用場景中,這些挑戰更為嚴峻——受限於更小的物理空間,此類場景難以承受持續上漲的記憶體成本與功耗。

    同時,AI 推理亦帶來一些亟待解決的問題。作為當下主流的 AI 工作負載,AI 推理在數據管理方面的要求與 AI 訓練截然不同:推理需要儲存規模持續擴大的 AI 模型,而基於 HBM 與 DRAM 的記憶體方案已難以滿足這些新需求,其在容量與成本可擴展度上存在明顯短板。面對這些差異顯著的記憶體特性,市場亟需專為 AI 推理優化的記憶體技術。

    為何 DRAM 與 HBM 無法滿足 AI 推理工作負載需求?

    要理解為何僅 DRAM 與 HBM 並不適合 AI 的長期部署,可參考以下弊端。這些問題起初只是細微隱患,但若不加以解決,將隨時間推移不斷擴大,最終動搖以 AI 為核心的下一代儲存架構根基。

    密度瓶頸:DRAM 容量擴展已陷入停滯,而支撐 AI 推理所需的容量需求卻持續攀升。

    與 AI 推理不匹配:DRAM 在低時延、隨機存取方面的優勢不適用於 AI 推理。AI 推理的存取模式具確定性,能藉助數據預取等技術對時延有更高包容度。

    針對 AI 推理優化的記憶體架構特性

    規模達 1,200 億美元的 DRAM 產業正面對上述深層矛盾。超大規模服務商在 AI 架構領域的支出預計在 2030 年底達到 6.7 萬億美元,故迫切希望穩固自身在數據中心領域的既有地位。

    如果現在正是合適時機,徹底重新打造一款貼合應用需求的全新儲存解決方案,而非讓應用去適配現有儲存,結果會如何?一款針對 AI 而優化的儲​​存級記憶體應具備以下特性:

    .更大規模且可擴展的記憶體容量,專為推理工作負載配置
    .更高的記憶體密度(GB/mm²)
    .高頻寬,滿足 AI 推理需求
    .更低的系統級功耗
    .高性價比指標(美元 / TB)

    高頻寬快閃記憶體聚焦 AI 數據中心

    高頻寬快閃記憶體(High Bandwidth Flash,HBF™)是一款顛覆性的新型記憶體架構,專為支援推動新一代 AI 運算而設計。HBF 滿足高階運算及數據密集型應用對容量、能耗、吞吐量及可擴充度的核心要求。相較於 HBM,HBF 在維持同等頻寬的前提下,提供更高容量與儲存密度,更貼合 AI 推理的發展趨勢。作為持久性儲存媒介,HBF 在斷電時仍能保留數據,且具備熱穩定性,可支援高溫運行環境。

    為實現這些優勢,HBF 透過優化高頻寬特性與推理記憶體屬性,高效重構 NAND 快閃記憶體,並採用 CMOS 鍵合陣列(CBA)晶圓技術,進一步提升能效與頻寬。

    HBF 重塑面向 AI 應用的 NAND 快閃記憶體

    相較於傳統 NAND 快閃記憶體,HBF 透過並行架構、先進邏輯縮放工藝與客製化堆疊技術,實現更低時延與超高讀取頻寬,讓大語言模型以接近 DRAM 的速度串流讀取數據。

    HBF 亦支援大型 KV 緩存,可高效處理冗長複雜的用戶指令,以及客戶專屬與領域專屬數據,提升 AI 推理準確率。

    以記憶體為中心的 AI 延伸至企業級場景與網絡邊緣

    受密度、成本與功耗限制,HBM 通常無法用於邊緣與移動環境,而 HBF 可憑藉更大儲存容量,實現處理更複雜 AI 推理任務的價值。這為智能手機等邊緣設備打開應用空間,助其能夠即時決策並執行各類複雜任務。憑藉持久性儲存的特點,HBF 支援從歷史查詢中無縫調取過往上下文,以解決新問題。

    HBF 的優勢可同樣延伸至企業級運算場景。這類場景的用戶規模遠小於超大規模數據中心,而依托 HBM 的大型 GPU 叢集成本過高。透過採用搭載 HBF 的加速方案,小型企業有望對大型預訓練模型進行優化,以支援領域專屬應用需求。

    優化的儲存解決方案突破 AI 運算增長的阻礙

    數據中心與邊緣 AI 設備正自主運行,支撐從「晚餐食譜」查詢到「突破性科學發現」等各類任務。網站託管、企業數據管理等常規任務正逐步讓位給依托機器學習、深度學習與資料分析,以產生實用洞察的智能工作負載。

    現今的數據中心與邊緣儲存亟需重新規劃,以支撐大規模推理模型執行預測與生成任務。相較於 HBM,HBF 在具備顯著容量優勢的同時,可提供 AI 推理應用所需的高吞吐量。作為可擴展的全新系統級儲存技術,HBF 有助減少效能瓶頸,加快現代數據中心與邊緣網絡中 AI 應用的洞察生成速度。