AMD Strix Halo處理器可以說是一款劃時代的產品,尤其是旗艦型號銳龍 AI Max 395,擁有史上最強集顯,可以輕松媲美桌面級RTX 4060獨立顯卡。
但是說它劃時代,遠不只是因為強悍的圖形性能,更是因為它“生逢其時”,恰到好處地順應了本地端側、邊緣側AI推理與應用的發展趨勢,提供了堪稱當下最好的解決方案,甚至沒有之一。
為什么要發展端側AI?簡單地說有三點:數據安全、成本控制、空間友好。
云側AI雖然有著更強的算力性能,但并不是所有的服務和數據都適合上云,比如企業、醫療機構、法律實體的大量內部資料,比如個人的隱私敏感數據、照片、文件。
同時,云側AI往往存在成本過高的問題,尤其是中小企業、個人工作室很難承擔(每一個token都是錢啊)。
另外就是對于一些延遲敏感性應用場景,云側AI也存在很大的局限性。
但是,端側AI也面臨不少問題,尤其是在硬件設備上,消費級筆記本、臺式機算力太弱,大型工作站太貴而且占地方,蘋果很強但生態過于封閉。
Strix Halo精準消滅了以上所有痛點,基于它構建的“迷你AI工作站”,開辟了一個全新品類,完美解決了超大模型的端側/邊緣測部署問題,賦能AI行業應用的最后一公里。
可以說,AMD迷你AI工作站的出現,是優質算力下沉、AI發展趨勢的一次雙向奔赴,從此人人都可以是超級開發者。
Strix Halo處理器有兩個系列,一個是消費級的銳龍AI Max 300系列,一個是商用級的銳龍AI Max Pro 300系列,后者在生命周期、管理性方面更勝一籌。
二者都有全新”Zen5”架構 CPU、RDNA3.5 架構 GPU、XDNA2架構 NPU,其中NPU AI引擎擁有高達50 TOPS的算力。
銳龍 AI Max系列可以搭配最多128GB LPDDR5X-8000統一內存,帶寬高達256GB/s,分配最多96GB作為專屬顯存,從而能在本地直接運行例如GPT-OSS-120B這種千億參數的完整大模型,尤其是對于MoE專家模型可謂得天獨厚。
比如運行Llama4-109B Scout多模態、阿里Qwen3-235B,輸出速度可達每秒14 tokens,運行DeepSeek V3,能超過每秒8 tokens,而已開源的GPT-OSS-120B,更是超過每秒40 tokens。
要知道,以上主流開源大模型的顯存占用普遍在60-80GB,而銳龍AI Max系列擁有最多96GB的海量專屬顯存,正好可以完美滿足,這是任何獨立顯卡都無法媲美的,甚至工作站專業顯卡也望塵莫及!
銳龍AI Max系列能做到這一點,得益于它支持AMD UMA高帶寬統一內存架構。
傳統計算系統中,CPU處理器有自己的RAM內存,容量大但帶寬低,GPU顯卡有自己的VRAM顯存,帶寬高但容量小,彼此是互相獨立的,各自存儲自己的數據,需要交換、傳輸的時候只能走PCIe總線,效率大打折扣。
統一內存架構下,CPU、GPU、NPU三種計算引擎共享同樣的內存空間,實現存算一體,加上LPDDR5X內存可以輕松做到128GB大容量、8000MT/s或更高傳輸率、四個通道,因此無論容量、帶寬還是延遲,都不再是問題。
Strix Halo的產品形態豐富多樣,性能各異,可以靈活滿足不同用戶、不同場景的端側AI推理需求。
迷你AI工作站,也就是今天要說的主角,產品已經極大豐富,有數十款之多。
它們的性能釋放更加充分,可以超過120W,從而在類似迷你機的空間內,帶來頂級臺式機一樣的性能,而且價格普遍只要1.5萬甚至更低,堪稱追求端側AI推理性能最大化的理想之選。
AMD大中華區市場營銷副總裁紀朝暉還透露,已經有伙伴實現兩臺,甚至更多臺銳龍AI Max 395工作站并聯的方案,英國一家公司已經展示了四臺并聯的方案,國內公司也在做兩臺的、四臺的連接方案,主要通過USB4,應該很快就能看到成熟的方案,到時四機并聯的顯存容量最高就可以做到512GB!
其實,AMD一直有著豐富的、領先的工作站平臺產品,無論處理器還是顯卡。
面向頂級塔式工作站,處理器有風光無兩、沒有任何對手的銳龍線程撕裂者PRO 9000系列,最近還發布了首款AI工作站顯卡——Radeon AI PRO R9700。
銳龍AI Max系列則是面向移動工作站,以及新型的迷你工作站,可以本地部署,超大顯存支持更大規模的大模型和更長的上下文,而且有著成熟的x86 Windows生態支持,開發工具更豐富,開發環境更友好。
那么,誰最需要這種迷你AI工作站呢?那可就多了:
個人和企業AI開發者、AI教育與科研、小型企業/單個業務部門/小型工作室、醫療/金融/法律等特定領域專家助手、會議室等邊緣場景、金融/財務/交易研究與決策、數據分析、家庭AI中樞,等等。
這些應用場景的共同特點都是對AI推理性能有較高需求,但是對TCO成本很敏感(無法負擔AI一體機),對隱私安全很敏感(數據不能外流),對設備體積也很敏感(不適合大型塔式工作站)。
如此一來,銳龍AI Max系列迷你AI工作站簡直就是天生為他們而生的。
除了提供強大的硬件解決方案,AMD在軟件和開發生態方面也提供了不遺余力的支持。
一方面是豐富的開發工具,包括自家的AMD ROCm開源軟件框架, Ryzen AI software等開發工具(充分調動CPU/GPU/NPU三大引擎),以及各種第三方資源(一站式開發聚合平臺RIPPLE AI已上線),力圖將其打造成AI時代的樹莓派。
另一方面則是拓展和推進AI應用與場景,為此將充分調動AMD中國AI應用創新聯盟的生態伙伴力量,不斷發展壯大AMD AI生態圈。
在溝通會現場,AMD與合作伙伴特意展示了八臺銳龍AI Max 395迷你AI工作站,統一都有128GB LPDDR5X-8000內存、2TB PCIe 4.0 SSD。
而這些,還只是眾多同類產品中的一小部分。
Abee AI Station 395 Max:
無疑是最特殊的一臺,首款也是唯一采用水冷散熱,特制冷頭直接覆蓋處理器,冷排單個風扇,實測可以做到高達185W性能釋放,而噪音不超過80dB。
體積依舊控制在7.5升,接口提供一個HDMI 2.1、一個DP 1.4、2.5G 10G RJ45雙網口、兩個USB4、一個USB-C 10Gbps、兩個USB-A 10Gbps、三個USB 2.0。
即將上市。
惠普Z2 Mini G1a:
體積僅2.9升,提供兩個miniDP 2.1、2.5G網口、一個雷電4/USB4、一個USB-C(支持供電和DP輸出)、一個USB 10Gbps、一個USB 2.0。
還可選在頂部加配第二個2.5G網口、串口。
價格21999元,是最貴的一個。
希未AideaStation R1:
立式設計,體積小至3升,接口包括HDMI 2.1、DP 1.4 HBR3、兩個USB-C、兩個USB 10Gbps、一個USB 2.0、一個RJ45、一個SD 4.0讀卡器。
價格13999元。
零刻GTR9 Pro:
體積不到3升,接口有一個HDMI 2.1、一個DP 2.1、兩個Intel E610 10G網口、兩個USB4、兩個USB 10Gbps、一個SD 4.0讀卡器。
價格12999元,最便宜的之一。
六聯智能AXB35-02-H02-BQ:
體積約4.5升,長247.5毫米、寬188.4毫米、高96.5毫米。
接口有HDMI 2.1、DP 1.4、2.5G RJ45網口、USB4、USB 3.2、兩個USB 2.0、SD讀卡器。
即將上市。
極摩客EVO-X2:
體積只有大約2.76升,最小巧的之一。
接口有HDMI 2.1、DP 1.4、2.5G網口、RJ45網口、兩個USB4、三個USB 10Gbps、兩個USB 2.0、SD讀卡器、兩個3.5mm音頻口。
14999元。
天鋇NEX395:
體積不到3升,接口有HDMI 2.1、DP 2.1、雙2.5G網口、一個USB4、三個USB 10Gbps、一個USB 2.0。
即將上市。
銘凡MS-S1 MAX:
體積約3.3升,長222.1毫米,寬206.3毫米,高77.1毫米。
最特殊的地方在于,它配備了兩個USB4 v2最新接口,帶寬比USB4翻番高達80Gbps,并支持Alt DP 2.0輸出模式、PD 15W充電。
還有兩個10G萬兆網口,也是獨一檔的存在,甚至提供一條獨立的PCIe x16拓展插槽(帶寬x4)。
其他接口包括HDMI 2.1、兩個USB4(Alt DP 2.0+PD 15W充電)、一個USB 10Gbps、兩個USB 2.0。
即將上市。
AMD CEO蘇姿豐曾說過,AI是50年來最具變革性的技術。
OpenAI聯合創始人Andrej Karpathy最近在一次演講中更是提出,AI Agent智能體將成為AI從對話機器人轉變成生產力工具的關鍵,而2025年將是AI智能體“元十年”的起點(發展十年才能真正成熟),同時我們正在步入提示詞+大模型組成的軟件3.0時代。
“生逢其時”的銳龍AI Max迷你AI工作站,必將是AI康莊大道上的強力助推器!
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。