奧推網

選單
文化

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

就在上週,摩爾執行緒舉行了 2022 秋季釋出會,推出了首款支援 Windows 環境和 DirectX 圖形介面的國產顯示卡產品 MTTS80、全新多功能 GPU 晶片“春曉”、面向伺服器應用的 MTT S3000,以及元計算一體機 MCCX。

筆者一開始以為,這次會是一場“PPT 釋出會”。因為這次摩爾執行緒的步子實在邁的太大。但沒想到就在一週後,這張 MTT S80 實實在在的擺在了IT之家的桌面上,而且是裝上主機就可以在 Windows 下使用,並不需要複雜的除錯。

在本文中,我們就來看看這張 MTT S80,為國產顯示卡的發展邁出了怎樣的一步吧。測試配置如下:

外觀設計

摩爾執行緒 MTT S80 的包裝設計很是獨特,上面國畫風的線條圖案彰顯著它國產顯示卡的賣點。說來這也是IT之家第一次測試國產顯示卡,頗有紀念價值。

包裝內除了顯示卡本體外,有一本非常簡單的說明書,以及一根雙 PCIe 8Pin 轉 CPU 8Pin 線。之所以說明書如此簡單,是因為它的安裝方法與正常顯示卡無異,裝上去,開啟 Windows,安裝驅動,完事。

MTT S80 顯示卡本體的設計水平相當高。整體設計方正,金屬風滿滿。外殼採用了一體式設計,並使用鋁合金壓鑄 + CNC 工藝,極大的提升了顯示卡的整體結構強度,不用顯示卡支架也不用擔心變形。散熱部分採用 3 風扇設計,2 個 8cm 風扇加上中間的 7cm 風扇構成了中心對稱的整體佈局。

兩側的風扇外緣被兩條弧線包裹,其靈感來源是數學中常見的雙曲函式,與中間圓形 RGB 風扇交相輝映,很有設計感。這的 3 組風扇均支援智慧調速,在保證 GPU 穩定工作的同時,還能提供一個安靜的使用體驗。

背板有一整塊金屬保護,中間有一個摩爾執行緒 LOGO,右側通風孔在通電後還會點亮,觀感非常酷炫。

最炫酷的莫過於中間的橙色光環了,點亮後猶如噴薄的火山口,帶來無窮的能量。

從顯示卡側面可以看到 S80 密集的散熱鰭片,同時使用了 4 根 6mm 熱管貫穿散熱片整體,幫助熱量從 GPU 晶片和視訊記憶體上儘快傳遞到散熱鰭片上。

最棒的設計莫過於側面的 8Pin 電源介面了,雖然這會導致需要更大的機箱才能相容,但也使得機箱正面觀感變得更簡潔美觀。

側面介面部分,採用了目前高階顯示卡才配備的 3 個 DP1。4a 和一個 HDMI2。1 介面,可以支援最高 8K 的影片輸出。

最後需要注意的是,MTT S80 是首批使用 PCIe 5。0 介面的顯示卡,也是一款支援 PCIe 5。0*16 介面的顯示卡,這意味著最好搭配比較新的主機板才能實現最好的介面效能。所以摩爾執行緒京東旗艦店會選擇以 2999 搭一個華碩 B660M 主機板的方式進行售賣。

架構解析

摩爾執行緒 MTT S80 搭載了一顆基於 MUSA 架構的多功能 GPU 晶片“春曉”,相較於摩爾執行緒在今年 3 月釋出的“蘇堤”,“春曉”內建的四大計算引擎全面升級,可以同時支援圖形影象渲染、8K 影片編解碼、AI 訓練和推理、通用計算、GPU 虛擬化、物理模擬等多種功能。

核心引數方面,MTT S80 基於臺積電 7nm 工藝打造,擁有 4096 個 MUSA 核心,主頻 1。8GHz、16GB GDDR6 視訊記憶體,視訊記憶體位寬 256bit,核心內集成了 220 億個電晶體,內建 MUSA 架構通用計算核心以及張量計算核心,可以支援 FP32、FP16 和 INT8 等計算精度。

我們也對 MTT S80 進行了拆解,整張卡的拆解非常簡單,擰開所有可見的螺絲就可以取下背板和擋板。內部做工是相當規整的,視訊記憶體為 8 顆三星 GDDR6 快閃記憶體,每顆 2GB,組成了 16GB 的大視訊記憶體。

核心代號為 SD102AA-500,基於摩爾執行緒的 GPU 晶片“春曉”打造。

MTT S80 最特別的地方在於,它是國內率先支援 Windows 環境和 DirectX 圖形介面的 GPU。釋出會上摩爾執行緒表示,目前 MTT S80 的 Windows 驅動已經內建了 MUSA DirectX Driver 模組,並已完成對《暗黑破壞神 3》、《英雄聯盟》和《穿越火線》等十多款遊戲完成適配,還有更多遊戲可以執行,但還在適配過程中。不過至於是否真的如它所說,我們接下來就實測一下。

理論效能

首先我們進行一下理論效能測試。但在測試前,我們發現:MTT S80 的確是支援 Windows 和 DirectX 環境,在硬體層面能夠支援 DirectX 11,但目前驅動還未完成全部功能模組的開發,因此目前只支援 DirectX 9,目前大部分的跑分軟體都是基於 DirectX 11/12 的。所以常規的測試我們就不能進行了,只能另尋辦法。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

在 Windows 環境下有一款可以測試 DX9 效能的軟體 ——Unigine Valley BenchMark 1。0,在這款軟體中,MTT S80 獲得了 2302 分的成績。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

我們在 Unigine 官網查詢排行榜,可以看出在這個專案中 MTT S80 能達到 GTX 1060 6G 的水平。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

畫素填充率和紋理填充率也是評價顯示卡效能的重要指標。畫素填充率指的是 GPU 在一秒內可以渲染到螢幕並寫入顯示儲存器的畫素數量,我們用使用 Fillrate Tester 實測 MTT S80 的畫素填充率 FFP - Single texture 成績為 188 GPixel /s。作為對比,RTX 3060 的畫素填充率為 85。30 GPixel /s,RTX 3080Ti 的畫素填充率為 186。5 GPixel /s。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

紋理填充率指的是 GPU 可以在一秒內對映到畫素的紋理貼圖元素的數量。我們可以用 3DMark 06 來進行測試。最終 Multi-Texturing 最高為 170 GPixel /s,作為對比,RTX 3060 的紋理填充率為 199。0 GTexel /s。RTX 3050 的紋理填充率為 142。2 GTexel /s。之所以不同專案間差距懸殊,是因為目前驅動還未對 CPU 多執行緒進行最佳化,因此圖形負載越重,MTT S80 表現就越好。一旦未來驅動最佳化完成,MTT S80 的效能表現會有進一步提升。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

除了上面兩款測試外,Windows 平臺就沒有太多跑分軟體了。所以我們轉戰 Linux 平臺,在 Ubuntu 下看看還能不能測出一些資料。我們試試看使用 clpeak,測試它的視訊記憶體頻寬以及單精度浮點(FP32)效能。最終測出來的資料如下:視訊記憶體頻寬最大為 365 Gbps、單精度浮點最大為 13。9 TFLOPS。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

這大概是一個什麼水平呢?以下是桌面端 RTX 3060 12G 的理論效能,MTT S80 的視訊記憶體頻寬和浮點效能都比 RTX 3060 略高一點點。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

前面我們有提到,MTT S80 是首款支援 PCIe 5。0 的國產顯示卡,因此我們也測試了一下它的 PCIe 頻寬,我們在 Ubuntu 下使用 OCL Bandwidth Test 進行介面上下行測試,實測上傳最大頻寬為 28G /s,下載最大頻寬為 32G /s,這個速度是目前大部分主流 PCIe 4。0 顯示卡的兩倍。可以說 MTT S80 是一張“戰未來”的顯示卡了。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

從上面我們的測試來看,MTT S80 在不考慮環境相容性的情況下,純理論效能可以做到 RTX 3060-RTX 3060Ti 的水平。而在 Windows 環境下,由於驅動對 DirectX 和 OpenGL 環境還在努力適配,因此不同軟體中的效能差距很大。可以說摩爾執行緒 MTT S80 這次的硬體水平是相當線上的,驅動適配雖然暫時跟不上主流水平,但也為國產顯示卡開了一個好頭。

遊戲體驗

前面我們有說過,MTT S80 是首款支援 Windows 和 DirectX 環境的國產顯示卡,那麼它的實際遊戲體驗怎麼樣?前面我們有提到,MTT S80 暫時只支援 DirectX 9 環境,所以我們只能選擇一些比較老,但是受眾廣泛的遊戲來測試。以下游戲我們均開到 1080P 低畫質執行。首先是《英雄聯盟》,達到了 140-150 幀,可以滿足電競級顯示器暢玩。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

如果開到 1080P 高畫質,幀數則會來到平均 136 幀左右,同樣也能流暢遊玩。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

最後我們嘗試一下 2K 高畫質,平均幀數還能維持在 120 幀以上,表現很不錯了。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

《QQ 飛車》預設鎖 30 幀,自然是可以暢玩。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

《穿越火線》的平均幀數高達 180 幀,完全可以流暢遊玩。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

《暗黑破壞神 3》是摩爾執行緒在釋出會上演示的遊戲,我們實測下來也確實可以滿足 90-100 幀左右流暢遊玩。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

《我的世界》也得到了適配。但筆者發現網易版是打不開的,微軟版可以直接開啟,但幀數在平均 40-50 幀左右,不算很流暢,但已經可以玩了。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

最後我們測試一下《CS:GO》,這款遊戲玩起來還是很流暢的。我們執行 Benchmark 可以達到 213 幀左右的平均幀數。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

從上述遊戲的適配情況可以看出,摩爾執行緒目前的思路是優先適配那些受眾廣泛的國民級遊戲,來提高國產顯示卡的接受程度,然後再回頭去適配那些精品的小眾遊戲,這樣的發展思路無疑是正確的。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

影片編解碼

對於一款家用顯示卡來說,不僅僅要能玩遊戲,更要有出色的影片編解碼能力。在釋出會上摩爾執行緒表示,MTT S80 不僅支援 H。264、H。265 (HEVC),還加入了最新的 AV1 編解碼能力,並有三個 DP 1。4a 介面和一個 HDMI 2。1 介面,每個介面均可輸出 8K、4K 畫面。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

筆者首先嚐試在油管開啟一個 4K 的線上影片,觀感是非常流暢的,沒有遇到編解碼不暢帶來的卡頓。從控制面板中可以看到,MTT S80 也被正常呼叫進行 GPU 加速了。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

那麼它的影片編解碼效能和效率究竟如何呢?我們需要回到 Linux 環境下,使用 ffmpeg 工具呼叫 vappi 的硬體編解碼加速介面,選擇不同格式的碼流來進行測試,從我們的測試結果看,可以正常並行解碼多路 H。264、H。265、VP9 和 AV1 等格式的影片,並且可以實現多路 H。264、H。265 的並行編碼,以及多種格式間的影片轉碼。

我們準備了一個 1080p 的影片 YUV 資料,採用 H。265 進行多路編碼,為了儘量增加編碼器的壓力,測試時採用 9 路編碼並行,從測試結果可以看到每路的編碼的幀率為 183fps,總體效能超過 1080p1600fps。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

另外我們也對解碼的效能做了些測試,多路壓測解碼 1080p 的影片時,總幀率也可以超過 1200fps。如下是 VP9 格式的 1080p 影片並行 10 路解碼時的單路效能,可以看到幀率為 122fps。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

可以說,MTT S80 的影片編解碼效能是線上非常強的,硬體能力上已經打好了基礎。對於大部分內容消費者們來說,買回來就可以直接用,看 4K HDR 影片也毫無壓力。對於影片創作者們來說,MTT S80 硬體的編碼能力也是很強的。但目前暫時沒有剪輯軟體適配。據摩爾執行緒內部產品人士的反饋,目前他們正在積極與國內外影片編輯類軟體進行驅動和 API 適配,希望未來可以逐步滿足消費者影片編輯的需求。摩爾執行緒能與一些國產剪輯軟體一起,推進剪輯軟體的適配。

AI 與計算

得益於全功能 MUSA 架構,MTT S80 還可以應用在 AI 訓練方面,比如開發者可以透過 MUSA 軟體棧將現有 AI 模型簡單、快捷的遷移到 MTT S80 上;相容性方面,MTT S80 相容 PyTorch、TensorFlow 等多種主流深度學習框架,並實現了對 Transformer、CNN、RNN 等數十類 AI 模型的最佳化。

前面我們的測試中,MTT S80 的單精度浮點效能很強,因此在很吃單精度浮點效能的 AI 高精度推理上能展現強大的效能,滿足對資料計算精度要求極高的場景,如醫療、金融等應用領域。比如 MTT S80 特別適配了醫療領域 AI 開源框架 MONAI,實現多種任務的高精度推理。

最大的黑科技還是“CUDA on MUSA”。為了降低使用者的遷移成本,摩爾執行緒專為使用 CUDA 語言的使用者開發了一套 CUDA ON MUSA 的相容方案。基於摩爾執行緒提供的 porting 工具,透過編譯與執行兩步就可以讓 CUDA 原始碼執行在摩爾執行緒 MUSA 架構 GPU 上。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

總結:國產顯示卡的一大步

從筆者今天的評測中能看出,MTT S80 的硬體效能已經達到了主流甜品級的水平,這無疑是整個國產顯示卡行業的一大步。但最大的難點還是在於後續如何開發驅動程式,由於計算機圖形的專業性非常強,全球能夠懂得開發 Windows 驅動的人本來就少,其中大部分都集中於西方國家,在中國的專業人士屈指可數。處於初創階段的國內 GPU 企業需要快速推出市場化的 GPU 產品,但面臨的難題在於背景是晶片設計、底層驅動開發等關鍵領域人才匱乏、團隊缺少磨礪。所以開發通用 GPU 絕非易事。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

即便是做了十幾年核顯,市場佔有率第一的 intel,在進軍獨立顯示卡市場時也遇到了驅動開發的挫折,更何況是對於一個初創 2 年的新玩家呢?國產 GPU 想要做到對舊有軟體生態的相容,無疑是一個漫長而艱難的過程。我們不得不承認,自主創新是一條非常艱難的路,但也是一條不得不走的路。最近美國一紙禁令,英偉達就不得不對中國斷供指定型號的 GPU 晶片,未來會發生什麼樣的摩擦我們更是難以想象,所以我們必須做好充足的準備。

來了!首張國產遊戲顯示卡摩爾執行緒MTT S80顯示卡評測

但我們今天也有幸看到,摩爾執行緒邁出了相容主流平臺的第一步,就我們手上的這個 MTTS80 來說,對於大部分輕度使用的消費者們,買來直接插在 Windows 電腦上就可以用,看看影片打打 LOL 啥的也沒問題,這無疑是值得慶幸的。

但我們也應當理性看待,不能指望摩爾執行緒一步登天,直接做出主流級別的產品,因此筆者在評價摩爾執行緒 MTT S80 時,也給予了最大的鼓勵與寬容。當然,還是希望摩爾執行緒能儘快推動各類遊戲和應用的適配,充分釋放這顆強大的核心,迴應整個國產行業的期待。

特別提醒

有網友表示收不到IT之家公眾號的推送,這是因為現在微信規則改版了,請將“IT之家”公眾號星標,並記得給文章點贊和在看,這樣文章推送時系統才會優先推送給你。