作為GPU加速應(yīng)用領(lǐng)域最強(qiáng)大的軟件開(kāi)發(fā)平臺(tái),NVIDIA近日了發(fā)布全新的CUDA 11版本工具包,特別為新誕生的安培架構(gòu)進(jìn)行了優(yōu)化。
CUDA 11完全支持在安培新架構(gòu)上進(jìn)行開(kāi)發(fā),包括A100 GPU,以及基于它的DGX A100、HGX A100等多路系統(tǒng),并支持安培架構(gòu)的第三代Tensor張量核心,可針對(duì)不同數(shù)據(jù)類型加速混合精度矩陣計(jì)算,比如TF32、Bfloat16。
其他新技能:
- 多實(shí)例GPU虛擬化和GPU分區(qū),提升GPU利用率
- 優(yōu)化庫(kù)性能,包括線性代數(shù)、快速傅里葉變換(FFT)、矩陣乘法、JPEG解碼等等
- 改進(jìn)編程與API,包括任務(wù)圖表、異步數(shù)據(jù)轉(zhuǎn)移、精細(xì)同步、二級(jí)緩存駐留管理等等
- 增強(qiáng)Nsight開(kāi)發(fā)工具集,包括跟蹤、編譯、調(diào)試分析
- 完整支持各種主要CPU架構(gòu),包括x86、ARM64、Power
- CUDA C++改進(jìn)編譯器性能和穩(wěn)定性、支持新的主編譯器和語(yǔ)言標(biāo)準(zhǔn)(包括C++17)、支持Parallel C++ STL
- 更新操作系統(tǒng)支持
更詳細(xì)介紹請(qǐng)參閱:
https://devblogs.nvidia.com/cuda-11-features-revealed/

特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- RakSmart服務(wù)器成本優(yōu)化策略
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- raksmart法蘭克福云服務(wù)器延遲高嗎?
- 自媒體人搭建直播服務(wù)器使用raksmart優(yōu)化技巧
- 華納云高防服務(wù)器3.6折起低至1188元/月,企業(yè)級(jí)真實(shí)防御20G`T級(jí),自營(yíng)機(jī)房一手服務(wù)器資源
- 服務(wù)器的系統(tǒng)和普通電腦系統(tǒng)一樣嗎?
- 選擇站群VPS時(shí)必須關(guān)注的六大核心需求