1
本文作者: 任然 | 2019-01-23 17:42 |
雷鋒網(wǎng)消息,在不久前的GTC大會(huì)慕尼黑站上,NVIDIA發(fā)布了虛擬化平臺(tái)的Virtual GPU軟件v7.x最新版。昨天,NVIDIA在北京召開(kāi)溝通會(huì),NVIDIA GPU虛擬化高級(jí)解決方案架構(gòu)師張潔,以及中國(guó)區(qū)解決方案架構(gòu)師李浩南詳細(xì)介紹了該技術(shù)的性能和特點(diǎn)。
如今,GPU已經(jīng)成為企業(yè)非常重要的資本和生產(chǎn)力工具,虛擬化可以很好地幫助企業(yè)充分分配GPU資源給更多的用戶(hù)。5年前,GRID虛擬GPU(vGPU)平臺(tái),結(jié)合VMware Horizon vDGA(虛擬專(zhuān)用圖形加速)平臺(tái),實(shí)現(xiàn)了針對(duì)Tesla GPU的虛擬化工作。
NVIDIA的虛擬GPU產(chǎn)品包括三款旨在應(yīng)對(duì)數(shù)字化工作環(huán)境挑戰(zhàn)的產(chǎn)品:面向知識(shí)工作者的NVIDIA GRID虛擬PC(GRID vPC)和NVIDIA GRID虛擬應(yīng)用程序(GRID vApp),以及面向設(shè)計(jì)師、工程師和建筑師的NVIDIA Quadro虛擬數(shù)據(jù)中心工作站(Quadro vDWS)。
經(jīng)過(guò)5年多的發(fā)展,vGPU從軟硬一體到單純的軟件,從一個(gè)只能支持一個(gè)明確固定型號(hào)的GPU到現(xiàn)支持最新Tesla系列的所有GPU,從對(duì)圖形圖像進(jìn)行支持、解決客戶(hù)在使用圖形圖像時(shí)的重負(fù)載應(yīng)用時(shí)如何在數(shù)據(jù)中心部署的問(wèn)題,到如今在虛擬GPU上實(shí)現(xiàn)GPU計(jì)算部分能力的業(yè)務(wù)。
據(jù)張潔介紹,新的GPU軟件Vgpu 7.x版通過(guò)實(shí)時(shí)遷移等功能確保了可靠性和易管理性,其新功能包括:
基于NVIDIA Quadro vDWS運(yùn)行多GPU工作負(fù)載:通過(guò)在單一虛擬機(jī)(VM)中集合多達(dá)四個(gè)NVIDIA Tesla GPU的性能,可體驗(yàn)到虛擬GPU性能的巨大提升,從而應(yīng)對(duì)圖形及計(jì)算密集程度最高的渲染、仿真和設(shè)計(jì)工作流程。
借助VMware vMotion的實(shí)時(shí)遷移:IT可在不會(huì)對(duì)用戶(hù)造成影響,也不需要預(yù)定停機(jī)時(shí)間的情況下遷移實(shí)時(shí)NVIDIA GPU加速虛擬機(jī),從而節(jié)省寶貴的時(shí)間和資源。
支持NVIDIA Tesla T4 GPU:和上一代Tesla P4采用相同的低剖面、單插槽規(guī)格,卻可實(shí)現(xiàn)2倍的幀緩沖。
部署NVIDIA GPU Cloud的虛擬機(jī)上的AI工作負(fù)載:NGC為AI研究人員提供了適用于TensorFlow、PyTorch、MXNet、TensorRT等GPU加速的深度學(xué)習(xí)容器。
其中,vGPU 7.x最重要的更新在于切片模式,從過(guò)去只支持從一塊物理GPU虛擬出多臺(tái)VM,擴(kuò)展為支持將多個(gè)物理GPU分配給一個(gè)VM。如果用戶(hù)對(duì)GPU的資源、對(duì)算力要求更強(qiáng),可以在虛擬化平臺(tái)里實(shí)現(xiàn)多GPU,從而滿(mǎn)足用戶(hù)對(duì)高算力的要求。
GRID通過(guò)分時(shí)切片方式提供物理GPU上的各類(lèi)資源給到系統(tǒng),調(diào)入的顯存數(shù)據(jù)相互隔離,根據(jù)不同GPU性能水平可分割為不同vGPU資源,各vGPU資源對(duì)等。vGPU調(diào)度的性能損失小、按需分配,充分發(fā)揮硬件價(jià)值。
多GPU支持的應(yīng)用場(chǎng)景很多,比如說(shuō)在原來(lái)的圖形工作站中的一些高端場(chǎng)景里會(huì)配兩個(gè)GPU,如果在CD場(chǎng)景里,一個(gè)GPU做3D建模,一個(gè)GPU做仿真;在影視后期里,一個(gè)GPU用來(lái)做動(dòng)畫(huà)建模,另外一個(gè)GPU用來(lái)做渲染,等等。
同時(shí),vGPU 7.x配合了VMware最新版本的服務(wù)器虛擬化解決方案,vSphere 6.7 U1??膳浜蟅Mware在數(shù)據(jù)中心實(shí)現(xiàn)帶有GPU的虛擬機(jī)可實(shí)現(xiàn)動(dòng)態(tài)的熱遷移,在遷移的整個(gè)過(guò)程當(dāng)中,用戶(hù)的業(yè)務(wù)是不中斷的。
此外張潔還提到,微軟推出Win10系統(tǒng)后,幾乎所有的系統(tǒng)應(yīng)用都需要GPU加速。根據(jù) LakesideSoftware, Inc 白皮書(shū),Windows 10 所需的 CPU 資源比 Windows 7 最高要高出 32%。Chrome、Skype和 Microsoft Office 等基本辦公室工作效率應(yīng)用程序的更新版本對(duì)計(jì)算機(jī)圖形性能的要求也比以往更高。
GPU輕負(fù)載應(yīng)用對(duì)于物理機(jī)來(lái)說(shuō)并不是什么問(wèn)題,但是對(duì)于虛擬化桌面來(lái)說(shuō),沒(méi)有GPU加速能力將非常影響基本使用。vGPU 7.x針對(duì)輕負(fù)載應(yīng)用提供了GPU加速能力,不僅解決了這個(gè)問(wèn)題,還可以提高VM的密度,從而更經(jīng)濟(jì)、更有效的部署虛擬化桌面辦公環(huán)境。
雷鋒網(wǎng)在隨后的訪(fǎng)談中了解到,vGPU 7.0還加入了對(duì)AI加速的支持,借助可配合簡(jiǎn)化AI部署的NVIDIA GPU Cloud,用戶(hù)可以從云端快速地把需要做人工智能業(yè)務(wù)的用戶(hù)環(huán)境拖下來(lái)進(jìn)行部署。
而在管理方面,vGPU 7.x支持無(wú)感熱遷移,管理員可根據(jù)用戶(hù)權(quán)限和資源需求量,動(dòng)態(tài)分配vGPU資源給不同用戶(hù),無(wú)需重新載入VM即可得到vGPU資源的動(dòng)態(tài)響應(yīng),用戶(hù)完全不會(huì)感受到切換過(guò)程,充分保證使用連續(xù)性。
張潔向雷鋒網(wǎng)透露,NVIDIA配合虛擬化廠(chǎng)商做了非常多的工作,來(lái)保證GPU資源可以實(shí)現(xiàn)熱遷移:第一,通過(guò)vGPU解決方案保證從原端的物理服務(wù)器到目標(biāo)遷移的物理服務(wù)器顯存的完全同步;第二,保證GPU指令的同步,包括GPU指令緩存的同步,從而保證GPU從原服務(wù)器遷移到目標(biāo)服務(wù)器的時(shí)候保證其業(yè)務(wù)不會(huì)造成任何中斷。
GPU虛擬化是軟件,依托于GPU硬件,由于穩(wěn)定而強(qiáng)大的底層GPU的硬件,所以NVIDIA的軟件在快速迭代下也能保證穩(wěn)定性。未來(lái),NVIDIA還將繼續(xù)和VMware密切合作,充分發(fā)揮雙方的優(yōu)勢(shì)共同滿(mǎn)足市場(chǎng)的需要。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。