NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

本文作者：任然

2019-01-23 17:42

導(dǎo)語：真正為用戶提供高可用性，實(shí)現(xiàn)優(yōu)質(zhì)用戶體驗(yàn)

雷鋒網(wǎng)消息，在不久前的GTC大會慕尼黑站上，NVIDIA發(fā)布了虛擬化平臺的Virtual GPU軟件v7.x最新版。昨天，NVIDIA在北京召開溝通會，NVIDIA GPU虛擬化高級解決方案架構(gòu)師張潔，以及中國區(qū)解決方案架構(gòu)師李浩南詳細(xì)介紹了該技術(shù)的性能和特點(diǎn)。

如今，GPU已經(jīng)成為企業(yè)非常重要的資本和生產(chǎn)力工具，虛擬化可以很好地幫助企業(yè)充分分配GPU資源給更多的用戶。5年前，GRID虛擬GPU（vGPU）平臺，結(jié)合VMware Horizon vDGA（虛擬專用圖形加速）平臺，實(shí)現(xiàn)了針對Tesla GPU的虛擬化工作。

NVIDIA的虛擬GPU產(chǎn)品包括三款旨在應(yīng)對數(shù)字化工作環(huán)境挑戰(zhàn)的產(chǎn)品：面向知識工作者的NVIDIA GRID虛擬PC（GRID vPC）和NVIDIA GRID虛擬應(yīng)用程序（GRID vApp），以及面向設(shè)計(jì)師、工程師和建筑師的NVIDIA Quadro虛擬數(shù)據(jù)中心工作站（Quadro vDWS）。

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

經(jīng)過5年多的發(fā)展，vGPU從軟硬一體到單純的軟件，從一個(gè)只能支持一個(gè)明確固定型號的GPU到現(xiàn)支持最新Tesla系列的所有GPU，從對圖形圖像進(jìn)行支持、解決客戶在使用圖形圖像時(shí)的重負(fù)載應(yīng)用時(shí)如何在數(shù)據(jù)中心部署的問題，到如今在虛擬GPU上實(shí)現(xiàn)GPU計(jì)算部分能力的業(yè)務(wù)。

據(jù)張潔介紹，新的GPU軟件Vgpu 7.x版通過實(shí)時(shí)遷移等功能確保了可靠性和易管理性，其新功能包括：

基于NVIDIA Quadro vDWS運(yùn)行多GPU工作負(fù)載：通過在單一虛擬機(jī)（VM）中集合多達(dá)四個(gè)NVIDIA Tesla GPU的性能，可體驗(yàn)到虛擬GPU性能的巨大提升，從而應(yīng)對圖形及計(jì)算密集程度最高的渲染、仿真和設(shè)計(jì)工作流程。
借助VMware vMotion的實(shí)時(shí)遷移：IT可在不會對用戶造成影響，也不需要預(yù)定停機(jī)時(shí)間的情況下遷移實(shí)時(shí)NVIDIA GPU加速虛擬機(jī)，從而節(jié)省寶貴的時(shí)間和資源。
支持NVIDIA Tesla T4 GPU：和上一代Tesla P4采用相同的低剖面、單插槽規(guī)格，卻可實(shí)現(xiàn)2倍的幀緩沖。
部署NVIDIA GPU Cloud的虛擬機(jī)上的AI工作負(fù)載：NGC為AI研究人員提供了適用于TensorFlow、PyTorch、MXNet、TensorRT等GPU加速的深度學(xué)習(xí)容器。

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

其中，vGPU 7.x最重要的更新在于切片模式，從過去只支持從一塊物理GPU虛擬出多臺VM，擴(kuò)展為支持將多個(gè)物理GPU分配給一個(gè)VM。如果用戶對GPU的資源、對算力要求更強(qiáng)，可以在虛擬化平臺里實(shí)現(xiàn)多GPU，從而滿足用戶對高算力的要求。

GRID通過分時(shí)切片方式提供物理GPU上的各類資源給到系統(tǒng)，調(diào)入的顯存數(shù)據(jù)相互隔離，根據(jù)不同GPU性能水平可分割為不同vGPU資源，各vGPU資源對等。vGPU調(diào)度的性能損失小、按需分配，充分發(fā)揮硬件價(jià)值。

多GPU支持的應(yīng)用場景很多，比如說在原來的圖形工作站中的一些高端場景里會配兩個(gè)GPU，如果在CD場景里，一個(gè)GPU做3D建模，一個(gè)GPU做仿真；在影視后期里，一個(gè)GPU用來做動畫建模，另外一個(gè)GPU用來做渲染，等等。

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

同時(shí)，vGPU 7.x配合了VMware最新版本的服務(wù)器虛擬化解決方案，vSphere 6.7 U1。可配合VMware在數(shù)據(jù)中心實(shí)現(xiàn)帶有GPU的虛擬機(jī)可實(shí)現(xiàn)動態(tài)的熱遷移，在遷移的整個(gè)過程當(dāng)中，用戶的業(yè)務(wù)是不中斷的。

此外張潔還提到，微軟推出Win10系統(tǒng)后，幾乎所有的系統(tǒng)應(yīng)用都需要GPU加速。根據(jù) LakesideSoftware, Inc 白皮書，Windows 10 所需的 CPU 資源比 Windows 7 最高要高出 32%。Chrome、Skype和 Microsoft Office 等基本辦公室工作效率應(yīng)用程序的更新版本對計(jì)算機(jī)圖形性能的要求也比以往更高。

GPU輕負(fù)載應(yīng)用對于物理機(jī)來說并不是什么問題，但是對于虛擬化桌面來說，沒有GPU加速能力將非常影響基本使用。vGPU 7.x針對輕負(fù)載應(yīng)用提供了GPU加速能力，不僅解決了這個(gè)問題，還可以提高VM的密度，從而更經(jīng)濟(jì)、更有效的部署虛擬化桌面辦公環(huán)境。

雷鋒網(wǎng)在隨后的訪談中了解到，vGPU 7.0還加入了對AI加速的支持，借助可配合簡化AI部署的NVIDIA GPU Cloud，用戶可以從云端快速地把需要做人工智能業(yè)務(wù)的用戶環(huán)境拖下來進(jìn)行部署。

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

而在管理方面，vGPU 7.x支持無感熱遷移，管理員可根據(jù)用戶權(quán)限和資源需求量，動態(tài)分配vGPU資源給不同用戶，無需重新載入VM即可得到vGPU資源的動態(tài)響應(yīng)，用戶完全不會感受到切換過程，充分保證使用連續(xù)性。

張潔向雷鋒網(wǎng)透露，NVIDIA配合虛擬化廠商做了非常多的工作，來保證GPU資源可以實(shí)現(xiàn)熱遷移：第一，通過vGPU解決方案保證從原端的物理服務(wù)器到目標(biāo)遷移的物理服務(wù)器顯存的完全同步；第二，保證GPU指令的同步，包括GPU指令緩存的同步，從而保證GPU從原服務(wù)器遷移到目標(biāo)服務(wù)器的時(shí)候保證其業(yè)務(wù)不會造成任何中斷。

GPU虛擬化是軟件，依托于GPU硬件，由于穩(wěn)定而強(qiáng)大的底層GPU的硬件，所以NVIDIA的軟件在快速迭代下也能保證穩(wěn)定性。未來，NVIDIA還將繼續(xù)和VMware密切合作，充分發(fā)揮雙方的優(yōu)勢共同滿足市場的需要。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

任然

編輯

觀點(diǎn)離經(jīng)叛道的骨灰級硬件愛好者

發(fā)私信

當(dāng)月熱門文章

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速

NVIDIA再秀GPU虛擬化解決方案，助力用戶工作流程加速