1
本文作者: 岑大師 | 2017-05-10 09:10 | 專題:GTC 2017【直播】 |
美國本地時間5月9日,科大訊飛在圣何塞召開的GTC 2017大會期間宣布,訊飛開放平臺將基于NVIDIA最新Pascal架構的NVIDIA Tesla P4平臺,提供語音云服務的深度學習推理,進一步提升訊飛語音云平臺的效率。
科大訊飛美國分公司總裁李春燕博士表示,隨著對深度學習和人工智能技術要求日益提高,GPU在扮演越來越重要的角色。在NVIDIA推出Pascal架構的GPU平臺后,科大訊飛第一時間應用NVIDIA Tesla P40深度學習進行訓練,并取得了相對于CPU訓練的50倍以上速度提升。
“原先需要兩個月時間來完成的訓練,現(xiàn)在只需要一天就能完成?!崩畲貉喔嬖V雷鋒網(wǎng)。
李春燕介紹,科大訊飛從2013年便開始使用NVIDIA的K10 GPU平臺進行相關人工智能產品的開發(fā),目前科大訊飛在線日業(yè)務量過35億人次,總用戶數(shù)超過10億,擁有30萬家合作伙伴、是中文語音技術市場的領先者。目前,科大訊飛的全行業(yè)語音產品和人工智能產品在教育、客服、車載、智能家居、智能硬件、醫(yī)療等方面均有著廣泛的應用。
“目前深圳有超過60%做機器人的公司,他們用的都是訊飛的方案。”得知雷鋒網(wǎng)編輯來自深圳,李春燕如是說。
科大訊飛此次投入應用的Tesla P4具備超高的運算能力,主要將其應用于訊飛開放平臺的深度學習推理,在語音識別的線上解碼引擎上。相比起之前科大訊飛使用的M40,Tesla P4的并發(fā)路數(shù)提升了3-4倍,而功耗峰值降低至75W,僅相當于M40的1/2-1/3。
在性能優(yōu)化上,科大訊飛也下了一番功夫。Tesla P4理論上能提供每秒22T INT8運算的計算峰值,在實際應用中,科大訊飛跑出了超過20T INT8運算的接近理論峰值的計算能力,這一結果讓NVIDIA刮目相看。
“這是所有合作伙伴達到的最高數(shù)值。”NVIDIA全球副總裁、亞太區(qū)總裁Raymond Teh告訴雷鋒網(wǎng)。
Tesla P4運算能力的提升和計算并發(fā)路數(shù)的提升對于科大訊飛來說至關重要。前者有助于幫助科大訊飛提升訓練時間,加快迭代的速度,后者可以大大提高云端服務響應速度。通過在訓練和推理兩端同時用GPU加速,不僅能夠降低在線識別的成本,更能有效提升客戶的體驗。
據(jù)NVIDIA業(yè)務發(fā)展總監(jiān)何濤介紹,Tesla P4是為了適應未來數(shù)據(jù)中心低功耗計算能力而設計的。GPU對于所有計算中心的計算能力管理至關重要,P4迎合了數(shù)據(jù)中心的需求,不僅在性能上有顯著提升,體積更小,可以在同樣空間中配置更多的GPU;功率降低,更重要的是可以用PCIE供電,無需額外電源,能夠便于客戶更靈活地管理計算能力。
“中國的傳統(tǒng)機房一般是給一個恒定的能耗,如果用大(功率的)GPU不可能放很多?!焙螡f?!斑@樣的設計,特別適合中國?!彼又a充道。
實戰(zhàn)特訓:遠場語音交互技術
智能音箱這么火,聽聲智科技CTO教你深入解析AI設備語音交互關鍵技術!
課程鏈接:http://www.mooc.ai/course/80
加入AI慕課學院人工智能學習交流QQ群:624413030,與AI同行一起交流成長
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。
本專題其他文章