0
本文作者: 李雨晨 | 2019-10-25 18:26 |
今年,醫(yī)學(xué)影像分析頂會(huì)MICCAI 2019在深圳舉行。在這次會(huì)上,英偉達(dá)醫(yī)療副總裁Kimberly Powell也來(lái)到了中國(guó),并且?guī)?lái)了一個(gè)20多人的隨行團(tuán)。
作為全球最大的獨(dú)立 GPU 供應(yīng)商,英偉達(dá)給外界釋放的信號(hào)不言而喻。Kimberly說(shuō)到,之所以來(lái)參加MICCAI,是要見(jiàn)一些潛在的合作伙伴。同時(shí),英偉達(dá)也將會(huì)在NVIDIA內(nèi)部打造中國(guó)本土的醫(yī)療團(tuán)隊(duì)。
2008年,Kimberly加入英偉達(dá),負(fù)責(zé)將英偉達(dá)GPU開(kāi)發(fā)為可應(yīng)用于醫(yī)療成像儀器的加速器平臺(tái)。此前,她曾表示,醫(yī)療領(lǐng)域是英偉達(dá)規(guī)模最大、也是最為成熟的一個(gè)領(lǐng)域?!霸诜派鋵W(xué)中,我們可以利用人工智能大幅的降低成本,提升圖像的質(zhì)量,并且將醫(yī)療和人工智能整合到一起?!?/p>
作為入局醫(yī)療的重要一步,2018年,英偉達(dá)發(fā)布了Clara平臺(tái)。時(shí)隔一年,Clara的進(jìn)展如何?Clara能否支撐起英偉達(dá)的醫(yī)療夢(mèng)想?
實(shí)驗(yàn)室表現(xiàn)出色的AI遲遲難以在醫(yī)院落地應(yīng)用,很重要的一個(gè)原因就是“臨床環(huán)境非常復(fù)雜”。
就以設(shè)備來(lái)說(shuō),很多醫(yī)院還在用十幾年前生產(chǎn)的成像設(shè)備,因?yàn)樵O(shè)備升級(jí)耗資巨大,醫(yī)院的“改造動(dòng)力”并不充足。這也是英偉達(dá)入局醫(yī)療的動(dòng)力之一。
Kimberly說(shuō),在消費(fèi)級(jí)AI當(dāng)中,英偉達(dá)更關(guān)注的是數(shù)據(jù)訓(xùn)練、模型訓(xùn)練。醫(yī)學(xué)影像的數(shù)據(jù)規(guī)模非常龐大,一些主流的消費(fèi)級(jí)AI工具無(wú)法處理。如果沒(méi)有更為先進(jìn)的工具,AI就很難進(jìn)入到下一個(gè)層級(jí)的應(yīng)用。
現(xiàn)在,英偉達(dá)更關(guān)注的是規(guī)模可擴(kuò)展的推理,以更快、更大規(guī)模的方式來(lái)進(jìn)行推理。在Clara平臺(tái)上,醫(yī)生可以繼續(xù)使用原來(lái)的超聲、CT等成像設(shè)備,輸入圖像后,系統(tǒng)可以自動(dòng)推理出更加清晰的圖像。
Kimberly向雷鋒網(wǎng)表示,醫(yī)療將會(huì)是世界上對(duì)于計(jì)算能力需求最大的產(chǎn)業(yè)?!澳P秃蛿?shù)據(jù)集的規(guī)模較大,而且很多都是3D數(shù)據(jù)。想象一下,我們有十幾種醫(yī)療器械,身體結(jié)構(gòu)、器官、疾病都有十幾種分類(lèi)。因此,針對(duì)各個(gè)細(xì)分領(lǐng)域的AI算法種類(lèi)是指數(shù)級(jí)增長(zhǎng)的?!?/p>
除此之外,考慮到醫(yī)學(xué)數(shù)據(jù)的敏感性,醫(yī)院對(duì)于數(shù)據(jù)本地化的要求比較苛刻,對(duì)于底層CPU、GPU性能的要求不斷上升。
這些是英偉達(dá)決定開(kāi)發(fā)Clara平臺(tái)來(lái)滿(mǎn)足醫(yī)療需求的原因。
作為一個(gè)軟硬件相結(jié)合的平臺(tái),Clara的核心是英偉達(dá) Clara AGX,是一套以英偉達(dá) Xavier 人工智能運(yùn)算模塊和英偉達(dá) Turing 架構(gòu) GPU 為基礎(chǔ)的運(yùn)算架構(gòu)。
2018年,Clara軟件開(kāi)發(fā)工具包(SDK)在北美放射學(xué)會(huì)會(huì)議上發(fā)布,定位于針對(duì)醫(yī)療行業(yè)分層的軟件堆棧。
發(fā)布將近一年后,Kimberly也向雷鋒網(wǎng)分享了Clara平臺(tái)的成績(jī)。
其中一個(gè)比較大的進(jìn)展,是工具集的高度模塊化。在Clara第一個(gè)版本當(dāng)中,整個(gè)工作流是提前設(shè)定好的。也就是說(shuō),用現(xiàn)有的模型去訓(xùn)練現(xiàn)有的預(yù)定好的模型。
而在最新的版本當(dāng)中,用戶(hù)可以將自己的模型帶到平臺(tái)上來(lái)進(jìn)行訓(xùn)練,“所以在使用層面,Clara變得更加友好了。”
其次,英偉達(dá)還整合了一些開(kāi)源的工具。比如,新的醫(yī)療影像瀏覽器能從三個(gè)視角觀(guān)察圖像,相當(dāng)于是一個(gè)AI助理分析工具,從用戶(hù)的角度而言,使用更方便。
再然后是優(yōu)化了性能,尤其是改善了數(shù)據(jù)加載訓(xùn)練的時(shí)間。Kimberly笑道,“有開(kāi)發(fā)者反映,有時(shí)候數(shù)據(jù)加載的時(shí)間,比訓(xùn)練的時(shí)間還要長(zhǎng)?!?/p>
最后,新的SDK還實(shí)現(xiàn)了自動(dòng)化的多GPU訓(xùn)練,不再需要用戶(hù)過(guò)多干涉。
據(jù)雷鋒網(wǎng)了解,Clara主要針對(duì)三種類(lèi)型醫(yī)療客戶(hù),第一是醫(yī)療設(shè)備公司,第二是人工智能軟件開(kāi)發(fā)公司,第三是那些擁有幾百個(gè)應(yīng)用的醫(yī)院。
Kimberly認(rèn)為,對(duì)于這些醫(yī)療領(lǐng)域的用戶(hù),英偉達(dá)可提供四個(gè)方面的能力。
第一、訓(xùn)練好的模型,可以用來(lái)訓(xùn)練數(shù)據(jù),利用這些模型來(lái)作為醫(yī)生的助理;第二,讓模型表現(xiàn)非常有效的一個(gè)辦法是對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,在Clara平臺(tái)上,研究人員可以來(lái)做預(yù)標(biāo)記的事情;第三,有一個(gè)預(yù)訓(xùn)練模型讓開(kāi)發(fā)者有一個(gè)比較高的起點(diǎn),對(duì)這個(gè)模型再進(jìn)行訓(xùn)練時(shí),可以用更少的數(shù)據(jù)量就達(dá)到非常高的準(zhǔn)確度;第四,就是應(yīng)用的部署。
很多AI初創(chuàng)企業(yè)手里有一些AI模型,但是他們需要將這些AI模型進(jìn)行大規(guī)模的運(yùn)轉(zhuǎn),比如:每天至少做上百個(gè)推理。
所以,Clara平臺(tái)實(shí)際上就提供了可擴(kuò)展的AI推理功能,那些初創(chuàng)企業(yè)和醫(yī)療公司就可以用Clara平臺(tái)快速和低成本的擴(kuò)展。
據(jù)了解,英偉達(dá)在醫(yī)療領(lǐng)域已經(jīng)收獲國(guó)內(nèi)包括平安保險(xiǎn)、華大基因、碳云智能、聯(lián)影智能、推想科技等在內(nèi)的眾多合作伙伴。例如,推想科技使用的就是Clara里的推理引擎,并行執(zhí)行多個(gè)人工智能算法。如果沒(méi)有這個(gè)推理引擎,一個(gè)AI的模型就必須有一個(gè)專(zhuān)門(mén)的GPU執(zhí)行。
此外,聯(lián)影智能也在NVIDIA DGX系統(tǒng)的基礎(chǔ)上構(gòu)建AI架構(gòu),以便開(kāi)發(fā)用于全棧式醫(yī)學(xué)影像的人工智能軟件uAI。
Kimberly說(shuō),AI初創(chuàng)企業(yè)現(xiàn)在基本上都是基于英偉達(dá)的技術(shù)來(lái)打造自己的應(yīng)用,英偉達(dá)做的事情就是給他們的應(yīng)用去加速,去做更底層的事情。
雷鋒網(wǎng)了解到,從發(fā)布以來(lái),Clara平臺(tái)的開(kāi)發(fā)者數(shù)量增長(zhǎng)非常迅速。Kimberly說(shuō),英偉達(dá)在今年春天正式發(fā)布了這個(gè)應(yīng)用框架,幾個(gè)月的時(shí)間,Clara開(kāi)發(fā)者的數(shù)量增加了4倍。
深度學(xué)習(xí)仍然是這波人工智能熱潮中占“統(tǒng)治性”地位的技術(shù)。據(jù)雷鋒網(wǎng)了解,這一次的MICCAI會(huì)議上,仍然有超過(guò)70%的研究人員做的都是深度學(xué)習(xí)領(lǐng)域的研究。
但是,值得注意的一個(gè)現(xiàn)象是,聯(lián)邦學(xué)習(xí)悄悄成為了今年MICCAI上的一個(gè)熱詞。
大會(huì)主席沈定剛教授向雷鋒網(wǎng)表示,聯(lián)邦學(xué)習(xí)對(duì)于醫(yī)療數(shù)據(jù)的隱私性來(lái)說(shuō)是一個(gè)很好的方法,既可以保證數(shù)據(jù)“不出院”,又能夠利用不同醫(yī)院的數(shù)據(jù)訓(xùn)練同一個(gè)算法。
英偉達(dá)資深研究科學(xué)家Nicola Rieke說(shuō),聯(lián)邦學(xué)習(xí)的提出,主要是為了解決“數(shù)據(jù)收集”的問(wèn)題。
“如果一項(xiàng)研究需要跨國(guó)或者跨區(qū)域,就不可能建一個(gè)共有的數(shù)據(jù)池。在聯(lián)邦學(xué)習(xí)里,其實(shí)是模型找數(shù)據(jù),而不是數(shù)據(jù)找模型,醫(yī)學(xué)數(shù)據(jù)一直沒(méi)有離開(kāi)醫(yī)院。這個(gè)新技術(shù)的最大突破點(diǎn)在于,模型訓(xùn)練完、數(shù)據(jù)回傳時(shí),要保證最少的涉及到隱私的數(shù)據(jù)被回傳過(guò)來(lái)。所以我們只是回傳訓(xùn)練后模型的數(shù)據(jù),而不是原有的數(shù)據(jù)?!?/p>
其次,如果采取集中化的數(shù)據(jù)處理方式,會(huì)大大增加數(shù)據(jù)的規(guī)模?!氨热纾珻T的圖象原來(lái)有1TB。我把這個(gè)數(shù)據(jù)集中之后,就相當(dāng)于把1TB做一個(gè)拷貝,創(chuàng)造了2TB的數(shù)據(jù)?!?/p>
當(dāng)然,Nicola Rieke也提到“數(shù)據(jù)安全”的問(wèn)題:如果根據(jù)模型訓(xùn)練出來(lái)的數(shù)據(jù),又知道底層的運(yùn)行邏輯,確實(shí)是可以進(jìn)行模型反推。
因此,英偉達(dá)和倫敦國(guó)王學(xué)院的研究人員在這個(gè)模型上引入了稀疏向量技術(shù)(SVT,Sparse Vector Technique)。訓(xùn)練完數(shù)據(jù)之后,在數(shù)據(jù)中加入“噪點(diǎn)”,讓數(shù)據(jù)變得模糊、改變?cè)袛?shù)據(jù)的顆粒度,讓反推變得更加困難。
當(dāng)然,任何一個(gè)方法都不是完美的。此前,很多的數(shù)據(jù)訓(xùn)練放在云端,用大量的GPU去做。但是,由于聯(lián)邦學(xué)習(xí)需要把集中于中心服務(wù)器的模型訓(xùn)練過(guò)程分散到了各地。這對(duì)于合作對(duì)象的硬件條件提出了要求,會(huì)增加各地的GPU數(shù)量。
Nicola Rieke表示,確實(shí)存在這種情況,但是現(xiàn)在英偉達(dá)的GPU硬件,基本上對(duì)于每一個(gè)服務(wù)器的供應(yīng)商來(lái)說(shuō)都是可以使用的,最入門(mén)的、最低的投入可能只需要1萬(wàn)美金,一定程度上降低了使用的門(mén)檻。
借助于聯(lián)邦學(xué)習(xí),今年8月,英偉達(dá)與總部位于英國(guó)的藥物研發(fā)聯(lián)盟MELLODDY組織聯(lián)手,圍繞藥物研究展開(kāi)合作。
MELLODDY包括了10家領(lǐng)先的制藥公司,如安進(jìn)、拜耳、葛蘭素史克、楊森和諾華;兩所歐洲頂尖大學(xué)——魯汶大學(xué)和布達(dá)佩斯科技經(jīng)濟(jì)大學(xué)以及四家初創(chuàng)企業(yè)。MELLODDY的研究人員創(chuàng)建了一個(gè)分布式深度學(xué)習(xí)模型,用于在不同的云集群中的傳輸以及對(duì)未知的1000萬(wàn)化合物注釋數(shù)據(jù)的訓(xùn)練工作。
在英偉達(dá)內(nèi)部,Clara的定位就是“一個(gè)工具”。
NVIDIA中國(guó)高性能計(jì)算、產(chǎn)業(yè)AI業(yè)務(wù)總經(jīng)理劉通說(shuō)到,對(duì)于任何使用Clara的用戶(hù)用,原則上是沒(méi)有任何限制的。相反,無(wú)論是初創(chuàng)企業(yè)還是大的醫(yī)療公司做AI,工具恰恰都能提供非常好的幫助。
Kimberly表示,Clara支持任何階段的初創(chuàng)企業(yè)。如果是非常早期的初創(chuàng)企業(yè),可能需要的更多是技術(shù)上的幫助。如果是成熟一點(diǎn)的初創(chuàng)企業(yè),可能它們需要的是市場(chǎng)方面的幫助。
市場(chǎng)化的能力體現(xiàn)在幾個(gè)方面。一方面,在英偉達(dá)的渠道上進(jìn)行宣傳;另一方面,在GTC大會(huì)上,英偉達(dá)也會(huì)邀請(qǐng)這些公司參與大會(huì)、發(fā)表演講?!耙?yàn)橛泻芏囡L(fēng)投參會(huì),通過(guò)這種良性的循環(huán),我們能幫助這些企業(yè)拿到一些好的風(fēng)投基金?!?/p>
除此之外,英偉達(dá)也與學(xué)術(shù)機(jī)構(gòu)合作。4月,英偉達(dá)與美國(guó)放射學(xué)會(huì)聯(lián)手,將Clara AI平臺(tái)整合到旗下的ACR AI-LAB中,讓超過(guò)38000名的放射科醫(yī)生創(chuàng)建滿(mǎn)足自己需求的AI工具。
而在半個(gè)月前,英偉達(dá)與加州大學(xué)舊金山分校合作,用DGX超級(jí)計(jì)算機(jī)打造自己的AI訓(xùn)練架構(gòu),并且用Clara開(kāi)發(fā)和部署了應(yīng)用。
Kimberly補(bǔ)充說(shuō),英偉達(dá)更多的是扮演一個(gè)“賦能者”的角色,為整個(gè)AI生態(tài)系統(tǒng)打造了一個(gè)完善的開(kāi)發(fā)工具,幫助創(chuàng)業(yè)公司更好地執(zhí)行醫(yī)療AI的應(yīng)用。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。