丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給李梅
發(fā)送

0

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

本文作者: 李梅 2022-08-05 19:23
導(dǎo)語(yǔ):算法的迭代事實(shí)上變成了數(shù)據(jù)的迭代。

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

作者 | 李梅

編輯 | 陳彩嫻


今年年初,知名 AI 學(xué)者吳恩達(dá)在接受 IEEE Spectrum 的采訪中,呼吁大家將目光從以模型為中心轉(zhuǎn)向以數(shù)據(jù)為中心。深度學(xué)習(xí)問(wèn)世以來(lái),隨著神經(jīng)網(wǎng)絡(luò)架構(gòu)趨于固定和成熟,轉(zhuǎn)而尋找改進(jìn)數(shù)據(jù)的方法,已經(jīng)成了 AI 研發(fā)的新出口。

近日,2021 年吳文俊人工智能科學(xué)進(jìn)步一等獎(jiǎng)獲得者、云天勵(lì)飛首席科學(xué)家王孝宇博士,在人工智能產(chǎn)業(yè)年會(huì)上作了題為“ Towards Automated Artificial Intelligence”的主題報(bào)告。報(bào)告中,王孝宇博士詳述了AutoML/AutoAI 的三個(gè)發(fā)展階段,并介紹了他在云天勵(lì)飛主導(dǎo)開(kāi)發(fā)的自動(dòng)化 AI 模型生產(chǎn)平臺(tái) YMIR。

王孝宇,現(xiàn)任云天勵(lì)飛首席科學(xué)家,此前曾任 Snap 研究院計(jì)算機(jī)視覺(jué)主席,NEC 美國(guó)研究院研究科學(xué)家。本科畢業(yè)于中國(guó)科技大學(xué),后相繼在美國(guó)密蘇里大學(xué)獲得統(tǒng)計(jì)學(xué)碩士與電子計(jì)算機(jī)工程博士,主要研究領(lǐng)域?yàn)橛?jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘等,是目前國(guó)內(nèi)唯一一位在系統(tǒng)、芯片、算法三個(gè)方向獲得吳文俊人工智能科技進(jìn)步獎(jiǎng)的 AI 學(xué)者。

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

AI 科技評(píng)論對(duì)王孝宇博士在吳文俊獎(jiǎng)大會(huì)上的報(bào)告作了不改原意的整理,并圍繞 AutoAI 對(duì)王孝宇博士進(jìn)行了一次深入對(duì)話。


1 AutoML/AutoAI 的三個(gè)階段


第一階段:模型設(shè)計(jì)、調(diào)參自動(dòng)化

當(dāng)前,很多學(xué)者都已經(jīng)注意到,學(xué)術(shù)界或者工業(yè)界的優(yōu)秀人才所聚焦的研發(fā),花費(fèi)太多時(shí)間用于模型結(jié)構(gòu)設(shè)計(jì)以及調(diào)參,但實(shí)際上它本不應(yīng)該成為研究的主要內(nèi)容。所以,有沒(méi)有一種自動(dòng)化的方法,讓深度學(xué)習(xí)的網(wǎng)絡(luò)架構(gòu)在面對(duì)一個(gè)問(wèn)題的時(shí)候,能自主的演化其架構(gòu)?

今年,關(guān)心這個(gè)問(wèn)題的學(xué)者們共同發(fā)起了第一屆“自動(dòng)化機(jī)器學(xué)習(xí)國(guó)際會(huì)議”(International Conference on Automated Machine Learning,AutoML Conference 2022),會(huì)議近期于2022年7月25日-7月27日在巴爾的摩舉辦。

在大會(huì)上,學(xué)者們概括出了自動(dòng)化機(jī)器學(xué)習(xí)所涵蓋的 10 個(gè)主題:

  • Neural Architecture Search(NAS)

  • Hyperparameter Optimization(HPO)

  • Combined Algorithm Selection and Hyperparameter Optimization(CASH)

  • Automated Data Mining

  • Automated Reinforcement Learning(AutoRL)

  • Meta-Learning and Learning to Learn

  • Bayesian Optimization for AutoML

  • Evolutionary Algorithm for AutoML

  • Multi-Objective Optimization for AutoML

  • AutoAI(including Algorithm Configuration and Selection)

NAS 研究的是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的自動(dòng)搜索和設(shè)計(jì)。Hyperparameter Optimization (超參數(shù)優(yōu)化)自動(dòng)化的目標(biāo)是在我們訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時(shí)候,不必再去費(fèi)時(shí)挑參數(shù),去考慮哪一個(gè)參數(shù)好一點(diǎn)、哪一個(gè)參數(shù)差一點(diǎn),而是可以自動(dòng)預(yù)測(cè)和尋找。CASH 是個(gè)更難的問(wèn)題,指我們要解決一個(gè)具體問(wèn)題時(shí),可以自動(dòng)化地選擇哪些機(jī)器學(xué)習(xí)方法,而不是自己手動(dòng)設(shè)計(jì)。

第二階段:簡(jiǎn)單模型訓(xùn)練的軟件化

如果說(shuō)第一階段的自動(dòng)化主要面向?qū)I(yè)的算法研究人員,第二階段的系統(tǒng)化則面向一般的AI從業(yè)人員。他的主要目標(biāo)是在給定標(biāo)注好的數(shù)據(jù)的情況下,通過(guò)可視化的操作界面實(shí)現(xiàn)模型的訓(xùn)練。但第二階段只是個(gè)美好的故事,很難實(shí)際應(yīng)用,因?yàn)樗狈?duì)算法在實(shí)際場(chǎng)景中不斷迭代的支持。

第三階段:數(shù)據(jù)迭代自動(dòng)化

在算法設(shè)計(jì)自動(dòng)化的基礎(chǔ)上,正在發(fā)生一些變化。在去年的 NeurIPS 會(huì)議上,知名人工智能科學(xué)家吳恩達(dá)舉辦了一個(gè) workshop,討論“模型和數(shù)據(jù)到底哪一個(gè)更重要”。在設(shè)計(jì)化的工業(yè)生產(chǎn)中,他的觀點(diǎn)是,以模型為中心(Model-centric)的技術(shù)研發(fā)已經(jīng)轉(zhuǎn)化成以數(shù)據(jù)為中心(Data-centric)的技術(shù)研發(fā)。

模型和數(shù)據(jù)之間的關(guān)系可以這樣類(lèi)比(這是我個(gè)人的理解,不代表其他人的看法):模型和數(shù)據(jù)分別類(lèi)比為一個(gè)人的 IQ 和知識(shí)儲(chǔ)備。假設(shè)一個(gè)人天生的 IQ 很高,如果從小就把他養(yǎng)在家里,永遠(yuǎn)不跟社會(huì)打交道,也不讓他學(xué)習(xí)新的知識(shí),那么他還是會(huì)成長(zhǎng)為一個(gè)很笨的人。而即使一個(gè)人資質(zhì)平平,但如果他見(jiàn)過(guò)全世界各地的事物,去過(guò)歐美留學(xué),在中國(guó)做過(guò)實(shí)際的工業(yè)化生產(chǎn),看過(guò)很多設(shè)計(jì)的案例,那么他可能比那個(gè) IQ 高的人更厲害。所以如果這樣理解,模型就有點(diǎn)類(lèi)似于 IQ,數(shù)據(jù)就有點(diǎn)類(lèi)似于知識(shí)。二者同等重要,但到后面你會(huì)發(fā)現(xiàn)知識(shí)越來(lái)越重要,因?yàn)橹挥杏H歷過(guò)你才能知道,“知道”比“不知道”更重要。

在工業(yè)化大規(guī)模發(fā)展中,大家正在慢慢地從模型為中心的生產(chǎn)轉(zhuǎn)化為以數(shù)據(jù)為中心。下圖顯示的是吳恩達(dá)所做的一些實(shí)驗(yàn)對(duì)比:

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

我們可以看到,當(dāng)我們有了一個(gè)基礎(chǔ)算法之后,我們可從兩個(gè)維度來(lái)提高它的性能,一是以模型為中心的方法,即想盡各種辦法提高模型設(shè)計(jì)的復(fù)雜度、技術(shù)含量等;二是以數(shù)據(jù)為中心的方法,比如加數(shù)據(jù)(加數(shù)據(jù)也是有一些科學(xué)方法的,并不是加了數(shù)據(jù)后性能一定會(huì)提高)、檢查數(shù)據(jù)有沒(méi)有問(wèn)題等等。他發(fā)現(xiàn),以數(shù)據(jù)為中心的方法比以模型為中心的方法能更多地提高性能。我們自己做模型生產(chǎn)時(shí)也得到這樣一個(gè)結(jié)論:越到后面,數(shù)據(jù)的迭代越來(lái)越重要。因?yàn)樗心P偷姆?wù)實(shí)際上是針對(duì)某一個(gè)特定場(chǎng)景,使用的是特定的數(shù)據(jù)。

在我們過(guò)去八年的實(shí)踐中,我們發(fā)現(xiàn),算法的迭代事實(shí)上變成了數(shù)據(jù)的迭代。另外一個(gè)維度看,到現(xiàn)在為止,我們已經(jīng)研發(fā)了大量算法模型,但從來(lái)沒(méi)有一個(gè)模型是搜集了一次數(shù)據(jù)、調(diào)整一次參數(shù)就不用再調(diào)整了,很多模型都迭代了 5-6 年,迭代的主要內(nèi)容就是數(shù)據(jù)。因?yàn)槲覀兘鉀Q不同的需求時(shí),會(huì)遇到不同場(chǎng)景下的泛化性問(wèn)題,我們碰到的問(wèn)題越來(lái)越不一樣。這并不是算法不一樣的問(wèn)題,而是場(chǎng)景不一樣,要處理的數(shù)據(jù)也不一樣,所以我們要不停地更新迭代數(shù)據(jù),才能夠滿足不同場(chǎng)景應(yīng)用的需求。

既然算法迭代已經(jīng)變成了數(shù)據(jù)迭代,那么有沒(méi)有辦法把數(shù)據(jù)的迭代也自動(dòng)化呢?如果算法設(shè)計(jì)可以自動(dòng)化,那數(shù)據(jù)迭代也可以自動(dòng)化,所以端到端地完成自動(dòng)化的 AI 模型生產(chǎn)平臺(tái)就逐漸成為可能。

而數(shù)據(jù)迭代的自動(dòng)化需要技術(shù)的支持,同時(shí)還需要系統(tǒng)層級(jí)的支持。


2 YMIR:自動(dòng)化 AI 模型生產(chǎn)平臺(tái)


為什么要做AI模型生產(chǎn)的平臺(tái)化?如今,有自動(dòng)化 AI 模型生產(chǎn)平臺(tái)需求的,已經(jīng)不僅僅是谷歌、微軟、Meta、IBM、蘋(píng)果等大公司了,我們國(guó)內(nèi)就有不少房地產(chǎn)公司開(kāi)始投入 AI。他們都有人才的需求,自動(dòng)化的 AI 可以降低他們的成本。地產(chǎn)公司、物業(yè)公司,以及像寧德時(shí)代這樣做電池的公司,都在慢慢引入 AI 來(lái)解決實(shí)際問(wèn)題。

為什么會(huì)這樣?因?yàn)椋骸癆I 是新時(shí)代的電力”。AI 是一個(gè)非常基礎(chǔ)的能力,可以提高我們做事情的效率,AI 并不改變行業(yè),但是可以提升所在行業(yè)的生產(chǎn)效率,所以這種影響是全方位的,已經(jīng)慢慢地波及到非技術(shù)類(lèi)公司了。更不用說(shuō)現(xiàn)在廣泛的制造業(yè),制造過(guò)程中的很多環(huán)節(jié)都可以利用到 AI 的能力。如果想提高自己的國(guó)際競(jìng)爭(zhēng)力,提升自己的生產(chǎn)質(zhì)量,就需要 AI 的能力去賦能生產(chǎn)。

但問(wèn)題又來(lái)了,我們沒(méi)有這么多 AI 人才,我們需要更scalable的方法進(jìn)行AI的研發(fā)。因此我們就做了 YMIR 這樣一個(gè)自動(dòng)化模型生產(chǎn)系統(tǒng)。

YMIR 是一個(gè)開(kāi)源的、公益性的 AI 模型生產(chǎn)平臺(tái),是我們和國(guó)際知名高校以及硅谷科技公司一起聯(lián)合發(fā)起的國(guó)際開(kāi)源項(xiàng)目。我們還邀請(qǐng)到了多家美國(guó)科技巨頭公司的首席AI官擔(dān)任我們的項(xiàng)目顧問(wèn)。該項(xiàng)目已經(jīng)在 GitHub 上開(kāi)源。

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

Github 地址:https://github.com/industryessentials/ymir

YMIR:覆蓋模型生產(chǎn)全流程,聚焦模型的快速迭代能力

有了這些技術(shù)的支持之后,我們打造了一個(gè)工程化的系統(tǒng) YMIR。YMIR 覆蓋模型生產(chǎn)全流程,聚焦在模型的快速迭代上。我們不是訓(xùn)練出一個(gè)模型就結(jié)束了,而是把模型(通過(guò)數(shù)據(jù))迭代到能夠滿足現(xiàn)實(shí)場(chǎng)景的需求為止。

下圖是整個(gè)技術(shù)的框架,左邊是模型生產(chǎn)的初期階段,包括數(shù)據(jù)的準(zhǔn)備、數(shù)據(jù)的標(biāo)注、模型的訓(xùn)練,右邊是一個(gè)迭代的過(guò)程,包括準(zhǔn)備挖掘數(shù)據(jù)、數(shù)據(jù)標(biāo)注、更新訓(xùn)練集、再次做模型的訓(xùn)練。

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

研發(fā)實(shí)踐:算法生產(chǎn)效率提升 6 倍,算法人員需求降 1/10

我們做了很多大規(guī)模研發(fā)實(shí)驗(yàn),來(lái)看看在實(shí)際生產(chǎn)的時(shí)候,它到底能不能解決問(wèn)題。我們做了大概 6 個(gè)月的跟蹤,投入了 10 個(gè)標(biāo)注人員,他們要么是高中生,要么是職業(yè)院校畢業(yè)的學(xué)生,當(dāng)然也有算法人員。我們目前不能完全脫離算法人員,在面對(duì)一個(gè)問(wèn)題的時(shí)候,怎么將其分解成技術(shù)實(shí)現(xiàn),這還需要算法人員介入。同時(shí),我們還需要算法人員給標(biāo)注人員做一些簡(jiǎn)單的系統(tǒng)培訓(xùn)。算法人員投入 0.3 左右,即他們花費(fèi)一天中的 30% 的時(shí)間去做這些事,其余時(shí)間他們還要做算法研發(fā)、標(biāo)注文檔的審核、模型迭代情況的查看以及發(fā)現(xiàn)模型的問(wèn)題。

我們標(biāo)注的圖片總數(shù)是75萬(wàn),標(biāo)注圖片框數(shù) 100 萬(wàn)。標(biāo)注人員的工作內(nèi)容的 90% 用在標(biāo)注上,把要檢測(cè)的物體標(biāo)注出來(lái),10%的時(shí)間是用在操作 YMIR 系統(tǒng)上。我們?cè)?3 個(gè)月的時(shí)間里,使用 10 個(gè)標(biāo)注人員、0.3 個(gè)算法人員,生產(chǎn)了 50 個(gè)算法,而且這些算法大部分能夠滿足實(shí)際應(yīng)用的需求,比如應(yīng)急事件中的滅火器檢測(cè)、消防栓檢測(cè)等城市治理的需求。有的算法都已經(jīng)達(dá)到 97% 的精度。

這是我們使用這套系統(tǒng)和不使用這套系統(tǒng)的投入時(shí)間對(duì)比:

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

周期都是三個(gè)月左右,沒(méi)有這套系統(tǒng)的時(shí)候,算法人力的投入大概是36人/天,標(biāo)注人員的投入是24人/天,模型生產(chǎn)了六個(gè)算法。在投入了這一套系統(tǒng)之后,我們?cè)谙嗤臅r(shí)間周期內(nèi)可以生產(chǎn)51個(gè)算法,生產(chǎn)效率大概是17個(gè)算法/月,而以前是3個(gè)算法/月。使用自動(dòng)化平臺(tái)后,算法生產(chǎn)效率提升了 6 倍,但是算法人員的需求降為原來(lái)的 1/10。(公眾號(hào):雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))


3 對(duì)話王孝宇


AI 科技評(píng)論:云天勵(lì)飛是一家算法公司,為什么會(huì)研究 AutoAI ?

王孝宇:我們不是一家單純生產(chǎn)算法的公司,我們?yōu)榭蛻籼峁┒说蕉说腁I解決方案。

同時(shí)我們意識(shí)到我們國(guó)家技術(shù)智能化、信息化的基礎(chǔ)還比較薄弱。我們希望5年之后,公司都認(rèn)識(shí)到 AI 的重要性,投入去做AI升級(jí)的時(shí)候,自動(dòng)化的AI平臺(tái)將為他們節(jié)約大量的成本,并成為AI大規(guī)模普及的催化劑。而當(dāng)AI成為不可或缺的部分的時(shí)候,才有平臺(tái)化的硬件、平臺(tái)化的生產(chǎn)力工具、平臺(tái)化的服務(wù)的機(jī)會(huì)。我們希望YMIR AutoAI系統(tǒng)能推動(dòng)行業(yè)的進(jìn)步,并促使公司進(jìn)入下一代人工智能技術(shù)及服務(wù)的研發(fā)。

AI 科技評(píng)論:您提到 AutoML 經(jīng)歷了三個(gè)發(fā)展階段,它們的本質(zhì)不同在什么地方?

王孝宇:第一階段主要是在學(xué)術(shù)的范疇,比如學(xué)者們發(fā)起AutoML Conference 2022,大家主要在探索算法模型設(shè)計(jì)的哪些環(huán)節(jié)能夠用自動(dòng)化的方式去完成,以及用何種方式去實(shí)現(xiàn)自動(dòng)化,比如如何實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索、超參數(shù)優(yōu)化、混合算法選擇等等。

第二階段是打造出自動(dòng)化的算法模型生產(chǎn)系統(tǒng),把第一階段積累的方法論沉淀為平臺(tái)和系統(tǒng),以低代碼甚至零代碼的方式實(shí)現(xiàn)自動(dòng)化算法模型訓(xùn)練。但這類(lèi)平臺(tái)并沒(méi)有把模型迭代的過(guò)程落實(shí)到系統(tǒng)中去,沒(méi)有覆蓋真正模型訓(xùn)練的完整生產(chǎn)周期,所以滿足不了工業(yè)化生產(chǎn)的需求,我把這個(gè)階段的 AutoML 定位成一個(gè)「玩具」,玩一玩可以,但是不能真正用到實(shí)際任務(wù)中。因?yàn)闆](méi)有任何一個(gè)工業(yè)化生產(chǎn)的模型只訓(xùn)練一次技術(shù)就可以了,它是需要迭代的。

而我們正在做的是第三階段的 AutoML,即打造面向產(chǎn)業(yè)應(yīng)用的自動(dòng)化模型訓(xùn)練平臺(tái)。據(jù)我們的市場(chǎng)調(diào)研,YMIR 是市場(chǎng)上唯一一個(gè)覆蓋模型生產(chǎn)的全生命周期的系統(tǒng),它可以真正地用到工業(yè)化生產(chǎn)中??梢哉J(rèn)為,早期的 AutoML 偏向于純技術(shù),而 YMIR 更強(qiáng)調(diào)實(shí)際的工業(yè)應(yīng)用。我們做的是一個(gè)產(chǎn)品系統(tǒng),所以我們考慮的不僅是技術(shù)的問(wèn)題,還有工程和系統(tǒng)的問(wèn)題。

AI 科技評(píng)論:AutoML 和 AutoAI 兩個(gè)概念有什么區(qū)別?

王孝宇:我認(rèn)為,我們比較合適將 AutoML 的概念限制在它的第一階段,它專(zhuān)注于技術(shù)。Machine Learning 也只是人工智能技術(shù)之一,生產(chǎn)系統(tǒng)其實(shí)并不是傳統(tǒng)意義的 AutoML ,只是我們現(xiàn)在還找不到一個(gè)合適的詞去概括它。相比較而言, AutoAI 能更好地概括我們現(xiàn)在做的事情。

AI 科技評(píng)論:為什么說(shuō)數(shù)據(jù)越來(lái)越重要?

王孝宇:數(shù)據(jù)和算法等技術(shù)是相輔相成的。而最終技術(shù)如果要滿足應(yīng)用需求,數(shù)據(jù)到位是不可或缺的一環(huán)。

算法可以將AI模型精度從 50% 提高到 60%,但還是不能最終解決應(yīng)用中實(shí)際的問(wèn)題,而數(shù)據(jù)可以將AI系統(tǒng)精度從 60% 提高到 90%。因?yàn)槟P偷脑O(shè)計(jì)逐漸趨同、技術(shù)趨向成熟,這時(shí)數(shù)據(jù)的迭代變得比技術(shù)本身更重要。算法技術(shù)一直都很重要,但往往落地的臨門(mén)一腳,需要數(shù)據(jù)來(lái)推動(dòng)。

AI 科技評(píng)論:現(xiàn)在已經(jīng)有別的 AI 模型生產(chǎn)平臺(tái)聲稱(chēng)其訓(xùn)練一個(gè)模型只需要十幾分鐘,您怎么看?

王孝宇:模型要真正能部署到現(xiàn)實(shí)系統(tǒng)中去、真正能跑起來(lái)才有用。宣傳訓(xùn)練一個(gè)模型需要多短的時(shí)間是沒(méi)有意義的,因?yàn)檎嬲臅r(shí)間的是數(shù)據(jù)。模型訓(xùn)練可能只需要十幾分鐘,但百萬(wàn)的數(shù)據(jù)標(biāo)注也需要花費(fèi)一個(gè)月。在一個(gè)模型的全生產(chǎn)周期中,我們首先要對(duì)問(wèn)題進(jìn)行定義,之后收集數(shù)據(jù),再去訓(xùn)練模型。將訓(xùn)練完的模型用到現(xiàn)實(shí)的場(chǎng)景中,看是否存在什么問(wèn)題,然后再次收集大量的數(shù)據(jù)去做迭代,這個(gè)迭代的過(guò)程是很長(zhǎng)的。

我們的很多算法人員將 90% 的時(shí)間都用在數(shù)據(jù)的處理上, 只有 10% 的時(shí)間用來(lái)寫(xiě)代碼和研發(fā)模型結(jié)構(gòu)?;ヂ?lián)網(wǎng)的數(shù)據(jù)相對(duì)容易獲得,但也需要大量的工作,因?yàn)閿?shù)據(jù)的噪聲很大,尤其是隨著這一波人工智能的應(yīng)用場(chǎng)景慢慢下沉到線下,數(shù)據(jù)的噪聲變得更大。例如傳統(tǒng)企業(yè)中質(zhì)檢員拍攝的圖像數(shù)據(jù)、數(shù)據(jù)標(biāo)注質(zhì)量也會(huì)因?yàn)橘|(zhì)檢員的個(gè)人素質(zhì)差異而不同。

AI 科技評(píng)論:YMIR 平臺(tái)包含數(shù)據(jù)的自動(dòng)標(biāo)注嗎?

王孝宇:我們提供預(yù)標(biāo)注。所謂的“自動(dòng)標(biāo)注”是一個(gè)偽概念,最起碼在現(xiàn)階段沒(méi)有一個(gè)平臺(tái)可以真正做到完全自動(dòng)標(biāo)注,現(xiàn)在還需要人去介入,比如說(shuō)做井蓋檢測(cè)時(shí),我們提前給井蓋畫(huà)一個(gè)檢測(cè)框。如果畫(huà)對(duì)了,標(biāo)注人員就直接過(guò)審;如果沒(méi)對(duì),標(biāo)注人員還要再修改。

AI 科技評(píng)論:為什么你們目前還沒(méi)有選擇將 YMIR 商業(yè)化、而是免費(fèi)開(kāi)源?

王孝宇:我們國(guó)內(nèi)的消費(fèi)市場(chǎng)發(fā)展的非常好,因?yàn)橛辛己玫囊苿?dòng)互聯(lián)網(wǎng)基礎(chǔ)。而我們 ToB 服務(wù)的企業(yè)相較發(fā)達(dá)國(guó)家差距巨大,我想相當(dāng)一部分原因是我們沒(méi)有良好的企業(yè)信息化基礎(chǔ)和企業(yè)服務(wù)生態(tài)。我們其實(shí)是一個(gè)底層的布道者角色,想要促進(jìn)企業(yè)服務(wù)生態(tài)的繁榮。所以我們的平臺(tái)是完全開(kāi)源的,無(wú)論你是個(gè)人用還是把它商業(yè)化都是免費(fèi)的。這的確有些理想主義,但我們認(rèn)為,整個(gè)行業(yè)好,我們就好,這是一種長(zhǎng)期主義。(公眾號(hào):雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)