1
本文作者: 劉芳平 | 2016-10-27 18:14 |
機(jī)器如何懂時(shí)尚?這是碼隆科技上一款產(chǎn)品希望解決的問(wèn)題,那一次他們推出了StyleAI,希望用圖像識(shí)別結(jié)合深度學(xué)習(xí)來(lái)破解時(shí)尚密碼。
10月24日,該公司更進(jìn)一步,推出ProductAI,將AI做成一項(xiàng)云服務(wù),希望讓沒(méi)有AI技術(shù)能力的公司也能利用這一全新技術(shù)。同時(shí)還宣布獲得6200萬(wàn)A輪融資,目前該公司員工人數(shù)還不到30人。
StyleAI是一項(xiàng)AI的具體應(yīng)用,而此次推出的ProductAI則是一款企業(yè)端產(chǎn)品,具體來(lái)說(shuō)它是一項(xiàng)PaaS(Platform-as-a-Service)服務(wù),開(kāi)發(fā)者可通過(guò)調(diào)用其接口來(lái)獲得人工智能服務(wù)。
ProductAI背后的兩項(xiàng)核心技術(shù)分別是“以圖搜圖”和“圖像識(shí)別”,它可以理解圖片“表達(dá)了什么意思”,還可以對(duì)圖片進(jìn)行分類、處理、標(biāo)注,實(shí)現(xiàn)更多應(yīng)用。
在發(fā)布會(huì)現(xiàn)場(chǎng),碼隆的程序員演示了用5分鐘時(shí)間在ProductAI平臺(tái)上搭建一個(gè)定制化的以圖搜圖引擎。
其收費(fèi)模式也和一般的云服務(wù)類似,按照API接口調(diào)用量來(lái)收費(fèi),通常在千次10元左右,取決于調(diào)用的API和使用總量。目前ProductAI的客戶包括中國(guó)紡織信息中心、視覺(jué)中國(guó)、微軟在線暴風(fēng)影音等 。
人工智能并不是一項(xiàng)解決所有問(wèn)題的技術(shù),它更適合在某個(gè)非常細(xì)分的領(lǐng)域發(fā)揮自己的功能。下面是ProductAI提供的一些主要功能。
假設(shè)你拍下了一張照片,照片中有麥當(dāng)勞、公交車(chē)、老人、楊樹(shù)、白云、藍(lán)天,那么,ProductAI可以精準(zhǔn)的將照片中的元素識(shí)別出來(lái)。比如下面這張圖片中,ProductAI將所有13輛汽車(chē)都識(shí)別出來(lái)。
ProductAI可以“以圖搜圖”,識(shí)別目標(biāo)圖片中的類似場(chǎng)景。下圖是根據(jù)城堡圖片,搜索出的類似圖片。
ProductAI可以為海量的圖片自動(dòng)打標(biāo)簽,通過(guò)綜合識(shí)別模型,挖掘出語(yǔ)義信息并用文字標(biāo)簽的形式將這些信息表達(dá)出來(lái)??山庾x的信息包括圖片中的客觀內(nèi)容(老人、樹(shù)、音樂(lè)廳等)、主觀感受(積極、成功、快樂(lè)等)、內(nèi)容衍生主題(健康生活方式、家庭等)、圖片顏色(彩色、黑白等)、圖片產(chǎn)生方式(攝影、剪貼畫(huà)等)、拍攝手法(剪影、留白、逆光等)等。
AI不是搜索引擎,但在很多層面和搜索引擎類似。在之前接受雷鋒網(wǎng)采訪時(shí),碼隆科技的聯(lián)合創(chuàng)始人Matt Scott解釋了讓機(jī)器認(rèn)識(shí)時(shí)尚的背后技術(shù),
首先,我們從網(wǎng)絡(luò)上收集關(guān)于時(shí)尚的海量數(shù)據(jù),找出一些已經(jīng)存在時(shí)尚標(biāo)簽的內(nèi)容(比如這張圖片是某位時(shí)尚明星的著裝照);然后,我們創(chuàng)造一個(gè)模型來(lái)分析這些數(shù)據(jù),用海量的數(shù)據(jù)來(lái)訓(xùn)練它,使它能夠理解圖片的色彩、紋理和Style,同時(shí)還有一小部分人可以幫忙給數(shù)據(jù)貼上標(biāo)簽;總的來(lái)說(shuō)就是用類似搜索引擎的數(shù)據(jù)加上很強(qiáng)大的AI模型,收集數(shù)據(jù)并分析這里面的時(shí)尚視覺(jué)元素。
之后,我們會(huì)把分析的結(jié)果,比如版型、類別和衣服之間的關(guān)聯(lián)等提取出來(lái),去匹配你的模型和喜好。
最后的產(chǎn)品,是一款可以了解用戶想要什么的個(gè)性化時(shí)尚工具。這其中AI的部分,主要就是通過(guò)深度學(xué)習(xí)構(gòu)建起來(lái)的可以自我學(xué)習(xí)的模型,并用數(shù)據(jù)去訓(xùn)練這個(gè)模型。
而ProductAI是面向各種不同用戶定制化的AI服務(wù),在不同的應(yīng)用場(chǎng)景中,它需要?jiǎng)偃尾煌娜蝿?wù),這意味著深度學(xué)習(xí)的模型也是不同的。
一個(gè)深度學(xué)習(xí)的模型,適用于某一個(gè)任務(wù)。就好像一個(gè)人,他去上大學(xué),學(xué)的是中文?還是物理?還是建筑,大腦里面的結(jié)構(gòu)是不同的,這個(gè)不同是知識(shí)上有不同。那我們呢?就相當(dāng)于要構(gòu)建一個(gè)這樣結(jié)構(gòu)的大腦,去適應(yīng)相應(yīng)的任務(wù),就好像不同的人有不同的專業(yè)一樣。
Matt解釋道。
Matt告訴我們,在構(gòu)建特別的AI應(yīng)用中時(shí),一共有四個(gè)步驟:
首先是研究問(wèn)題,明確我們需要解決的問(wèn)題是什么,希望得到什么答案;
接著,建立適用于這個(gè)問(wèn)題的神經(jīng)網(wǎng)絡(luò)架構(gòu);
然后,用海量的數(shù)據(jù)來(lái)訓(xùn)練這個(gè)架構(gòu);
最后,如果沒(méi)有解決問(wèn)題,再回去改。
碼隆科技與中國(guó)紡織信息中心的合作就是一個(gè)例子,需要解決的問(wèn)題是識(shí)別面料,碼隆設(shè)計(jì)出一個(gè)神經(jīng)網(wǎng)絡(luò)架構(gòu),再利用中國(guó)紡織信息中心大量的面料圖像來(lái)訓(xùn)練這個(gè)架構(gòu),最后得到的就是一款可以智能識(shí)別服裝面料的工具。
這里面架構(gòu)的好壞,數(shù)據(jù)的好壞與多寡都會(huì)影響最終工具的性能。碼隆科技表示,ProductAI平臺(tái)的圖像分類和識(shí)別度匹配識(shí)別能力比專業(yè)人員還高8%,顯示其在人工智能方面的技術(shù)實(shí)力。
碼隆科技創(chuàng)立于2014年7月,兩位創(chuàng)始人黃鼎隆(CEO)和Matt Scott(CTO),一位是中國(guó)人一位是美國(guó)人,兩人曾在微軟共同合作“必應(yīng)詞典”系列產(chǎn)品。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。