1
本文作者: 劉芳平 | 2016-10-27 18:14 |
機器如何懂時尚?這是碼隆科技上一款產(chǎn)品希望解決的問題,那一次他們推出了StyleAI,希望用圖像識別結(jié)合深度學(xué)習(xí)來破解時尚密碼。
10月24日,該公司更進(jìn)一步,推出ProductAI,將AI做成一項云服務(wù),希望讓沒有AI技術(shù)能力的公司也能利用這一全新技術(shù)。同時還宣布獲得6200萬A輪融資,目前該公司員工人數(shù)還不到30人。
StyleAI是一項AI的具體應(yīng)用,而此次推出的ProductAI則是一款企業(yè)端產(chǎn)品,具體來說它是一項PaaS(Platform-as-a-Service)服務(wù),開發(fā)者可通過調(diào)用其接口來獲得人工智能服務(wù)。
ProductAI背后的兩項核心技術(shù)分別是“以圖搜圖”和“圖像識別”,它可以理解圖片“表達(dá)了什么意思”,還可以對圖片進(jìn)行分類、處理、標(biāo)注,實現(xiàn)更多應(yīng)用。
在發(fā)布會現(xiàn)場,碼隆的程序員演示了用5分鐘時間在ProductAI平臺上搭建一個定制化的以圖搜圖引擎。
其收費模式也和一般的云服務(wù)類似,按照API接口調(diào)用量來收費,通常在千次10元左右,取決于調(diào)用的API和使用總量。目前ProductAI的客戶包括中國紡織信息中心、視覺中國、微軟在線暴風(fēng)影音等 。
人工智能并不是一項解決所有問題的技術(shù),它更適合在某個非常細(xì)分的領(lǐng)域發(fā)揮自己的功能。下面是ProductAI提供的一些主要功能。
假設(shè)你拍下了一張照片,照片中有麥當(dāng)勞、公交車、老人、楊樹、白云、藍(lán)天,那么,ProductAI可以精準(zhǔn)的將照片中的元素識別出來。比如下面這張圖片中,ProductAI將所有13輛汽車都識別出來。
ProductAI可以“以圖搜圖”,識別目標(biāo)圖片中的類似場景。下圖是根據(jù)城堡圖片,搜索出的類似圖片。
ProductAI可以為海量的圖片自動打標(biāo)簽,通過綜合識別模型,挖掘出語義信息并用文字標(biāo)簽的形式將這些信息表達(dá)出來??山庾x的信息包括圖片中的客觀內(nèi)容(老人、樹、音樂廳等)、主觀感受(積極、成功、快樂等)、內(nèi)容衍生主題(健康生活方式、家庭等)、圖片顏色(彩色、黑白等)、圖片產(chǎn)生方式(攝影、剪貼畫等)、拍攝手法(剪影、留白、逆光等)等。
AI不是搜索引擎,但在很多層面和搜索引擎類似。在之前接受雷鋒網(wǎng)采訪時,碼隆科技的聯(lián)合創(chuàng)始人Matt Scott解釋了讓機器認(rèn)識時尚的背后技術(shù),
首先,我們從網(wǎng)絡(luò)上收集關(guān)于時尚的海量數(shù)據(jù),找出一些已經(jīng)存在時尚標(biāo)簽的內(nèi)容(比如這張圖片是某位時尚明星的著裝照);然后,我們創(chuàng)造一個模型來分析這些數(shù)據(jù),用海量的數(shù)據(jù)來訓(xùn)練它,使它能夠理解圖片的色彩、紋理和Style,同時還有一小部分人可以幫忙給數(shù)據(jù)貼上標(biāo)簽;總的來說就是用類似搜索引擎的數(shù)據(jù)加上很強大的AI模型,收集數(shù)據(jù)并分析這里面的時尚視覺元素。
之后,我們會把分析的結(jié)果,比如版型、類別和衣服之間的關(guān)聯(lián)等提取出來,去匹配你的模型和喜好。
最后的產(chǎn)品,是一款可以了解用戶想要什么的個性化時尚工具。這其中AI的部分,主要就是通過深度學(xué)習(xí)構(gòu)建起來的可以自我學(xué)習(xí)的模型,并用數(shù)據(jù)去訓(xùn)練這個模型。
而ProductAI是面向各種不同用戶定制化的AI服務(wù),在不同的應(yīng)用場景中,它需要勝任不同的任務(wù),這意味著深度學(xué)習(xí)的模型也是不同的。
一個深度學(xué)習(xí)的模型,適用于某一個任務(wù)。就好像一個人,他去上大學(xué),學(xué)的是中文?還是物理?還是建筑,大腦里面的結(jié)構(gòu)是不同的,這個不同是知識上有不同。那我們呢?就相當(dāng)于要構(gòu)建一個這樣結(jié)構(gòu)的大腦,去適應(yīng)相應(yīng)的任務(wù),就好像不同的人有不同的專業(yè)一樣。
Matt解釋道。
Matt告訴我們,在構(gòu)建特別的AI應(yīng)用中時,一共有四個步驟:
首先是研究問題,明確我們需要解決的問題是什么,希望得到什么答案;
接著,建立適用于這個問題的神經(jīng)網(wǎng)絡(luò)架構(gòu);
然后,用海量的數(shù)據(jù)來訓(xùn)練這個架構(gòu);
最后,如果沒有解決問題,再回去改。
碼隆科技與中國紡織信息中心的合作就是一個例子,需要解決的問題是識別面料,碼隆設(shè)計出一個神經(jīng)網(wǎng)絡(luò)架構(gòu),再利用中國紡織信息中心大量的面料圖像來訓(xùn)練這個架構(gòu),最后得到的就是一款可以智能識別服裝面料的工具。
這里面架構(gòu)的好壞,數(shù)據(jù)的好壞與多寡都會影響最終工具的性能。碼隆科技表示,ProductAI平臺的圖像分類和識別度匹配識別能力比專業(yè)人員還高8%,顯示其在人工智能方面的技術(shù)實力。
碼隆科技創(chuàng)立于2014年7月,兩位創(chuàng)始人黃鼎?。–EO)和Matt Scott(CTO),一位是中國人一位是美國人,兩人曾在微軟共同合作“必應(yīng)詞典”系列產(chǎn)品。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。