0
本文作者: 井三胖 | 2015-02-03 22:55 |
注:本文來(lái)自知名科技投資人Chris Dixon的私人博客cdixon.org
把創(chuàng)業(yè)的過程形象化來(lái)說,在一個(gè)idea maze/思維迷局中,一名合格的創(chuàng)業(yè)者能夠預(yù)測(cè)到在某個(gè)岔路口應(yīng)該如何轉(zhuǎn)向,便能夠帶領(lǐng)公司走向財(cái)富巔峰;反其道行之,則會(huì)引至衰敗末路。而一名不合格的創(chuàng)業(yè)者,卻只知道跟風(fēng)似的追趕流媒體、圖片分享、P2P的浪潮,但對(duì)自身所處的大行業(yè)的歷史卻是一無(wú)所知,他們不會(huì)從前人失敗的教訓(xùn)中吸取到經(jīng)驗(yàn),并且也無(wú)法預(yù)測(cè)到下一個(gè)將會(huì)引起變革的新技術(shù)。
我認(rèn)為,如果把這個(gè)問題賦予更加具體化的實(shí)例將會(huì)是更加有趣。所以我選擇以AI創(chuàng)業(yè)公司為例,以下便是我為人工智能創(chuàng)業(yè)者們畫的idea maze草圖。
機(jī)器學(xué)習(xí)圈內(nèi)有一句流行的話叫做“machine learning is really good at partially solving just about any problem/機(jī)器學(xué)習(xí)能夠很好的解決絕大多數(shù)的難題”。話是這么說沒錯(cuò),要做出一個(gè)能夠適用于80%-90%情況下的通用模型的確不難。但是在這之后,便是需要時(shí)間、精力、財(cái)力的不斷投入來(lái)維持模型的正常運(yùn)轉(zhuǎn)。根據(jù)普適性的經(jīng)驗(yàn)來(lái)說,實(shí)現(xiàn)80%的準(zhǔn)確性和通用性,僅僅只需要花費(fèi)數(shù)個(gè)月的時(shí)間就可以了,但是剩下的20%的部分卻是能夠畫上許多人好多年的時(shí)間,或者是終其一生來(lái)實(shí)現(xiàn)的。
用戶體驗(yàn)容差
于是在第一步你便要做出艱難的選擇了:
1、要么是不斷鉆研下去將準(zhǔn)確性提升到100%
2、要么適用于大多數(shù)情況,但是部分正確的產(chǎn)品
如果你選擇第二點(diǎn),那就會(huì)遇到通常所說的“fault tolerant UX/用戶體驗(yàn)容差”
我們平時(shí)的生活中已經(jīng)不知不覺的接觸了太多的容差的例子。比如說iOS系統(tǒng)的自動(dòng)更正功能,或者是在Google搜索的結(jié)果“did you mean X?”?;蛘邔挿盒┱f,你可以把Google搜索引擎本身就當(dāng)作一個(gè)很好的用戶體驗(yàn)容差的范本,因?yàn)樗]有直接跳轉(zhuǎn)到第一條搜索結(jié)果,而是向用戶推送了10條結(jié)果來(lái)供挑選。
不過當(dāng)你決定實(shí)現(xiàn)100%準(zhǔn)確性,那便又是一種新做法了。畢竟是由人類發(fā)明的算法,你當(dāng)然不能單純的依賴算法來(lái)幫你實(shí)現(xiàn)最后的10%—20%的準(zhǔn)確性目標(biāo),你只能通過“死記硬背的笨辦法”——用盡可能多的數(shù)據(jù)來(lái)訓(xùn)練調(diào)教你的模型。數(shù)據(jù)是AI 的核心要素,因?yàn)椋?/p>
在算法和計(jì)算資源完備的情況下,數(shù)據(jù)是唯一缺失的關(guān)鍵點(diǎn)以及最重要的成分;
算法大多數(shù)是公開的資源,而優(yōu)秀的數(shù)據(jù)要么是仍未誕生,要么是被私人擁有。
面對(duì)數(shù)據(jù)你要做的只有一句話:不斷不斷細(xì)分它。即便你已經(jīng)身處一個(gè)細(xì)分化的領(lǐng)域中,也要嘗試著進(jìn)一步細(xì)分。如果你想打造一個(gè)能解決所有問題的機(jī)器人,還不如先打造一個(gè)能幫助安排日程的機(jī)器人。
如果你的目標(biāo)是建立一個(gè)X,那么便需要先在細(xì)分領(lǐng)域下建立MVP,來(lái)實(shí)現(xiàn)部分的X,從而各個(gè)擊破才有可能最終實(shí)現(xiàn)整體的X。一個(gè)建議是,要嘗試不斷細(xì)分下去,一直到你無(wú)法細(xì)分的極限了,畢竟當(dāng)項(xiàng)目獲得成功之后,再逐步擴(kuò)大市場(chǎng)反而是更加容易的事情。
寬泛些說,數(shù)據(jù)的來(lái)源大致有兩個(gè)方向:
1、建立自己的數(shù)據(jù)
2、眾包
當(dāng)然我們又可以舉出兩個(gè)生動(dòng)活潑的例子,Google地圖和Waze。Google地圖的龐大數(shù)據(jù)庫(kù)是建立在成千上萬(wàn)名雇員的實(shí)地測(cè)繪勘量的,而Waze做的是召集全世界上百萬(wàn)號(hào)人一起眾包來(lái)實(shí)現(xiàn)這一目的。所以說除非你像Google一樣財(cái)大氣粗能夠承擔(dān)得起自己?jiǎn)胃色@得資源,不然還是眾包比較適合。
于是我們又走到了下一個(gè)關(guān)鍵結(jié)點(diǎn),創(chuàng)業(yè)公司如何獲取數(shù)據(jù)?
1、將公共資源數(shù)據(jù)“化為己有”
2、眾包
當(dāng)然,第一種方法最簡(jiǎn)單粗暴的例子便是從維基百科上“扣數(shù)據(jù)”。其實(shí)也有很多創(chuàng)業(yè)公司們已經(jīng)嘗試著緊抱維基好大腿,不過并沒有多少能成功的。
對(duì)于小團(tuán)隊(duì)來(lái)說,花錢最少也最為可行的辦法當(dāng)然還是眾包。眾包成功與否的關(guān)鍵點(diǎn)便在于,如何設(shè)計(jì)完善的激勵(lì)系統(tǒng),讓用戶們從數(shù)據(jù)庫(kù)中取回?cái)?shù)據(jù)之后,能夠自覺的將數(shù)據(jù)傳回?
關(guān)于這一點(diǎn),我把自己的親身經(jīng)歷分享給大家。去年我投資了一家名為Wit.ai的公司,Wit從事的是為開發(fā)者提供語(yǔ)音轉(zhuǎn)換為文本或者自然語(yǔ)言的服務(wù)。坦誠(chéng)的說,Wit.ai的1.0版本出錯(cuò)率并不低,但是公司卻提供了API接口和控制面板邀請(qǐng)開發(fā)者一起測(cè)試并更正bug。在這個(gè)過程中,不少用戶不僅用上了免費(fèi)的服務(wù),而在廣大用戶的“眾包智慧”下,Wit.ai系統(tǒng)也變得更加完善。值得慶賀的事,隨后Wit公司便被Facebook收購(gòu),但這整個(gè)過程的確可以稱得上是許多創(chuàng)業(yè)者們借鑒的范本。
以上只是我為AI創(chuàng)業(yè)公司繪制的idea maze草圖的粗略解釋,不過仍有幾點(diǎn)溫馨提示,
1、草圖的結(jié)論進(jìn)攻參考,可以成為大家的討論一句,但是卻不能夠成為創(chuàng)業(yè)的信條
2、成功的新技術(shù)大多是“另辟蹊徑的”,正如當(dāng)年的互聯(lián)網(wǎng)、智能手機(jī)、云計(jì)算和比特幣那樣,最開始我們都以為是微不足道的小事物,沒想到最后竟掀起技術(shù)變革的大波瀾。
所以不要忽視任何一點(diǎn)你所謂的“細(xì)枝末節(jié)”。
via cdixon
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。