7
本文作者: 柏蓉 | 2015-10-09 17:17 |
像上圖那樣的輸入法笑話,相信不少人在日常生活中都會(huì)遇到。其結(jié)果是帶來(lái)不同程度的傷害值,輕則弄巧成拙貽笑大方,重則……沒(méi)有上限。其實(shí),隨著人們花費(fèi)在手機(jī)上的時(shí)間越來(lái)越多,輸入法的準(zhǔn)確也變得越來(lái)越重要。
今天,第三方輸入法“大牌”SwiftKey在其官網(wǎng)博客上很興奮地向大家介紹其最新并具有突破性的產(chǎn)品——采用人工神經(jīng)網(wǎng)絡(luò)的輸入法SwiftKey Neural。不過(guò),目前只是Alpha測(cè)試版,安卓4.4以上的用戶可以到這里下載SwiftKey Neural Alpha進(jìn)行體驗(yàn)。
SwiftKey表示,SwiftKey Neural只是探索神經(jīng)網(wǎng)絡(luò)模型(neural model)的第一步,他們的愿景通過(guò)輸入法全面了解用戶,并根據(jù)用戶的語(yǔ)氣語(yǔ)調(diào)等預(yù)測(cè)整段回復(fù)而不是下一個(gè)字。說(shuō)的恐怖一點(diǎn)就是模仿你來(lái)回應(yīng)對(duì)方。
在博客中,SwiftKey表示SwiftKey Neural是全球首個(gè)采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)的手機(jī)輸入法,而且相比于目前主流的N-gram語(yǔ)言模型輸入法技術(shù),新的輸入法預(yù)測(cè)更為準(zhǔn)確,并更懂用戶。因?yàn)镾wiftKey Neural的神經(jīng)網(wǎng)絡(luò)模型會(huì)像人腦一樣理解輸入的詞句,并通過(guò)上下文的語(yǔ)境預(yù)測(cè)出用戶從未輸入的詞句。這與SwiftKey過(guò)去所采用的N-gram為詞語(yǔ)的出現(xiàn)概率賦予權(quán)重有很大不同。
具體來(lái)說(shuō),N-gram模型基于一種假設(shè),即第n個(gè)詞的出現(xiàn)只與前面N-1個(gè)詞相關(guān),與其它不相關(guān)。而整句的概率就是各個(gè)詞出現(xiàn)概率的乘積。這些概率可以從語(yǔ)料庫(kù)中統(tǒng)計(jì),也會(huì)根據(jù)個(gè)人打字的數(shù)據(jù)來(lái)實(shí)現(xiàn)記錄。比如說(shuō),“我待會(huì)去_____(公司0.1,飯?zhí)?.07,廁所0.05……)”。這時(shí)候,輸入法會(huì)優(yōu)先彈出概率比較大的“公司”。這種方式有一種很嚴(yán)重的缺陷,不能理解每個(gè)詞語(yǔ)的意思,只能“重復(fù)”過(guò)往已經(jīng)出現(xiàn)過(guò)的語(yǔ)序。比如,在“我今晚開(kāi)會(huì),晚飯不__”這句話中,N-gram模型會(huì)根據(jù)個(gè)人詞句使用概率彈出“行,要,吃……”。但是,以人的思考模式,這兩小口對(duì)話的應(yīng)該是“晚飯不做了”。 而SwiftKey Neural輸入法正式想要達(dá)到后者這般效果——理解對(duì)話語(yǔ)境。
SwiftKey Neural實(shí)現(xiàn)對(duì)詞語(yǔ)的理解是通過(guò)賦予編碼。如上圖,通過(guò)大量數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型給“Meet you at the”四個(gè)字進(jìn)行編碼,從而“理解”這些單詞間的關(guān)系,最后再預(yù)測(cè)下一個(gè)字的編碼。當(dāng)然,這種做法需要巨量的運(yùn)算資源。為此,SwiftKey也做了相應(yīng)的準(zhǔn)備。SwiftKey表示,目前已經(jīng)在大型服務(wù)器上部署好這應(yīng)用。
有業(yè)內(nèi)人士向雷鋒網(wǎng)表示,SwiftKey Neural所采用的神經(jīng)網(wǎng)絡(luò)技術(shù)在25年前就流行了,有很多預(yù)測(cè)法都在運(yùn)用這種技術(shù)尤其是工業(yè)應(yīng)用,因?yàn)樗容^簡(jiǎn)單,預(yù)測(cè)速度快。不過(guò),這種技術(shù)有一種很大的缺陷,其優(yōu)化速度和優(yōu)化能力差,造成技術(shù)不穩(wěn)定。
在雷鋒網(wǎng)編輯看來(lái),無(wú)論是N-gram模型還是神經(jīng)網(wǎng)絡(luò)模型,SwiftKey所尋找的不過(guò)是一個(gè)最佳的預(yù)測(cè)參數(shù)。還有一點(diǎn)很重要,如果各位讀者對(duì)這個(gè)問(wèn)題感興趣,歡迎給雷鋒網(wǎng)留言,我們一起探討?。?/strong>
最后附上N-gram模型和神經(jīng)網(wǎng)絡(luò)模型的圖解:
via:swiftkey
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。