1
本文作者: 思睿 | 2015-09-01 15:16 |
想要找到一張完美的 GIF 圖是一件很難的事。雖然這些內(nèi)容都可以通過(guò)互聯(lián)網(wǎng)搜索,但從得到的結(jié)果來(lái)看,仍然有數(shù)不清的 GIF 圖可供選擇。而找一張能準(zhǔn)確呈現(xiàn)你想要的效果的 GIF 圖就更困難了。目前,一個(gè)名為 Giftawk 的全新Web應(yīng)用,可以相當(dāng)準(zhǔn)確地將語(yǔ)音要求轉(zhuǎn)換成 GIF 格式圖片。
這款基于瀏覽器的應(yīng)用程序會(huì)訪問(wèn)你的麥克風(fēng),之后你對(duì)著它說(shuō)話即可。你可以說(shuō)出任何想要的內(nèi)容,它會(huì)為你找出能反映所說(shuō)內(nèi)容的一張或多張 GIF 圖,就如下圖所呈現(xiàn)的那樣。
不過(guò),當(dāng)你嘗試說(shuō)出完整句子的時(shí)候,事情就變得更加復(fù)雜了,正如下圖所示。
開(kāi)發(fā)者 Adam Lusted 開(kāi)發(fā)的這個(gè)應(yīng)用,使用了 Chrome 的語(yǔ)音識(shí)別API。他表示:“我會(huì)分拆這些短語(yǔ),并從 Giphy API (Giphy是一款專搜GIF的搜索引擎)上為每一個(gè)字獲取相關(guān)的 GIF 圖。這比較容易,但我不確定它是否可以奏效,畢竟語(yǔ)音識(shí)別是一個(gè)尖端技術(shù)?!?/p>
Giftawk 是首批語(yǔ)音轉(zhuǎn) GIF 程序之一,但它不是唯一一款試圖連接語(yǔ)音和動(dòng)畫(huà)圖像的應(yīng)用。去年,MIT 媒體實(shí)驗(yàn)室推出了 GIFGIF,用多種方式將普通的溝通變成 GIF 圖片。它包含了文本轉(zhuǎn) GIF(輸入一些內(nèi)容,并以 GIF輸出),面部轉(zhuǎn) GIF(相機(jī)采用面部分析來(lái)生成GIF)。GIFGIF 還可以使用它接收到的數(shù)據(jù),將情緒評(píng)估加入到 GIF 圖中,讓我們進(jìn)一步理解它們。
盡管團(tuán)隊(duì)希望看到不同的國(guó)家用戶如何在 GIF 中使用情緒,但用這一系統(tǒng)大多都是美國(guó)人。不過(guò)MIT 項(xiàng)目的工作人員 Travis Rich 表示,他們?nèi)岳眠@些數(shù)據(jù)得到了一些結(jié)論。
Rich 表示,不同的人使用GIF的程度是不同的。很多老年人無(wú)法理解為什么會(huì)有人在郵件或通訊客戶端中使用 GIF,他們能夠理解表情符號(hào)(emoji),但無(wú)法看到的 GIF 中的隱藏含義。例如,他們會(huì)將明星跳舞的 GIF 圖簡(jiǎn)單理解為明星本人,而不是圖像所要表達(dá)的“開(kāi)心。
如今,GIFGIF 也轉(zhuǎn)而使用 Giphy API 來(lái)驅(qū)動(dòng)其應(yīng)用程序,而這也正是后者希望看到的。負(fù)責(zé) Giphy API 集成的 Nam Nguyen 表示:“我們?yōu)樗O(shè)定的目標(biāo)是,讓它可以足夠簡(jiǎn)單地讓開(kāi)發(fā)人員把搜索和共享功能,集成到他們開(kāi)發(fā)的應(yīng)用中?!彼赋?,有幾個(gè)類似的項(xiàng)目都在使用 Giphy API,像是 Gifline(翻譯郵件中的GIF)和 ZZZine(將你的推文轉(zhuǎn)成GIF)。
不過(guò)將文本和語(yǔ)音轉(zhuǎn)換成更加豐富有趣的表達(dá)方式,首選并非 GIF,主宰這個(gè)領(lǐng)域的是表情符號(hào) emoji——市面上已有無(wú)數(shù) emoji 轉(zhuǎn)換服務(wù)可供選擇。原因可能是,表情符號(hào)更容易讓人們理解,它們是一種更加緊湊的語(yǔ)言形式。也可能是 emoji 和書(shū)面和口頭語(yǔ)言一樣,都是用 Unicode 來(lái)編碼。
總體來(lái)說(shuō),表情符號(hào)擁有更多的組合,這意味著它們可以被轉(zhuǎn)換成比單一的 GIF 圖更復(fù)雜的含義。
從轉(zhuǎn)換目的來(lái)看,如果 Google 要擴(kuò)展其圖像識(shí)別和標(biāo)記系統(tǒng),從而識(shí)別 GIF 圖片,它可能需要付出很大努力。但emoji 卻能以更直接的方式,呈現(xiàn)出更加接近詞組或概念的結(jié)果。
不過(guò)雖然表情符號(hào)更容易理解,但并不意味著我們已經(jīng)對(duì)它的含義有了普遍認(rèn)識(shí)。最近一項(xiàng)研究發(fā)現(xiàn),根據(jù)地區(qū)和語(yǔ)言的不同,每個(gè)人對(duì) emoji 的理解也會(huì)非常不同。
另外,開(kāi)發(fā)一個(gè)優(yōu)秀的 GIF 轉(zhuǎn)換器需要讓它進(jìn)一步了解我們?nèi)绾谓忉寛D像。有些句子在結(jié)構(gòu)上差不多,但意思卻完全不同。讓轉(zhuǎn)換器解析這些看似平凡簡(jiǎn)單的句子,才是真正困難的部分。
GIFGIF 曾做出過(guò)一個(gè)演示,展示了其識(shí)別情緒的能力。如果最終有人能夠作出這樣的情緒轉(zhuǎn)化為文本的引擎,就可以將這個(gè)引擎接入到 GIFGIF 的后端,并更準(zhǔn)確地生成表達(dá)我們感情的 GIF 圖。但現(xiàn)在,至少在搜索功能上,我們只能通過(guò)關(guān)鍵詞來(lái)篩選想要的 GIF 圖。
via wired
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。