丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給三川
發(fā)送

0

號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

本文作者: 三川 2017-09-08 05:22
導(dǎo)語:上周,這家位于德國科隆的公司聲稱,DeepL 在盲測(cè)中以壓倒性優(yōu)勢(shì)擊敗了谷歌、微軟與 Facebook 的 NMT 系統(tǒng)。

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

鑒于數(shù)據(jù)、計(jì)算力、算法等諸多門檻,自神經(jīng)機(jī)器翻譯(NMT)產(chǎn)品化以來,在很大程度上便是互聯(lián)網(wǎng)巨頭們的競(jìng)技場(chǎng)。

如今,又一個(gè)新的挑戰(zhàn)者高調(diào)加入進(jìn)來,直接把矛頭指向堪稱行業(yè)技術(shù)標(biāo)桿的谷歌、微軟以及 Facebook。

上周,來自德國的 DeepL 翻譯上線,號(hào)稱實(shí)現(xiàn)了 NMT 技術(shù)的新突破,打造出了“世界上最精確、語言組織最自然的機(jī)器翻譯系統(tǒng)”;并宣布在自家組織的盲測(cè)中,打敗了谷歌翻譯以及微軟與 Facebook 的 NMT 系統(tǒng),釁意十足。

目前,DeepL 翻譯已支持英德法西等 42 門歐洲語言,正在對(duì)漢、日、俄等語言進(jìn)行訓(xùn)練,并計(jì)劃在將來發(fā)布一款 API,讓開發(fā)者能夠?qū)?DeepL 翻譯整合入其應(yīng)用中。

公司前身

首先要說,這家公司的來歷并不簡單。

公司的前身是運(yùn)營已近十年的在線外語詞典 Linguee,DeepL 翻譯也完全由 Linguee 團(tuán)隊(duì)打造。Linguee 在國內(nèi)沒什么存在感,至于在海外……有谷歌翻譯專美于前,存在感也不是很高,但還是有一批認(rèn)可它的用戶。

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

Linguee 的英漢、漢英詞典界面

不過,Linguee 的成敗現(xiàn)在已經(jīng)不重要,畢竟都換馬甲了——Linguee 在今年正式更名 DeepL,以“Deep”提醒 VC 自己是一家正兒八經(jīng)的深度學(xué)習(xí)公司。

真正重要的是 Linguee 的技術(shù)積累。Linguee 由前谷歌翻譯研究員 Gereon Frahling 在 2007 年離職開發(fā),2009 年正式上線。就雷鋒網(wǎng)所知,Linguee 的核心優(yōu)勢(shì)是它的爬蟲和機(jī)器學(xué)習(xí)系統(tǒng),前者抓取互聯(lián)網(wǎng)上的雙語對(duì)照翻譯,后者對(duì)這些翻譯的質(zhì)量進(jìn)行評(píng)估。兩者結(jié)合,使 Linguee 成為了當(dāng)時(shí)“世界上首個(gè)翻譯搜索引擎”。十年積累,Linguee 無論在數(shù)據(jù)和對(duì)算法的研究上都不可小覷。

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

去年在倫敦 Noah 上演講的 Gereon Frahling

一年前,其研究團(tuán)隊(duì)著手欲實(shí)現(xiàn)一個(gè)新目標(biāo):利用在機(jī)器翻譯領(lǐng)域的多年專業(yè)積累,打造一套業(yè)內(nèi)最先進(jìn)的 NMT 系統(tǒng)。這便是 8 月 29 日上線的 DeepL 翻譯。

三大優(yōu)勢(shì)

既然底子厚實(shí),我們來看看這些積累給 DeepL 帶來了哪些資源優(yōu)勢(shì)。

雷鋒網(wǎng)要提醒,以下信息均是 DeepL 一家之言,尚無第三方背書,大家需自行判斷其含金量。

  • 數(shù)據(jù)

 Linguee 的數(shù)據(jù)集有逾十億組對(duì)照翻譯語句,號(hào)稱是世界上最大的人工翻譯數(shù)據(jù)集。 Linguee 能隨時(shí)搜索近似翻譯結(jié)果。

  • 計(jì)算力

DeepL 在冰島搭建了一臺(tái)超算,號(hào)稱在全球 HPC 中性能排名第 23 位,浮點(diǎn)運(yùn)算能力達(dá)到 5.1 petaFLOPS。因而能實(shí)現(xiàn)令 DeepL 十分自豪的計(jì)算速度:每秒處理百萬量級(jí)的詞語翻譯。

  • 算法

采用 CNN 而不是 NMT 產(chǎn)品通用的 RNN。DeepL 宣稱其技術(shù)積累使得它能夠克服 CNN 的主要短板,因而能實(shí)現(xiàn)比基于 RNN 的競(jìng)品算法更精確、自然的翻譯結(jié)果。

效果展示

DeepL 宣稱其翻譯系統(tǒng)的表現(xiàn)打敗了谷歌翻譯以及微軟、Facebook 的 NMT 系統(tǒng), 是基于兩個(gè)指標(biāo):盲測(cè)反饋和 BLEU 分?jǐn)?shù)。

  • 盲測(cè)

DeepL 邀請(qǐng)了職業(yè)翻譯者,對(duì) DeepL 翻譯、谷歌翻譯、微軟翻譯以及 Facebook 的 NMT 系統(tǒng)進(jìn)行了盲測(cè),要求測(cè)試者選出所認(rèn)為的最好的翻譯結(jié)果。測(cè)試語言為三組,分別是英德、英法、英西互譯,樣本為 100 個(gè)句子。DeepL 并未公布每組參與測(cè)試的職業(yè)譯者數(shù)量。測(cè)試結(jié)果如下:

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

如圖所示,在每一門測(cè)試中,選擇 DeepL 的測(cè)試者都最多。 DeepL 在英譯德、英譯法、英譯西的優(yōu)勢(shì)尤其明顯。其官方統(tǒng)計(jì)是:選擇 DeepL 為最佳翻譯結(jié)果的次數(shù),與選擇另外三家 NMT 服務(wù)的平均比例為 3:1 。

  • BLEU

BLEU 是業(yè)內(nèi)評(píng)估機(jī)器翻譯質(zhì)量最常用的打分算法,其得分被認(rèn)為與人類的評(píng)判結(jié)果具有較大相關(guān)性。

DeepL 宣布,其英譯德、英譯法的 BLEU 得分超過了所有已發(fā)表的 NMT 研究,包括谷歌 Transformer。結(jié)果如下:

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

如圖,在英譯法項(xiàng)目上,DeepL 的 BLEU 分?jǐn)?shù)超過次優(yōu)方案約 3.5%。

業(yè)內(nèi)觀點(diǎn)

踏入江湖的第一日,DeepL 就自封“天下第一”。業(yè)內(nèi)同行對(duì)此怎么看?

對(duì)此,雷鋒網(wǎng)咨詢了搜狗語音交互中心總監(jiān)陳偉、商鵲網(wǎng) CEO 鄒劍宇,以及 Facebook 機(jī)器學(xué)習(xí)工程師王楊。需要說明的是,三位老師均表示:由于缺乏關(guān)于 DeepL 算法、數(shù)據(jù)庫的第一手資料,也沒有來自第三方的信息,無法對(duì)其翻譯水平做出客觀判斷。商鵲網(wǎng)的 CEO 鄒劍宇評(píng)論道:“從相關(guān)報(bào)道中,對(duì)算法的描述并不詳細(xì),沒有論文披露細(xì)節(jié),所以并不好理解?!?/p>

因此,以下僅為這四位看到 DeepL 宣傳信息后的一些個(gè)人看法。

一、

在 Facebook從事應(yīng)用機(jī)器學(xué)習(xí)的工程師王楊,聽到這件事的第一反應(yīng)是懷疑——單是同時(shí)勝過谷歌翻譯和Facebook NMT這一點(diǎn),不拿出有足夠說服力的證據(jù)就難以取信于人。谷歌的NMT 積累深厚,F(xiàn)acebook的NMT也在快速發(fā)展。一個(gè)新的產(chǎn)品想要如其所宣傳的那樣實(shí)現(xiàn)大幅超越,很難。

若 DeepL 確實(shí)在技術(shù)上實(shí)現(xiàn)了突破,那么不排除他們有全新的多語種(multilingual)模型。

至于 DeepL 的算法模型基于 CNN 而不是 RNN,王楊表示“這從側(cè)面支持了 Facebook 的研究”。FAIR(Facebook AI Research)一直認(rèn)為 CNN 在機(jī)器翻譯上的潛力遠(yuǎn)遠(yuǎn)大過 RNN,尤其是計(jì)算速度,這也是 Facebook 在 NMT 領(lǐng)域的主要研究方向之一。

二、

搜狗語音交互中心總監(jiān)陳偉,他們機(jī)器翻譯團(tuán)隊(duì)剛剛在 WMT 2017評(píng)測(cè)中獲得中英、英中兩個(gè)翻譯方向的第一名,他認(rèn)為數(shù)據(jù)對(duì) DeepL 的貢獻(xiàn)可能遠(yuǎn)大過其它因素。而 Linguee 的數(shù)據(jù)爬取和積累,是一項(xiàng)不小的優(yōu)勢(shì)。

陳偉評(píng)論道:

“從 BLEU 對(duì)比看,提升的比較明顯,感覺他們十億量級(jí)的高質(zhì)量數(shù)據(jù)對(duì)效果幫助比較大。實(shí)測(cè)大家都覺得好,這至少說明它數(shù)據(jù)的全面性還是夠的?!?/p>

據(jù)一位德語專業(yè)的譯員說,DeepL 德英互譯的體驗(yàn)確實(shí)不錯(cuò),這絲毫不意外——作為一家德國公司,順理成章的,DeepL 重點(diǎn)關(guān)注的是德英、法英這些語種的翻譯。這為 DeepL 在這幾門語種的數(shù)據(jù)積累也提供了一定的聚焦和便利。

DeepL 公布的盲測(cè)、BLEU 評(píng)分,衡量的均是德、法、西這三門歐洲語言與英語之間的互譯。

在算法方面,陳偉向雷鋒網(wǎng)表示:

“沒看到他們技術(shù)的詳細(xì)介紹,只了解到使用了 CNN 而沒有使用 RNN,但是我感覺架構(gòu)變動(dòng)不會(huì)太大,應(yīng)該類似于 Facebook 的 convs2s。

他并不認(rèn)可“CNN 是神經(jīng)機(jī)器翻譯未來”的說法:

在搜狗的實(shí)驗(yàn)對(duì)比中,“RNN-NMT、CNN-NMT 和谷歌的 Transformer 框架。三個(gè)技術(shù)我們都認(rèn)真研究和優(yōu)化過,目前 Transformer 框架已經(jīng)在搜狗翻譯系統(tǒng)上線,從機(jī)器評(píng)分和人工評(píng)測(cè)來看,都領(lǐng)先主要競(jìng)品,較RNN-NMT、CNN-NMT提升也比較明顯。


業(yè)內(nèi)也沒有一致觀點(diǎn)認(rèn)為 CNN 是 NMT 的未來。我覺得技術(shù)方案無論是 CNN、RNN、Transformer 都沒做到極致,目前主流技術(shù)框架到底是什么沒有定論,算法細(xì)節(jié)的打磨和多種技術(shù)的融合會(huì)是未來發(fā)展趨勢(shì),另外數(shù)據(jù)量會(huì)是各家公司的技術(shù)壁壘?!?/p>

最后,陳偉總結(jié),根據(jù) DeepL 公布的報(bào)告,目前的評(píng)測(cè)存在三個(gè)地方導(dǎo)致難以評(píng)估其技術(shù):

  1. 人工評(píng)測(cè)的測(cè)試數(shù)據(jù)量僅有 100 句,而一般人工評(píng)測(cè)或者 BLEU 評(píng)測(cè)會(huì)采用幾千句的數(shù)量。


  2. DeepL對(duì)比其他家并沒有使用相同的訓(xùn)練數(shù)據(jù)集,因此性能無法很好評(píng)估。


  3. 更多的技術(shù)細(xì)節(jié)沒有公布,很難把握具體的情況。

三、

商鵲網(wǎng) CEO 鄒劍宇十分認(rèn)同數(shù)據(jù)和計(jì)算資源對(duì) NMT 產(chǎn)品的重要性:

“報(bào)道說其訓(xùn)練引擎是基于一臺(tái)冰島超級(jí)計(jì)算機(jī),可以說深度學(xué)習(xí)真的很需要計(jì)算力。Linguee 本身是一個(gè)不錯(cuò)的語料庫公司,數(shù)據(jù)積累有自己的特點(diǎn),這應(yīng)該是其引擎優(yōu)秀表現(xiàn)的一個(gè)基礎(chǔ)。


對(duì)于引擎的評(píng)測(cè),Linguee引擎的盲測(cè)很好,BLEU 值超過其他引擎最優(yōu)質(zhì) 3 個(gè)百分點(diǎn)(行業(yè)通識(shí)是,2 個(gè) BLEU 值的提高就可以稱作‘顯著’)?!?/p>

對(duì)于 BLEU 值究竟能在多大程度上客觀反映翻譯質(zhì)量,鄒劍宇強(qiáng)調(diào),需要合理看待其參考價(jià)值,不可把它等同于普通人面對(duì)翻譯結(jié)果的直觀體驗(yàn):

“翻譯評(píng)測(cè)有三類對(duì)象:科研人員,譯員和普通閱讀用戶,三者評(píng)測(cè)的目標(biāo)和方法不一致。BLEU 是一個(gè)科研環(huán)境的評(píng)測(cè)參數(shù),和人的閱讀體驗(yàn)感受有很大的不同,不可以同類而論?!?/p>

他最后忍不住拿自家產(chǎn)品做對(duì)比,表示商鵲網(wǎng)的新引擎甚至達(dá)到了比谷歌翻譯高出 6 個(gè)百分點(diǎn)的 BLEU 值。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

 號(hào)稱打敗谷歌翻譯的 DeepL 究竟靠不靠譜?

分享:
相關(guān)文章

用愛救世界
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說