0
本文作者: 汪思穎 | 2019-08-02 19:05 | 專題:ACL 2019 |
雷鋒網 AI 開發(fā)者消息,當?shù)貢r間 7 月 28 日至 8 月 2 日,自然語言處理領域頂級會議 ACL2019 在意大利佛羅倫薩召開,會上滴滴正式宣布開源基于深度學習的語音和自然語言理解模型訓練平臺 DELTA,以進一步幫助 AI 開發(fā)者創(chuàng)建、部署自然語言處理和語音模型,構建高效的解決方案,助力 NLP 應用更好落地。
滴滴自然語言處理首席科學家 Kevin Knight 在 ACL2019 現(xiàn)場
DELTA 主要基于 TensorFlow 構建,能同時支持 NLP(自然語言處理)和語音任務及數(shù)值型特征的訓練,整合了包括文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等重要算法模型,形成一致的代碼組織架構,整體包裝統(tǒng)一接口。
用戶準備好模型訓練數(shù)據,并指定好配置 Configuration,模型訓練 pipeline 可以根據配置進行數(shù)據處理,并選擇相應的任務和模型,進行模型訓練。在訓練結束之后,自動生成模型文件保存。該模型文件形成統(tǒng)一接口,可以直接上線使用,快速產品化,能讓從研究到生產變得更容易。
值得注意的是,除可支持多種模型的訓練,DELTA 還支持靈活配置,開發(fā)者可基于 DELTA 搭建成多達幾十種的復雜的模型;此外,DELTA 在多種常用任務上提供了穩(wěn)定高效的 benchmark,用戶可以簡單快速的復現(xiàn)論文中的模型的結果,同時也可以在此基礎上擴展新的模型。在模型構建完成后,用戶可以使用 DELTA 的部署流程工具,迅速完成模型上線。從論文到產品部署無縫銜接。
目前 AI 開發(fā)者可登陸Github(https://github.com/didi/delta)查看 DELTA 的詳細介紹和源代碼,利用 DELTA 加快實驗進度,部署用于文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等任務的系統(tǒng)。用戶亦可在滴滴的開源平臺上(https://didi.github.io/)獲取更多滴滴開源項目的相關信息。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。