谷歌發(fā)布最新版 AI 系統(tǒng)，圖像配文準確率高達 93.9%

本文作者： no name

2016-09-25 15:16

導語：谷歌發(fā)布了最新版機器學習系統(tǒng)，通過識別圖像中的內容，配上對應文字，準確率高達驚人的 93.9%。谷歌已經在 TensorFlow 上開源了這項成果。

近日，谷歌發(fā)布了最新版機器學習系統(tǒng)，通過識別圖像中的內容，配上對應文字，效果達到了歷史最佳。谷歌已經在 TensorFlow 上開源了這項成果。自 2014 年以來，谷歌一直致力于這個項目，現在這個算法描述圖像的準確率已經高達 93.9% 。

因為他們正在使用一個使用一個開始架構的最新的迭代，所以對于谷歌團隊來說，有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。要真正解釋和描述一張照片，人工智能不僅需要了解圖片中是什么，更要了解圖像中這些對象有什么相互關系。谷歌的開發(fā)人員表示這不只是一個數據的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。

谷歌研究的博客發(fā)文說：“令人興奮的是，在展示全新情境時，我們的模型的確可以產生準確的配文，這顯示出系統(tǒng)對圖像中目標和背景的理解更深了?！蓖瑯又匾氖?，“它還學會了如何表示知識在自然的英語短語，盡管它只讀了人類給的說明字幕，沒有在接受其他額外的訓練。”

至少從目前來說，相對于視頻，機器學習算法能更好地理解靜止圖像的內容。

via Google Research Blog

谷歌發(fā)布最新版 AI 系統(tǒng)，圖像配文準確率高達 93.9%

谷歌發(fā)布最新版 AI 系統(tǒng)，圖像配文準確率高達 93.9%