丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

0

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

本文作者: AI研習(xí)社-譯站 2018-03-16 10:33
導(dǎo)語:現(xiàn)在讓我們一起看看市場(chǎng)上最好的機(jī)器學(xué)習(xí)平臺(tái),并考慮一些基礎(chǔ)設(shè)施決策。

雷鋒網(wǎng)按:本文為雷鋒字幕組編譯的技術(shù)博客,原標(biāo)題 Comparing Machine Learning as a Service: Amazon, Microsoft Azure, Google Cloud AI,作者為Altexsoft。

翻譯 | 彭珍 陳明霏    整理 |  凡江

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

對(duì)于大多數(shù)的公司來說,機(jī)器學(xué)習(xí)似乎接近于火箭科學(xué),看起來昂貴而且需要人才。而且,如果你的目標(biāo)是構(gòu)建另一個(gè)Netflix推薦系統(tǒng),那確實(shí)是。但是,一切即服務(wù)的趨勢(shì)也影響了這個(gè)復(fù)雜的領(lǐng)域。你可以在沒有太多投資的情況下啟動(dòng)機(jī)器學(xué)習(xí)計(jì)劃,如果你是數(shù)據(jù)科學(xué)的新手,并且希望抓住成果,這會(huì)是正確的舉措。

機(jī)器學(xué)習(xí)最鼓舞人心的故事之一是關(guān)于一個(gè)日本農(nóng)民的,他決定用自動(dòng)給黃瓜分類的方法來幫助他的父母做這項(xiàng)艱苦的工作。與大量關(guān)于大型企業(yè)的故事不同的是,他既沒有機(jī)器學(xué)習(xí)的專業(yè)知識(shí),也沒有大的預(yù)算。但是他確實(shí)設(shè)法掌握了TensorFlow,并且運(yùn)用深度學(xué)習(xí)來識(shí)別不同類別的黃瓜。

通過使用機(jī)器學(xué)習(xí)云服務(wù),你可以開始構(gòu)建你的第一個(gè)工作模型,從相對(duì)較小的團(tuán)隊(duì)預(yù)測(cè)中來產(chǎn)出有價(jià)值的見解。我們已經(jīng)討論了機(jī)器學(xué)習(xí)策略?,F(xiàn)在讓我們一起看看市場(chǎng)上最好的機(jī)器學(xué)習(xí)平臺(tái),并考慮一些基礎(chǔ)設(shè)施決策。

什么是服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)

服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)(MLaaS) 是自動(dòng)化和半自動(dòng)化云平臺(tái)的一個(gè)概括性定義,這個(gè)云平臺(tái)涵蓋了大多數(shù)的基礎(chǔ)設(shè)施,例如數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評(píng)估、以及進(jìn)一步的預(yù)測(cè)。預(yù)測(cè)結(jié)果可以通過REST API與你的內(nèi)部IT基礎(chǔ)設(shè)施進(jìn)行銜接。

亞馬遜機(jī)器學(xué)習(xí)服務(wù)、Azure機(jī)器學(xué)習(xí)和谷歌云AI是三個(gè)領(lǐng)先的云MLaaS服務(wù),允許在只有少量或者沒有數(shù)據(jù)科學(xué)專業(yè)知識(shí)的情況下進(jìn)行快速模型訓(xùn)練和部署。如果用可用的軟件工程師來組建一支本土化的數(shù)據(jù)科學(xué)團(tuán)隊(duì),就應(yīng)該首先考慮這些問題。來看看我們的數(shù)據(jù)科學(xué)團(tuán)隊(duì)結(jié)構(gòu)的故事,以便于更好地了解角色分配。

在本篇文章中,我們將首先概述亞馬遜、谷歌和微軟的主要服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)平臺(tái),然后比較這些供應(yīng)商所支持的機(jī)器學(xué)習(xí)API。請(qǐng)注意,本概述并非旨在提供有關(guān)何時(shí)和如何使用這些平臺(tái)的詳盡指南,而是在開始閱讀文檔之前需要查找的內(nèi)容。

用于自定義預(yù)測(cè)分析任務(wù)的機(jī)器學(xué)習(xí)服務(wù)

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

Azure 機(jī)器學(xué)習(xí)工作室擁有最全面的服務(wù);然而,如果你的任務(wù)需要用到深度神經(jīng)網(wǎng)絡(luò),我們還推薦查看亞馬遜的SageMaker和谷歌的機(jī)器學(xué)習(xí)引擎。

亞馬遜機(jī)器學(xué)習(xí)的預(yù)測(cè)性分析

亞馬遜機(jī)器學(xué)習(xí)服務(wù)有兩個(gè)層面:亞馬遜機(jī)器學(xué)習(xí)的預(yù)測(cè)性分析和數(shù)據(jù)科學(xué)家的SageMaker工具。

同于預(yù)測(cè)性分析的亞馬遜機(jī)器學(xué)習(xí)是市場(chǎng)上最自動(dòng)化的解決方案之一,最適合于對(duì)截止時(shí)間敏感的操作。該服務(wù)可以載入多個(gè)來源的數(shù)據(jù),包括亞馬遜RDS,亞馬遜Redshift,CSV文件等等。所有的數(shù)據(jù)預(yù)處理操作都是自動(dòng)執(zhí)行的:該服務(wù)區(qū)標(biāo)識(shí)出哪些字段是分類的,哪些是數(shù)字的,并且不會(huì)要求用戶選擇進(jìn)一步數(shù)據(jù)預(yù)處理的方法(降維和白化)

亞馬遜機(jī)器學(xué)習(xí)的預(yù)測(cè)能力受限于三種選擇:二元分類、多類分類和回歸。也就是說,亞馬遜的機(jī)器學(xué)習(xí)服務(wù)不支持任何無監(jiān)督的學(xué)習(xí)方法,用戶必須選擇一個(gè)目標(biāo)變量并在訓(xùn)練集中標(biāo)注它。此外,用戶不需要了解任何機(jī)器學(xué)習(xí)方法,因?yàn)閬嗰R遜會(huì)在查看提供的數(shù)據(jù)后會(huì)自動(dòng)選擇它們。

這種高度自動(dòng)化水平既是亞馬遜機(jī)器學(xué)習(xí)使用的優(yōu)勢(shì)也是劣勢(shì)。如果你需要一個(gè)全自動(dòng)但有限的解決方案,這項(xiàng)服務(wù)會(huì)符合你的預(yù)期。如果不是,那就選擇SageMaker。

亞馬遜SageMaker和基于框架的服務(wù)

SageMaker是一個(gè)機(jī)器學(xué)習(xí)環(huán)境,通過提供庫(kù)快速建模和部署的工具來簡(jiǎn)化同行數(shù)據(jù)科學(xué)家的工作。例如,它提供Jupyter,一款創(chuàng)作筆記本,來簡(jiǎn)化數(shù)據(jù)探索和分析,無需服務(wù)器管理的麻煩。亞馬遜也有內(nèi)置算法,針對(duì)分布式系統(tǒng)中的大型數(shù)據(jù)集和計(jì)算進(jìn)行了優(yōu)化。這些優(yōu)化包括:

  • 線性學(xué)習(xí)器,一種用于分類和回歸的監(jiān)督方法

  • 因子分解機(jī),用于稀疏數(shù)據(jù)集的分類和回歸

  • XGBoost 是一個(gè)監(jiān)督提升樹算法,通過結(jié)合簡(jiǎn)單的預(yù)測(cè)算法來提升在分類、回歸和排序中的預(yù)測(cè)準(zhǔn)確率

  • 基于ResNet的圖像分類,也能應(yīng)用于遷移學(xué)習(xí)

  • Seq2seq是一種預(yù)測(cè)序列的監(jiān)督式算法(例如,翻譯句子,將單詞串轉(zhuǎn)化為更短的摘要等)

  • K-means是一種用于聚類任務(wù)的無監(jiān)督學(xué)習(xí)方法

  • 主要成分分析用于降維

  • 主題模型是一種用于在文檔中查找分類的無監(jiān)督方法

  • 神經(jīng)主題模型(NTM)是一種無監(jiān)督方法,用于探索文檔、揭示排名靠前的單詞和定義主題(用戶不能預(yù)定義主題,但是他們可以設(shè)置預(yù)期主題的數(shù)量)

內(nèi)置的SageMaker方法與亞馬遜建議的機(jī)器學(xué)習(xí)API在很大程度上相交,但它允許數(shù)據(jù)科學(xué)家參與進(jìn)來并使用他們自己的數(shù)據(jù)集。

如果你不想使用這些,你可以通過SageMaker利用其部署功能來添加你自己方法并運(yùn)行模型?;蛘吣憧梢詫ageMaker與TensorFlow以及MXNeT深度學(xué)習(xí)庫(kù)進(jìn)行集成。

總的來說,亞馬遜機(jī)器學(xué)習(xí)服務(wù)為經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家和那些只需要完成工作不需要深入數(shù)據(jù)集準(zhǔn)備和建模的人來說,提供了足夠的自由。這對(duì)那些使用了亞馬遜環(huán)境并且不打算轉(zhuǎn)移到另一家云提供商的公司來說,這將會(huì)是一個(gè)不二之選。

微軟Azure機(jī)器學(xué)習(xí)工作室

Azure機(jī)器學(xué)習(xí)旨在為新手和經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家提供一個(gè)強(qiáng)大的操作環(huán)境。微軟的機(jī)器學(xué)習(xí)產(chǎn)品名單與亞馬遜的類似,但是就當(dāng)前而言,Azure在開箱即用的算法方面顯得更加靈活。

Azure提供的服務(wù)可以分為兩個(gè)主要類型:Azure機(jī)器學(xué)習(xí)工作室和機(jī)器人服務(wù)。讓我們了解下Azure機(jī)器學(xué)習(xí)工作室的內(nèi)幕。我們將會(huì)在講專用于特定API和工具的部門回到機(jī)器人服務(wù)。

機(jī)器學(xué)習(xí)工作室是主要的服務(wù)型導(dǎo)向機(jī)器學(xué)習(xí)軟件包。在Azure機(jī)器學(xué)習(xí)工作室上的幾乎所有操作都必須手動(dòng)完成。這些操作包括數(shù)據(jù)探索、預(yù)處理、選擇方法和驗(yàn)證建模結(jié)果。

使用Azure接近機(jī)器學(xué)習(xí)需要一些學(xué)習(xí)曲線。但最終會(huì)導(dǎo)致對(duì)該領(lǐng)域主要技術(shù)的更深入理解。另一方面,Azure機(jī)器學(xué)習(xí)支持圖形化界面以可視化工作流中的每個(gè)步驟?;蛟S使用Azure的主要優(yōu)點(diǎn)在于可以使用各種算法。工作室支持近100種方法來處理分類(二元+多類)、異常檢測(cè)、回歸、推薦和文本分析。值得一提的是這個(gè)平臺(tái)擁有一種聚類算法(K-means)。

Azure機(jī)器學(xué)習(xí)的另一大部分是Cortana Intelligence Gallery。它是由社區(qū)提供的機(jī)器學(xué)習(xí)解決方案集合,提供給數(shù)據(jù)科學(xué)家進(jìn)行探索和再利用。Azure的產(chǎn)品是入門機(jī)器學(xué)習(xí)并將其能力介紹給新員工的強(qiáng)大工具。

谷歌預(yù)測(cè)API

谷歌在兩個(gè)層面提供AI服務(wù):為精明的數(shù)據(jù)科學(xué)家提供的機(jī)器學(xué)習(xí)引擎和高度自動(dòng)化的谷歌預(yù)測(cè)API。不幸的是,谷歌預(yù)測(cè)API最近已被棄用,谷歌將在2018年4月30日停止這一服務(wù)。

注定失敗的預(yù)測(cè)API與亞馬遜的機(jī)器學(xué)習(xí)很像。它的簡(jiǎn)約方法縮小到解決兩個(gè)主要問題:分類(二元和多類)和回歸。訓(xùn)練好的模型可以通過REST API接口進(jìn)行部署。

谷歌并沒有公布會(huì)使用哪種算法來繪制預(yù)測(cè),也不允許工程師自定義模型。另一方面,谷歌的環(huán)境最適合在緊迫的期限內(nèi)進(jìn)行機(jī)器學(xué)習(xí),并推出早期的機(jī)器學(xué)習(xí)計(jì)劃。但似乎產(chǎn)品并不如谷歌預(yù)期的那樣受歡迎。很遺憾的是,正如臨終常見問題解答中所建議的,使用預(yù)測(cè)性API將不得不使用其他平臺(tái)來”重建現(xiàn)有模型“。

那么,接下來會(huì)是什么呢?

谷歌云機(jī)器學(xué)習(xí)引擎

預(yù)測(cè)API的高度自動(dòng)化是以靈活性為代價(jià)的。谷歌的機(jī)器學(xué)習(xí)引擎則截然相反。它迎合有經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)家,它非常靈活,并建議將TensorFlow的云端基礎(chǔ)架構(gòu)來作為機(jī)器學(xué)習(xí)的驅(qū)動(dòng)程序。那么,機(jī)器學(xué)習(xí)引擎原則上與SageMaker非常相似。

TensorFlow是谷歌的另一款產(chǎn)品,它是一個(gè)開源的機(jī)器學(xué)習(xí)庫(kù),包括各種各樣的數(shù)據(jù)科學(xué)工具,而不是服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)。它沒有可視化界面,并且TensorFlow的學(xué)習(xí)曲線也會(huì)十分陡峭。然而,這個(gè)庫(kù)的目標(biāo)人群是那些計(jì)劃轉(zhuǎn)行到數(shù)據(jù)科學(xué)的軟件工程師。TensorFlow十分強(qiáng)大,但主要針對(duì)深度神經(jīng)網(wǎng)絡(luò)任務(wù)。

基本上,TensorFlow與谷歌云服務(wù)的結(jié)合表明,基礎(chǔ)架構(gòu)即服務(wù)和平臺(tái)即服務(wù)的解決方案取決于三層模型的云服務(wù)。我們?cè)陉P(guān)于數(shù)字化轉(zhuǎn)型的白皮書中討論了這個(gè)概念。如果你不了解,那就看一看。

為了總結(jié)服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)平臺(tái),似乎Azure當(dāng)前在服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)的市場(chǎng)上擁有功能最多的工具集。它涵蓋了大多數(shù)的機(jī)器學(xué)習(xí)相關(guān)任務(wù),為構(gòu)建自定義模型提供了可視化界面,為那些不愿徒手處理數(shù)據(jù)科學(xué)的人提供了一組可靠的API。但是,它在亞馬遜上仍缺乏自動(dòng)化的能力。

比較亞馬遜、微軟和谷歌的機(jī)器學(xué)習(xí)API

除了成熟的平臺(tái),你可以使用高級(jí)API。這些會(huì)提供底層訓(xùn)練好的模型服務(wù),你可以輸入數(shù)據(jù)然后獲取結(jié)果。API完全不需要機(jī)器學(xué)習(xí)的專業(yè)知識(shí)。目前,這三家供應(yīng)商的API大致可以分為三大類:

1)文本識(shí)別、翻譯和文本分析

2)圖像+視頻識(shí)別和相關(guān)分析

3)其他,包括特定的未分類服務(wù)

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

微軟提供了最豐富的功能列表。但是,所有供應(yīng)商都提供最重要的功能。

語音和文本處理API:亞馬遜

亞馬遜針對(duì)文本分析中的常見任務(wù)提供了多種API。就機(jī)器學(xué)習(xí)而言這些是高度自動(dòng)化的,僅需要適當(dāng)?shù)募删涂梢怨ぷ鳌?/p>

亞馬遜Lex。Lex API是用來在你的應(yīng)用程序中內(nèi)嵌包含自動(dòng)語音識(shí)別(ASR)和自然語言處理(NLP)能力的聊天機(jī)器人。這些都基于深度學(xué)習(xí)模型。這個(gè)API可以識(shí)別書面和口頭文本,Lex接口允許你將已識(shí)別的輸入連接到各種后端解決方案。顯然,亞馬遜鼓勵(lì)使用它的Lambda云環(huán)境。那么,在訂閱Lex之前,也需要熟悉Lambda。除了獨(dú)立的應(yīng)用程序,Lex目前支持為 Facebook Messenger、Slack和Twilio部署聊天機(jī)器人。

亞馬遜Transcribe。雖然Lex是一個(gè)以聊天機(jī)器人為導(dǎo)向的復(fù)雜工具,Transcribe僅僅是為了識(shí)別口頭文本而生。該工具可以識(shí)別多個(gè)說話者,并且在低質(zhì)量的電話音頻中起作用。這使得這個(gè)API成為編目音頻檔案的一種解決方案,或者為呼叫中心數(shù)據(jù)的進(jìn)一步文本分析提供良好的支持

亞馬遜Polly。Polly服務(wù)與Lex相反。它將文本轉(zhuǎn)換成語音,讓你的聊天機(jī)器人用語音來回復(fù)。它不會(huì)創(chuàng)作文本,只是讓文本聽起來更接近于人。如果你體驗(yàn)過Alexa,那么你就能明白。目前,它支持25種語言的女聲和男聲,大部分是英語和西歐語言。一些語言還有多個(gè)女聲和男聲,所以就有多種選擇。Polly推薦與Lambda一起使用。

亞馬遜 Comprehend。與Lex和Transcribe不同,Comprehend是另一組NLP的APL,針對(duì)不同的文本分析任務(wù)。目前,Comprehend支持:

  • 實(shí)體提?。ㄗR(shí)別名稱、日期、組織等)

  • 關(guān)鍵短語檢測(cè)

  • 語言識(shí)別

  • 情緒分析(正面、中立、負(fù)面的文本是怎樣的) 

  • 主題模型(通過分析關(guān)鍵詞定義主要主題)

這項(xiàng)服務(wù)可以幫助你分析社交媒體的反應(yīng)、評(píng)論和其他不適合手動(dòng)分析的大量文本數(shù)據(jù)美麗如,Comprehend和Transcribe 的組合將有助于你分析你的以電話為主的客戶服務(wù)中的情緒。

亞馬遜 Translate。正如名字所示,Translate服務(wù)翻譯文本。亞馬遜聲稱它使用的是神經(jīng)網(wǎng)絡(luò),相比于基于規(guī)則的翻譯方法,神經(jīng)網(wǎng)絡(luò)方法提供更好的翻譯質(zhì)量。不幸的是,當(dāng)前的版本僅支持六種語言翻譯成英語,以及由英語翻譯成這六種語言。這些語言是阿拉伯語、中文、法語、德語、葡萄牙語和西班牙語。

語音、文字處理應(yīng)用程序接口: 微軟 Azure 認(rèn)知服務(wù)

像亞馬遜一樣, 微軟開發(fā)出的高級(jí)應(yīng)用程序接口—— 認(rèn)知服務(wù),能與你的基礎(chǔ)開發(fā)環(huán)境兼容,非數(shù)據(jù)科學(xué)方面的專業(yè)人士也可以使用它進(jìn)行工作。

語音。語音設(shè)置包含了四個(gè)應(yīng)用程序接口,將不同的自然語言處理方法應(yīng)用于自然語言識(shí)別以及其他操作:

  • 翻譯語音接口

  • 將語音轉(zhuǎn)變?yōu)槲淖忠约皩⑽淖洲D(zhuǎn)變?yōu)檎Z音的必應(yīng)語音接口

  • 執(zhí)行聲音核實(shí)任務(wù)的發(fā)音主體識(shí)別接口

  • 基于自己的數(shù)據(jù)和模型應(yīng)用Azure自然語言處理能力的定制語音服務(wù)

語言。接口的語言組主要類似于Amazon Comprehend進(jìn)行文本分析 

  • 語言理解智能服務(wù)是一個(gè)用于分析文本中指令語句意圖的接口 (例如 “運(yùn)行YouTube應(yīng)用程序”或者 “打開起居室的燈”)

  • 用于情感分析和主題歸納的文本分析接口

  • 必應(yīng)拼寫檢查

  • 文本翻譯接口

  • 用于估計(jì)詞語組合的概率并支持單詞自動(dòng)結(jié)束的網(wǎng)絡(luò)語言模型接口

  • 用于拆分句子、詞性標(biāo)注以及將文本分為標(biāo)記好的詞組的語言分析接口

語音、文本處理應(yīng)用程序接口:谷歌云服務(wù)

雖然這種接口主要綜合了亞馬遜和微軟Azure開發(fā)的功能, 但是它也有一些有趣、特別的亮點(diǎn)值得一看

Dialogflow。隨著多樣的聊天機(jī)器人越來越流行,谷歌也開發(fā)出了一些產(chǎn)品。Dialogflow通過自然語言處理技術(shù)來支持運(yùn)行,目標(biāo)功能為解析文本的意圖并說明文本主體人的意愿??梢愿鶕?jù)需要使用Java、Node.js和 Python語言對(duì)這個(gè)接口進(jìn)行修改和定制。

自然語言云處理接口。這個(gè)接口在內(nèi)核特征上幾乎與亞馬遜的Amazon Comprehend和微軟的Language相同。 

  • 定義文本實(shí)體

  • 情感識(shí)別

  • 分析句法結(jié)構(gòu)

  • 主題分類(例如食物、新聞、電子等)

云語音接口。該服務(wù)用于自然語音識(shí)別,可能與類似接口相比最顯著的優(yōu)勢(shì)是谷歌豐富的語言庫(kù)。當(dāng)前,語音云的詞匯可覆蓋超過110種全球性語言及其變體語言。它也有一些其他特征:

  • 具有定制化識(shí)別特定可口頭表達(dá)的的文本及單詞功能的單詞提示(例如,為了更好地理解本地土話或者行話)

  • 過濾不合適的內(nèi)容

  • 處理噪音

云翻譯接口??傊?,你可以用這個(gè)接口來在自己的產(chǎn)品上使用谷歌翻譯。它支持超過一百種語言,具有語種自動(dòng)識(shí)別功能。

除了文本和語音,亞馬遜、微軟和谷歌還開發(fā)了應(yīng)用于圖像、視頻分析的多功能接口。

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

雖然圖像分析與視頻分析接口有許多交叉之處,但是許多視頻工具仍在發(fā)展或處于良好的版本中。例如,谷歌對(duì)多種圖像處理任務(wù)可提供許多支持,但是明顯缺乏一些微軟和亞馬遜已能實(shí)現(xiàn)的視頻分析特征功能。

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

微軟看似是贏家,雖然我們?nèi)哉J(rèn)為亞馬遜有最高效的視頻分析接口,如亞馬遜可支持流媒體處理。這個(gè)特征功能顯然拓寬了視頻分析技術(shù)的應(yīng)用面。

圖像和視頻處理應(yīng)用程序接口:亞馬遜 Rekognition

我們絕對(duì)沒有拼錯(cuò)單詞。Rekognition應(yīng)用程序接口是用于圖像識(shí)別以及最近的視頻識(shí)別任務(wù)。包括:

  • 圖像目標(biāo)檢測(cè)以及分類(發(fā)現(xiàn)并檢測(cè)圖像中的不同目標(biāo)對(duì)象并且進(jìn)行定位)

  • 在視頻中,該接口能檢測(cè)一般活動(dòng)(比如“跳舞”)或者復(fù)雜活動(dòng)(如“撲火”)

  • 面部識(shí)別 (用于檢測(cè)面部并進(jìn)行匹配) 以及面部分析(這個(gè)接口有些非常有意思的功能比如檢測(cè)笑臉、分析眼睛,甚至看可以定義視頻中的情感情緒

  • 檢測(cè)不合適的視頻

  • 識(shí)別圖像和視頻中的名人 (無論出于何種目的)

圖像與視頻處理應(yīng)用程序接口: 微軟 Azure 認(rèn)知服務(wù)

微軟的圖像包結(jié)合了針對(duì)不同種類圖像、視頻和文本分析的六個(gè)應(yīng)用程序接口

  • 可識(shí)別目標(biāo)對(duì)象、行為(如走路)以及定義圖像主顏色特征的計(jì)算機(jī)視覺

  • 可檢測(cè)圖像、文本、視頻中不合適內(nèi)容的內(nèi)容評(píng)分機(jī)制

  • 面部應(yīng)用程序接口用于檢測(cè)面部并集中檢測(cè)結(jié)果,進(jìn)行年齡、情緒、姿勢(shì)、笑容和面部毛發(fā)的識(shí)別定義

  • 情緒應(yīng)用程序接口是可描繪面部表情的另一個(gè)面部識(shí)別工具

  • 定制視覺服務(wù)支持用自己的數(shù)據(jù)構(gòu)建定制圖像識(shí)別模型

  • 視頻索引器是一個(gè)可在視頻中尋找人物、定義語音情感以及圈出關(guān)鍵詞的工具

圖像和視頻處理應(yīng)用程序接口: 谷歌云服務(wù)

云視覺應(yīng)用程序接口。該工具被用于圖像識(shí)別任務(wù),并非常擅長(zhǎng)查找特定的圖像屬性:

  • 標(biāo)記對(duì)象

  • 檢測(cè)臉部并分析表情

  • 發(fā)現(xiàn)地標(biāo)并描繪場(chǎng)景(如度假,婚禮等)

  • 發(fā)現(xiàn)圖像中的文本并辨識(shí)文本語言

  • 主顏色特征

云視頻智能。該谷歌的視頻識(shí)別應(yīng)用程序接口處于發(fā)展的早期,因此它缺少許多亞馬遜Rekognition和微軟認(rèn)知服務(wù)的特征功能?,F(xiàn)在該接口提供以下工具箱:

  • 標(biāo)記對(duì)象并定義行為

  • 精確識(shí)別內(nèi)容

  • 轉(zhuǎn)錄語音

雖然從特征表級(jí)別上來說,谷歌人工智能服務(wù)也許缺少一些功能,但是谷歌應(yīng)用程序接口的優(yōu)勢(shì)力量在于谷歌握有的大數(shù)據(jù)集。

特種應(yīng)用程序接口與工具

在這里,我們將討論微軟和谷歌開發(fā)的特種應(yīng)用程序接口產(chǎn)品及工具。由于亞馬遜僅有上文提到的幾種用于文本分析和圖像/視頻分析的應(yīng)用程序接口產(chǎn)品,我們這里的討論不包括亞馬遜。但是,這些特種應(yīng)用程序接口擁有的一些功能也被亞馬遜的某些產(chǎn)品擁有。

Azure 服務(wù)機(jī)器人框架。微軟做了大量努力為其用戶提供靈活的機(jī)器人開發(fā)工具。總而言之,該服務(wù)包含一個(gè)可使用不同編程語言搭建、測(cè)試、部署機(jī)器人的全面環(huán)境。

有意思的是,該機(jī)器人服務(wù)不一定需要應(yīng)用機(jī)器學(xué)習(xí)的方法。比如微軟開發(fā)了五個(gè)版本的機(jī)器人(基礎(chǔ)版、成型版、語言理解型、主動(dòng)式,以及問答機(jī)器人),只有語言理解型機(jī)器人需要應(yīng)用高級(jí)人工智能技術(shù)。

現(xiàn)在,你可以使用.NET和Node.js技術(shù)來通過Azure搭建機(jī)器人并在以下平臺(tái)和技術(shù)服務(wù)中部署它們:

  • 必應(yīng)

  • 微軟小娜

  • Skype

  • 微信

  • Office 365 郵箱

  • GroupMe

  • Facebook 信使

  • Slack

  • Kik

  • Telegram

  • Twilio

微軟必應(yīng)搜索。微軟開發(fā)了7個(gè)與必應(yīng)搜索特征功能相連的應(yīng)用程序接口,包括自動(dòng)提示、新聞、圖像和視頻搜索接口

微軟Knowledge。該應(yīng)用程序接口群將文本分析與各種各樣的特別任務(wù)相結(jié)合:

  • 推薦應(yīng)用程序接口能用于搭建個(gè)性化消費(fèi)推薦系統(tǒng)

  • 知識(shí)搜索服務(wù)讓你輸入自然問題,從而在數(shù)據(jù)庫(kù)中檢索相應(yīng)數(shù)據(jù)、可視化數(shù)據(jù)并自動(dòng)補(bǔ)全提問

  • 實(shí)體連接智能接口用來突出可表示正確實(shí)體的名字和短語(例如探索的時(shí)代)并且確保消除模棱兩可的情況

  • 學(xué)術(shù)知識(shí)應(yīng)用程序接口可進(jìn)行單詞自動(dòng)補(bǔ)全、尋找文件單詞和概念上的相似處,并且在文件中搜索圖表部分

  • 問答者接口可以被用于匹配多樣的問題與對(duì)應(yīng)的答案,從而可以被用于構(gòu)建客戶服務(wù)聊天機(jī)器人和應(yīng)用

  • 定制決策服務(wù)是一個(gè)強(qiáng)化學(xué)習(xí)工具,用于根據(jù)用戶的喜好特別定制不同種類的內(nèi)容并將它們排序(例如鏈接、廣告等)

谷歌云職位搜索。該應(yīng)用程序接口仍處于發(fā)展階段早期,但不久就可能顛覆如今我們擁有的職位搜索能力。不像依賴于精確關(guān)鍵字匹配的傳統(tǒng)職位搜索引擎,谷歌應(yīng)用機(jī)器學(xué)習(xí)方法來尋找高度多樣的職位描述與避免模糊之間的聯(lián)系。例如,它致力于減少不相關(guān)或者過于寬泛的返回結(jié)果,比如對(duì)“銷售助理”的搜索詢問返回所有關(guān)鍵字帶“助理”的職位。這個(gè)接口有哪些主要的特征功能呢?

  • 修正職位搜索詢問中的拼寫錯(cuò)誤

  • 匹配所需的資歷水平

  • 尋找可能有多樣描述方式以及行業(yè)行話的相關(guān)職業(yè)(如對(duì)于“服務(wù)員”這一搜索詢問而不是“網(wǎng)絡(luò)專家”的詢問返回“咖啡館咖啡師”結(jié)果;或者對(duì)“業(yè)務(wù)開發(fā)”搜索詢問返回“運(yùn)營(yíng)專家”)

  • 處理縮略詞(例如對(duì)“HR“搜索詢問返回“人力資源部助理“搜索結(jié)果)

  • 匹配多樣的地點(diǎn)描述

IBM 沃森以及其他

三個(gè)平臺(tái)都在拿出一份非常詳盡的文件來起動(dòng)機(jī)器學(xué)習(xí)試驗(yàn)以及在公司的基礎(chǔ)設(shè)備上部署訓(xùn)練好的模型之前就被提出了。也有大量來自創(chuàng)業(yè)的其他服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)的解決方案,為數(shù)據(jù)科學(xué)家所尊敬,比如PredicSisBigML

但是IBM沃森分析是什么情況呢?

以商業(yè)預(yù)測(cè)為目標(biāo)功能的IBM 沃森分析現(xiàn)在還不是一個(gè)羽翼豐滿的機(jī)器學(xué)習(xí)平臺(tái)。當(dāng)前,沃森的主打是數(shù)據(jù)可視化以及描繪不同的價(jià)值如何相互作用。它也有與谷歌提供的相似的視覺識(shí)別服務(wù)以及一串其他認(rèn)知服務(wù)(應(yīng)用程序接口)。當(dāng)前沃森的問題是系統(tǒng)執(zhí)行的是狹隘、相對(duì)簡(jiǎn)單并易于被非專業(yè)人士操作的任務(wù)。當(dāng)涉及到定制機(jī)器學(xué)習(xí)或者預(yù)測(cè)的職責(zé)時(shí),處于發(fā)展階段太早期的IBM沃森就難以駕馭了。

數(shù)據(jù)存儲(chǔ)

通過機(jī)器學(xué)習(xí)找到正確的存儲(chǔ)來收集數(shù)據(jù)以及進(jìn)一步處理數(shù)據(jù)已經(jīng)不再是個(gè)重大挑戰(zhàn),數(shù)據(jù)科學(xué)家有足夠的學(xué)識(shí)來實(shí)施流行的存儲(chǔ)解決方案。

在大部分情況下,機(jī)器學(xué)習(xí)要求SQL和NoSQL兩個(gè)數(shù)據(jù)庫(kù)結(jié)構(gòu)支持,這兩個(gè)數(shù)據(jù)庫(kù)可被許多已建立的、值得信賴的解決方案支持,比如Hadoop Distributed File System (HDFS)、Cassandra、Amazon S3和Redshift。. 對(duì)于在開始機(jī)器學(xué)習(xí)之前使用強(qiáng)有力的存儲(chǔ)系統(tǒng)的組織來說,這將不會(huì)是個(gè)障礙。如果你計(jì)劃做一些服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)系統(tǒng),最直接的方法就是選擇可用于存儲(chǔ)和機(jī)器學(xué)習(xí)兩者的供主,這將減少配置數(shù)據(jù)源的時(shí)間消耗。

然而,這些平臺(tái)中有一些很容易與其他存儲(chǔ)相融合。比如Azure機(jī)器學(xué)習(xí),主要與其他微軟產(chǎn)品相融(Azure SQL, Azure 表格, Azure Blob) 但是也支持Hadoop 以及大量其他數(shù)據(jù)資源的選擇。 這些包含直接從桌面上傳數(shù)據(jù)或者部署服務(wù)器的功能。如果你的機(jī)器學(xué)習(xí)工作流程多樣化并且數(shù)據(jù)來自多種資源,也許會(huì)面臨更大的挑戰(zhàn)。

建模與計(jì)算

我們討論過主要提供計(jì)算力的服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)解決方案。但是如果機(jī)器學(xué)習(xí)工作流程在內(nèi)部進(jìn)行,計(jì)算挑戰(zhàn)將會(huì)遲早敲響鐘聲。 在大部分情況下,機(jī)器學(xué)習(xí)需要大量的計(jì)算力。即使忽略大數(shù)據(jù)時(shí)代已經(jīng)到來的事實(shí),數(shù)據(jù)集(做一個(gè)策劃的子集) 仍是一個(gè)相關(guān)實(shí)踐。雖然模型原型可以在筆記本電腦中完成構(gòu)建,但是使用一個(gè)大數(shù)據(jù)集訓(xùn)練復(fù)雜模型需要投入更多強(qiáng)有力的硬件。數(shù)據(jù)處理也是如此,它可以在正規(guī)的辦公設(shè)備上占用幾天時(shí)間,在快到截止日期時(shí) ——有時(shí)候模型需要每周或每天修改、重新訓(xùn)練——這顯然不是一種合理選擇。有三種可行方案來保持高效表現(xiàn):

1)加速硬件。如果你做的是相對(duì)簡(jiǎn)單的任務(wù)并且不用將模型應(yīng)用到大數(shù)據(jù)中,那么針對(duì)這些任務(wù)使用固態(tài)硬盤作為數(shù)據(jù)準(zhǔn)備或者使用分析軟件。計(jì)算集中處理能被放置在一個(gè)或幾個(gè)圖形處理單元 (GPUs)上執(zhí)行。大量可獲得的庫(kù)能讓GPUs 的處理模型能被用像Python一樣的高級(jí)語言編寫。

2)采用分布式計(jì)算。分布式計(jì)算指使用多臺(tái)機(jī)器處理分別切分之后的任務(wù)。然而,這個(gè)方法不能適用于所有的機(jī)器學(xué)習(xí)方法。

3)使用云計(jì)算的可擴(kuò)展性。如果你的模型在處理有集中高峰時(shí)段的顧客相關(guān)的數(shù)據(jù),云計(jì)算服務(wù)將具有急速可擴(kuò)展性。對(duì)于要求擁有其內(nèi)部數(shù)據(jù)的公司,值得考慮架構(gòu)私有云設(shè)施 。

下一步計(jì)劃

我們很容易在大量可獲得的解決方案中迷失。 它們算法不同、要求的技術(shù)不同,最終他們做的任務(wù)也不同。此情況對(duì)于這個(gè)年輕的市場(chǎng)非常普遍,甚至我們之前談?wù)摰娜箢I(lǐng)先解決方案并沒有產(chǎn)生完全的相互競(jìng)爭(zhēng)關(guān)系。不僅如此,變化的速度是非常快的。有很大可能你堅(jiān)守一個(gè)供應(yīng)商,然后突然另一個(gè)供應(yīng)商意外跳出來滿足你的商業(yè)需求。

正確的做法是盡早明了你打算通過機(jī)器學(xué)習(xí)獲得什么。這并不容易。如果你缺乏數(shù)據(jù)科學(xué)或相關(guān)領(lǐng)域?qū)I(yè)知識(shí),在數(shù)據(jù)科學(xué)與商業(yè)價(jià)值中搭一座連接橋是非常困難的。我們?cè)贏ltexSoft 與客戶討論機(jī)器學(xué)習(xí)應(yīng)用時(shí),經(jīng)常遇到這樣的問題。這通常是一個(gè)一般問題化為單一屬性的問題。無論是價(jià)格預(yù)測(cè)還是其他數(shù)值,確定對(duì)象的類別還是將對(duì)象分散成多個(gè)組, 一旦你找到這個(gè)單一屬性,確定供應(yīng)商和選擇提議內(nèi)容將會(huì)簡(jiǎn)單一些。

DCVC創(chuàng)立合伙人,Bradford Cross,認(rèn)為服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)不是一種可行的商業(yè)模式。據(jù)他所說,服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)落入了傾向使用開源產(chǎn)品的數(shù)據(jù)科學(xué)家與傾向購(gòu)買能解決更高級(jí)任務(wù)工具的高管之間的差異鴻溝中。然而,這個(gè)行業(yè)似乎現(xiàn)在還在克服它長(zhǎng)期以來存在的問題,最終我們將看到更多的公司通過轉(zhuǎn)向服務(wù)型導(dǎo)向的機(jī)器學(xué)習(xí)方向來避免昂貴的人才收錄,并同時(shí)擁有多功能的數(shù)據(jù)處理工具。

博客原址:

https://www.altexsoft.com/blog/datascience/comparing-machine-learning-as-a-service-amazon-microsoft-azure-google-cloud-ai/


更多文章,關(guān)注雷鋒網(wǎng)

添加雷鋒字幕組微信號(hào)(leiphonefansub)為好友

備注「我要加入」,To be a  AI  Volunteer !

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

谷歌云AI、微軟Azure、亞馬遜的機(jī)器學(xué)習(xí)服務(wù),究竟有啥區(qū)別?

分享:

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識(shí),讓語言不再成為學(xué)習(xí)知識(shí)的門檻。(原雷鋒字幕組)
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說