1
本文作者: 王金旺 | 2019-08-15 19:23 | 專題:全面突破 vivo NEX |
縱觀人工智能領(lǐng)域當(dāng)下戰(zhàn)局,無論是國外的微軟、谷歌、亞馬遜,還是國內(nèi)的BAT,都很注重自己的人工智能操作系統(tǒng)或人工智能引擎的開發(fā)、迭代,人工智能引擎也越來越多被應(yīng)用到諸如消費(fèi)電子、媒體影音、工業(yè)設(shè)計(jì)等領(lǐng)域。
其中,微軟小冰作為微軟在人工智能領(lǐng)域的重點(diǎn)培養(yǎng)對(duì)象,也已經(jīng)走過五個(gè)年頭,并在文本、語音、視覺這已知的三大技術(shù)領(lǐng)域小有所成,今年微軟對(duì)外更多在講的是微軟小冰的繪畫模型(畫家小冰),甚至為小冰在中央美術(shù)學(xué)院辦了“個(gè)人”畫展。雷鋒網(wǎng)此前也就微軟小冰的繪畫模型的相關(guān)技術(shù)問題與微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)、微軟小冰全球產(chǎn)品線負(fù)責(zé)人李笛進(jìn)行了深度交流(參見雷鋒網(wǎng)此前報(bào)道《微軟李笛:為什么說畫家小冰是最艱難的一次養(yǎng)成?》),也窺探了些許微軟小冰的研發(fā)及商用進(jìn)程和思路。
8月15日,第七代微軟小冰發(fā)布會(huì)在北京召開,會(huì)上微軟官方公布了第七代微軟小冰技術(shù)框架的能力升級(jí),主要公布了Dual AI、AI Creation、新技術(shù)突破、新框架發(fā)布,以及商業(yè)化進(jìn)展五個(gè)方面的最新進(jìn)展。
發(fā)布會(huì)上,首先登臺(tái)的是微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長(zhǎng)王永東,王永東首先強(qiáng)調(diào),微軟發(fā)布的內(nèi)容都是已經(jīng)上線的產(chǎn)品和合作。
其次,王永東拋出了開場(chǎng)甜點(diǎn):微軟小冰與閱文集團(tuán)合作,在學(xué)習(xí)了《全職高手》原著的文字,重建了小說中的世界觀和知識(shí)體系,并基于此進(jìn)行了擴(kuò)展和補(bǔ)充后,并通過建立知識(shí)圖譜創(chuàng)造了五位主人公的在線實(shí)體。據(jù)官方表示,這樣的在線實(shí)體也具有AI模型所具有的在交互中不斷迭代的能力。
基于此,微軟官方也表示,微軟小冰與閱文集團(tuán)的合作內(nèi)容已經(jīng)擴(kuò)大到100部作品主人公。
這也被王永東稱為有史以來最大規(guī)模將小說中人物進(jìn)行賦能的計(jì)劃。
隨后上臺(tái)的全球執(zhí)行副總裁、微軟人工智能事業(yè)部及微軟全球研究院負(fù)責(zé)人沈向洋進(jìn)行了此次微軟小冰關(guān)鍵技術(shù)能力發(fā)布,沈向洋首先回顧了微軟小冰的技術(shù)迭代及思考過程:
第一代,微軟小冰是基于文本、基于搜索簡(jiǎn)單的對(duì)話能力,當(dāng)時(shí)主要在思考人工智能是走“爆款硬件”,還是走“技術(shù)框架”的道路;
第二代,我們認(rèn)識(shí)到小冰需要有更多落地場(chǎng)景需要學(xué)習(xí);
第三代,我們認(rèn)識(shí)到小冰需要有不同的感官,需要加入語音、機(jī)器視覺的相關(guān)技術(shù);
第四代,我們認(rèn)識(shí)到知識(shí)圖譜的重要性,只有通過知識(shí)圖譜才能做更多IQ方面的嘗試;
第五代,這一代是我們的一個(gè)轉(zhuǎn)折點(diǎn),我們開始做深層次模型、全雙工、人工智能創(chuàng)造的相關(guān)思考及工作;
第六代,框架逐漸成熟;
第七代,今天發(fā)布的是第七代,這也將會(huì)有更強(qiáng)勁的質(zhì)的飛躍。
沈向洋將小冰及其框架的具體發(fā)展過程比喻成森林和樹木的一個(gè)關(guān)系:人工智能向前走需要一個(gè)框架,這個(gè)框架就是一片廣闊的土地,在這片土地上可以有森林,小冰只是這片森林中的一棵大樹。這棵大樹主要是為了驗(yàn)證這一框架的可行性,之后將會(huì)是技術(shù)賦能。
對(duì)于小冰的發(fā)展,沈向洋認(rèn)為主要經(jīng)歷了關(guān)鍵三步:
第一步,做這樣小冰的人工智能,迅速融入各類環(huán)境,能夠?yàn)榇蠹医邮埽?/p>
第二步,迅速獲得用戶喜愛,可以和用戶進(jìn)行交流;
第三步,持續(xù)迭代和演化,持續(xù)的發(fā)展能力。
此外,據(jù)沈向洋介紹,目前已經(jīng)有4.5億臺(tái)第三方智能硬件搭載微軟小冰。
發(fā)布會(huì)上,微軟首先介紹的是Dual AI的生態(tài)擴(kuò)展。
微軟小冰產(chǎn)品負(fù)責(zé)人彭爽介紹稱,這一框架是一個(gè)半開放的生態(tài)。此外,微軟小冰除去此前公布的融入華為、小米的智能手機(jī)及智能音箱等產(chǎn)品中,擴(kuò)展到小米有屏幕音箱上以外,具體有以下幾點(diǎn)生態(tài)邊界擴(kuò)展:
在智能手機(jī)方面,此次進(jìn)一步有vivo和OPPO兩大品牌加入,這也使得微軟小冰在國內(nèi)集齊了智能手機(jī)領(lǐng)域華為、小米、vivo、OPPO四大頭部品牌;
在社交網(wǎng)絡(luò)系統(tǒng)方面,微軟小冰在日本與LINE平臺(tái)進(jìn)行合作,在國內(nèi)與QQ不斷合作,發(fā)布會(huì)上官宣,小冰已進(jìn)入3000萬個(gè)QQ群。此外,微軟小冰進(jìn)一步宣布與微信合作,具體與騰訊小微展開兩方面合作:
第一,與微信AI小微就對(duì)話開方平臺(tái)能力進(jìn)行合作;
第二,與微信AI涉及的智能硬件產(chǎn)品上展開合作。
內(nèi)容咨詢平臺(tái)方面,除網(wǎng)易、新浪外,再次與今日頭條合作,可以為人類發(fā)布內(nèi)容留言,與人類進(jìn)行交互。
電視電臺(tái)方面,截止上個(gè)月末,微軟小冰已經(jīng)覆蓋中國及日本50家電臺(tái)/電視臺(tái),69檔節(jié)目,累計(jì)已參與播出時(shí)長(zhǎng)為6908小時(shí),今年生產(chǎn)時(shí)長(zhǎng)是去年的2.05倍。
在此過程中,沈向洋總結(jié)時(shí)特別強(qiáng)調(diào),微軟小冰從交互到交流也將是其不斷發(fā)展的一個(gè)方向。
去年7月微軟成立了小冰工作室,小冰首席科學(xué)家宋睿華將小冰工作室定義為一個(gè)系統(tǒng)性地對(duì)人類創(chuàng)造力建模的人工智能平臺(tái)。在發(fā)布會(huì)上,宋睿華也進(jìn)一步公布了小冰工作室的最新動(dòng)態(tài),而這樣的最新動(dòng)態(tài)也主要是基于文本、語音、視覺三方面技術(shù)能力的拓展。
在演唱模型方面,“微軟小冰在擁有越來越多接近人類嗓音的能力后,逐漸向技巧和風(fēng)格化邁進(jìn)?!爆F(xiàn)場(chǎng),微軟官方現(xiàn)場(chǎng)編號(hào)為F10的微軟小冰以「民謠+戲曲」風(fēng)格的聲音演示了曉月老板的《少年弦》,以「音樂劇+High C」演示了周杰倫的牛仔很忙。
微軟小冰的人工智能的創(chuàng)造能力可以復(fù)制,一個(gè)模型學(xué)會(huì)后,多個(gè)模型可以復(fù)制該能力。
宋睿華介紹,人工智能創(chuàng)造更接近內(nèi)容生產(chǎn)角色,滿足未來高度定制化的用戶需求。
文本及視覺能力方面,據(jù)宋睿華在發(fā)布會(huì)上介紹稱,中信出版社將出版小冰的第一部繪畫作品集。
我們希望將人工智能創(chuàng)造上升到內(nèi)容生產(chǎn)領(lǐng)域,這也是我們看到的未來時(shí)代發(fā)展趨勢(shì)。
宋睿華在大會(huì)上進(jìn)一步解釋,未來需要定制化的內(nèi)容,但是由于人類創(chuàng)作者難以實(shí)現(xiàn)高并發(fā)性,從內(nèi)容生產(chǎn)源頭做高度定制化不現(xiàn)實(shí),人工智能有可能是解決這一矛盾的唯一方案。
微軟的人工智能創(chuàng)造模型來源于其小冰工作室的「AI Creation模型庫」,基于此實(shí)現(xiàn)在人力不參與的情況下實(shí)現(xiàn)高并發(fā)內(nèi)容的創(chuàng)造和分發(fā)。
據(jù)微軟官方表示,目前微軟已經(jīng)實(shí)現(xiàn)兒童故事生產(chǎn)線,并交付給當(dāng)當(dāng)云閱讀,為聯(lián)通沃音樂平臺(tái)交付了作詞作曲生產(chǎn)線,與中國紡織工業(yè)聯(lián)合會(huì)共同搭建了服裝紋樣設(shè)計(jì)生產(chǎn)線并在發(fā)布會(huì)上正式公布上線。
宋睿華在發(fā)布會(huì)上特別強(qiáng)調(diào)了兒童故事生產(chǎn)線,“微軟小冰以「文本+聲音+視覺+實(shí)體搜索」技術(shù)能力為基礎(chǔ)構(gòu)建了「可交互有聲繪本」,只要上傳文本就可以生成類似劇本的有聲繪本?!?/p>
在介紹微軟小冰新技術(shù)能力突破時(shí),小冰技術(shù)負(fù)責(zé)人周力首先上臺(tái)表示,“我們不僅僅是為了打造一個(gè)微軟小冰這樣一個(gè)少女模型,而更在于其背后技術(shù)框架的能力提升?!?/p>
當(dāng)AI在對(duì)話過程中處在平等或主導(dǎo)的地位時(shí),人類反而能夠獲得更豐富的信息,人機(jī)對(duì)話也更有價(jià)值,這其中EQ起到關(guān)鍵作用。
第一,在核心對(duì)話引擎上,微軟小冰的對(duì)話引擎此次實(shí)現(xiàn)了“平等對(duì)話”向“主導(dǎo)對(duì)話”方向的跨越,主要表現(xiàn)為第七代微軟小冰已經(jīng)可以預(yù)先籌劃未來對(duì)話,以在各種場(chǎng)合中主導(dǎo)對(duì)話走向。
如下圖所示,當(dāng)小冰在第四輪開啟主導(dǎo)對(duì)話能力時(shí),亮粉色的標(biāo)記為小冰嘗試主導(dǎo)對(duì)話,可以預(yù)先判斷整個(gè)對(duì)話未來的若干走向,根據(jù)人類真實(shí)反映引導(dǎo)進(jìn)入不同對(duì)話分支。第四輪到第十五輪整個(gè)對(duì)話過程由AI主導(dǎo),“這也使得直男從最初不會(huì)聊天,到之后可以獲得更多有用信息”。
這一能力被微軟應(yīng)用到在線零售場(chǎng)景中,官方表示,擁有主導(dǎo)對(duì)話在線推薦能力的在線零售場(chǎng)景的應(yīng)用中,實(shí)現(xiàn)了零投訴的推銷。
第二,在全雙工語音交互技術(shù)上,繼電話、智能音箱后,微軟進(jìn)一步將其拓展到汽車應(yīng)用領(lǐng)域。
通過車載設(shè)備,我們已經(jīng)在一些車型上測(cè)試,同時(shí)希望可以在5G普及后,提升微軟小冰全雙工在汽車上的落地普及。
第三,去年微軟小冰多模態(tài)感官的Demo如今已經(jīng)完成公開測(cè)試。微軟小冰多模態(tài)感官是一種融合了全雙工語音、實(shí)時(shí)視覺與核心對(duì)話引擎的交互感官。今年2月通過安卓手機(jī)上的APP在日本邀請(qǐng)媒體進(jìn)行了測(cè)試。
微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛上臺(tái)介紹稱,Avatar Framework是小冰今年最大的一個(gè)飛躍。
首先,李笛解釋了微軟對(duì)人工智能的理解:對(duì)于人工智能諸如助理的定義可能會(huì)比較粗糙,微軟將其定義為AI beings,目前主要包括四類角色:
助理,從屬于某個(gè)特定人類,幫助人類實(shí)現(xiàn)某種用途或價(jià)值;
替身,某個(gè)特定人類授權(quán)其代為完成相應(yīng)工作;
參與者,小冰在QQ群里作為參與者的出現(xiàn),這類應(yīng)用不從屬于某個(gè)特定人類,而是作為參與者與人類進(jìn)行交互;
創(chuàng)造者,不直接與人類進(jìn)行交互,而是通過AI衍生物與人類交互。
Avatar Framework被微軟定義為一個(gè)可以孵化各種AI beings的通用架構(gòu)。簡(jiǎn)言之,Avatar Framework提供的是一套工具包,此次公布的首個(gè)工具包版本關(guān)鍵信息如下:
該工具包與微軟小冰框架同源,可構(gòu)建具有完整情感計(jì)算能力的人工智能助手、社交對(duì)話機(jī)器人、人工智能內(nèi)容創(chuàng)作和IP人物角色等;
該工具包包含對(duì)話、聲音、視覺、觀點(diǎn)、技能、知識(shí)及創(chuàng)造力等豐富工具,并可驅(qū)動(dòng)兼容的3D人物模型進(jìn)行實(shí)時(shí)交互;
在本次發(fā)布前,微軟已通過Avatar Framework框架賦能軟銀Pepper等數(shù)十個(gè)第三方客戶AI,以及微軟小冰自身。本次發(fā)布會(huì)宣布了微軟與閱文集團(tuán)針對(duì)100部小說主人公I(xiàn)P的合作;
本次發(fā)布的Avatar Framework V1版本是面向全部合作伙伴及客戶的版本。面向個(gè)人使用者的版本預(yù)計(jì)將于2020年春季發(fā)布。
據(jù)官方介紹,Profile工具是Avatar Framework的基礎(chǔ),通過Profile構(gòu)建一個(gè)AI being的人格主要分為三步:
第一步,填入76項(xiàng)基礎(chǔ)信息,微軟官方還特別強(qiáng)調(diào),這一步驟支持通過批量上傳文本信息,自動(dòng)分析文本內(nèi)容的知識(shí)圖譜,從中抽取基本信息;
第二步,設(shè)置27項(xiàng)性格特征參數(shù),例如這一階段如果將嚴(yán)肅程度調(diào)得很低,將自信程度調(diào)得很高,就可能打造出比較受小朋友歡迎的智能助理;
原型是一切的基礎(chǔ),性格是原型的關(guān)鍵,這主要是因?yàn)橐粋€(gè)AI being的性格參數(shù)決定了其創(chuàng)造、提供服務(wù)時(shí)候態(tài)度及傾向。
第三步,設(shè)置AI being喜歡或討厭的話題類型和客觀事物。
以上三步完成AI being的人格定義后,后續(xù)所有工具會(huì)在Profile中得到初始數(shù)據(jù),訓(xùn)練結(jié)果也會(huì)反饋影響到初始數(shù)據(jù)值。
隨后通過對(duì)話工具、聲音工具、視覺工具實(shí)現(xiàn)相應(yīng)能力設(shè)置。此外,可以通過輸入兼容的3D模型,可以形成可視模型,具體3D模型兼容性要求如下圖左圖所示:
用微軟此次發(fā)布的工具驅(qū)動(dòng)3D模型主要分為四步:使用推薦3D模型或?qū)胄碌?D模型,設(shè)計(jì)宏觀動(dòng)作風(fēng)格,設(shè)計(jì)標(biāo)志性動(dòng)作,設(shè)置面部表情的豐富度。具體信息設(shè)置完成后,還可以根據(jù)此前人設(shè)定義自動(dòng)匹配相關(guān)參數(shù),此外還可以手動(dòng)調(diào)整相關(guān)參數(shù)。
去年開始進(jìn)行商業(yè)化,經(jīng)過一年的發(fā)展,微軟人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理、小冰團(tuán)隊(duì)商業(yè)負(fù)責(zé)人徐元春在發(fā)布會(huì)上揭秘了當(dāng)下進(jìn)程。
微軟小冰的商業(yè)模式到底是什么樣呢?
據(jù)微軟官方表示,目前微軟小冰已落地的商業(yè)客戶覆蓋金融、零售、汽車、地產(chǎn)、紡織等十個(gè)領(lǐng)域,客戶包括萬科、萬得資訊、萬事利、中國聯(lián)通等。
徐元春在發(fā)布會(huì)上也舉例進(jìn)行了說明:
資訊領(lǐng)域,去年微軟利用AI Creation文本生成技術(shù),幫助萬得進(jìn)行滬深兩市上市企業(yè)的公告摘要,目前這個(gè)系統(tǒng)已經(jīng)準(zhǔn)確和穩(wěn)定的運(yùn)行超過21個(gè)月,從最開始面向機(jī)構(gòu)投資者的長(zhǎng)摘要拓展到面向個(gè)人投資者的短摘要,覆蓋了從系統(tǒng)服務(wù)到應(yīng)用服務(wù)的全方位領(lǐng)域;
金融領(lǐng)域,我們和合作伙伴一起開發(fā)了金融電臺(tái)產(chǎn)品,通過這個(gè)產(chǎn)品,可以讓摘要和財(cái)經(jīng)信息即時(shí)、高質(zhì)量、24小時(shí)不間斷的通過語音輸出給機(jī)構(gòu)投資者和個(gè)人用戶;
知識(shí)產(chǎn)權(quán)領(lǐng)域,我們和青島出版社合作,利用語音合成技術(shù),通過版權(quán)的雙向授權(quán),開發(fā)了全新系列的兒童讀物《小紅馬》;
紡織領(lǐng)域,我們和中國紡織信息中心、國家紡織品開發(fā)中心推出了面向中小型紡織企業(yè)的AI設(shè)計(jì)平臺(tái),這個(gè)設(shè)計(jì)平臺(tái)集成了流行趨勢(shì)預(yù)測(cè)、大數(shù)據(jù)、AI設(shè)計(jì)模塊,能夠完整的滿足一個(gè)中小型企業(yè)在AI設(shè)計(jì)領(lǐng)域全部的技術(shù)訴求;
音樂領(lǐng)域,我們與聯(lián)通沃音樂的合作,通過允許沃音樂在平臺(tái)層面集成我們的AI作詞、作曲、編曲,以及其它音樂生成的能力,同時(shí)結(jié)合運(yùn)營商的能力和海量的音樂數(shù)據(jù)庫,以及其他合作伙伴模塊,共同打造了完整和獨(dú)立的音樂平臺(tái),這個(gè)音樂平臺(tái)可以為幾億用戶同時(shí)提供100%的音樂定制內(nèi)容生產(chǎn)的能力。
人工智能進(jìn)程中,技術(shù)進(jìn)入迭代期、商業(yè)化探索仍在繼續(xù)
從第七代微軟小冰的能力更新,雷鋒網(wǎng)也看到,微軟小冰在技術(shù)上已經(jīng)覆蓋了當(dāng)下可見的文本、語音、視覺三方面,此次發(fā)布更多強(qiáng)調(diào)的是能力的迭代升級(jí)、合作廠商的進(jìn)一步拓展、架構(gòu)的開放應(yīng)用,以及人工智能的商業(yè)化探索與進(jìn)程。
人工智能似乎離我們很遠(yuǎn),我們走在城市街道上仍難以看到網(wǎng)上盛傳的配送機(jī)器人,多數(shù)人家中也沒有新聞中看到的高逼格的智能家居系統(tǒng),當(dāng)下的人機(jī)交互方式仍以觸屏為主;人工智能似乎又離我們很近,你聽到的電臺(tái)主持人可能已經(jīng)是人工智能系統(tǒng),您看到的即時(shí)新聞也有可能是人工智能系統(tǒng)所生產(chǎn),人工智能也逐漸滲透到城市監(jiān)控、工業(yè)生產(chǎn)、教育體系等你可能還不曾關(guān)注的領(lǐng)域。
一切都未必如期而至,但一切都在進(jìn)程中。
相關(guān)文章:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。