第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

本文作者：王金旺

2019-08-15 19:23

導(dǎo)語：第七代微軟小冰的技術(shù)能力、生態(tài)伙伴拓展，商業(yè)化能力解析。

縱觀人工智能領(lǐng)域當(dāng)下戰(zhàn)局，無論是國外的微軟、谷歌、亞馬遜，還是國內(nèi)的BAT，都很注重自己的人工智能操作系統(tǒng)或人工智能引擎的開發(fā)、迭代，人工智能引擎也越來越多被應(yīng)用到諸如消費(fèi)電子、媒體影音、工業(yè)設(shè)計(jì)等領(lǐng)域。

其中，微軟小冰作為微軟在人工智能領(lǐng)域的重點(diǎn)培養(yǎng)對(duì)象，也已經(jīng)走過五個(gè)年頭，并在文本、語音、視覺這已知的三大技術(shù)領(lǐng)域小有所成，今年微軟對(duì)外更多在講的是微軟小冰的繪畫模型（畫家小冰），甚至為小冰在中央美術(shù)學(xué)院辦了“個(gè)人”畫展。雷鋒網(wǎng)此前也就微軟小冰的繪畫模型的相關(guān)技術(shù)問題與微軟（亞洲）互聯(lián)網(wǎng)工程院副院長(zhǎng)、微軟小冰全球產(chǎn)品線負(fù)責(zé)人李笛進(jìn)行了深度交流（參見雷鋒網(wǎng)此前報(bào)道《微軟李笛：為什么說畫家小冰是最艱難的一次養(yǎng)成？》），也窺探了些許微軟小冰的研發(fā)及商用進(jìn)程和思路。

8月15日，第七代微軟小冰發(fā)布會(huì)在北京召開，會(huì)上微軟官方公布了第七代微軟小冰技術(shù)框架的能力升級(jí)，主要公布了Dual AI、AI Creation、新技術(shù)突破、新框架發(fā)布，以及商業(yè)化進(jìn)展五個(gè)方面的最新進(jìn)展。

開場(chǎng)甜點(diǎn)：AI重現(xiàn)小說主人公

發(fā)布會(huì)上，首先登臺(tái)的是微軟全球資深副總裁、微軟（亞洲）互聯(lián)網(wǎng)工程院院長(zhǎng)王永東，王永東首先強(qiáng)調(diào)，微軟發(fā)布的內(nèi)容都是已經(jīng)上線的產(chǎn)品和合作。

其次，王永東拋出了開場(chǎng)甜點(diǎn)：微軟小冰與閱文集團(tuán)合作，在學(xué)習(xí)了《全職高手》原著的文字，重建了小說中的世界觀和知識(shí)體系，并基于此進(jìn)行了擴(kuò)展和補(bǔ)充后，并通過建立知識(shí)圖譜創(chuàng)造了五位主人公的在線實(shí)體。據(jù)官方表示，這樣的在線實(shí)體也具有AI模型所具有的在交互中不斷迭代的能力。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

基于此，微軟官方也表示，微軟小冰與閱文集團(tuán)的合作內(nèi)容已經(jīng)擴(kuò)大到100部作品主人公。

這也被王永東稱為有史以來最大規(guī)模將小說中人物進(jìn)行賦能的計(jì)劃。

沈向洋：歷數(shù)小冰七代進(jìn)程

隨后上臺(tái)的全球執(zhí)行副總裁、微軟人工智能事業(yè)部及微軟全球研究院負(fù)責(zé)人沈向洋進(jìn)行了此次微軟小冰關(guān)鍵技術(shù)能力發(fā)布，沈向洋首先回顧了微軟小冰的技術(shù)迭代及思考過程：

第一代，微軟小冰是基于文本、基于搜索簡(jiǎn)單的對(duì)話能力，當(dāng)時(shí)主要在思考人工智能是走“爆款硬件”，還是走“技術(shù)框架”的道路；
第二代，我們認(rèn)識(shí)到小冰需要有更多落地場(chǎng)景需要學(xué)習(xí)；
第三代，我們認(rèn)識(shí)到小冰需要有不同的感官，需要加入語音、機(jī)器視覺的相關(guān)技術(shù)；
第四代，我們認(rèn)識(shí)到知識(shí)圖譜的重要性，只有通過知識(shí)圖譜才能做更多IQ方面的嘗試；
第五代，這一代是我們的一個(gè)轉(zhuǎn)折點(diǎn)，我們開始做深層次模型、全雙工、人工智能創(chuàng)造的相關(guān)思考及工作；
第六代，框架逐漸成熟；
第七代，今天發(fā)布的是第七代，這也將會(huì)有更強(qiáng)勁的質(zhì)的飛躍。

沈向洋將小冰及其框架的具體發(fā)展過程比喻成森林和樹木的一個(gè)關(guān)系：人工智能向前走需要一個(gè)框架，這個(gè)框架就是一片廣闊的土地，在這片土地上可以有森林，小冰只是這片森林中的一棵大樹。這棵大樹主要是為了驗(yàn)證這一框架的可行性，之后將會(huì)是技術(shù)賦能。

對(duì)于小冰的發(fā)展，沈向洋認(rèn)為主要經(jīng)歷了關(guān)鍵三步：

第一步，做這樣小冰的人工智能，迅速融入各類環(huán)境，能夠?yàn)榇蠹医邮埽?/p>
第二步，迅速獲得用戶喜愛，可以和用戶進(jìn)行交流；
第三步，持續(xù)迭代和演化，持續(xù)的發(fā)展能力。

此外，據(jù)沈向洋介紹，目前已經(jīng)有4.5億臺(tái)第三方智能硬件搭載微軟小冰。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

Dual AI擴(kuò)大朋友圈：vivo、OPPO、微信、今日頭條的加入

發(fā)布會(huì)上，微軟首先介紹的是Dual AI的生態(tài)擴(kuò)展。

微軟小冰產(chǎn)品負(fù)責(zé)人彭爽介紹稱，這一框架是一個(gè)半開放的生態(tài)。此外，微軟小冰除去此前公布的融入華為、小米的智能手機(jī)及智能音箱等產(chǎn)品中，擴(kuò)展到小米有屏幕音箱上以外，具體有以下幾點(diǎn)生態(tài)邊界擴(kuò)展：

在智能手機(jī)方面，此次進(jìn)一步有vivo和OPPO兩大品牌加入，這也使得微軟小冰在國內(nèi)集齊了智能手機(jī)領(lǐng)域華為、小米、vivo、OPPO四大頭部品牌；

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

在社交網(wǎng)絡(luò)系統(tǒng)方面，微軟小冰在日本與LINE平臺(tái)進(jìn)行合作，在國內(nèi)與QQ不斷合作，發(fā)布會(huì)上官宣，小冰已進(jìn)入3000萬個(gè)QQ群。此外，微軟小冰進(jìn)一步宣布與微信合作，具體與騰訊小微展開兩方面合作：

第一，與微信AI小微就對(duì)話開方平臺(tái)能力進(jìn)行合作；
第二，與微信AI涉及的智能硬件產(chǎn)品上展開合作。

內(nèi)容咨詢平臺(tái)方面，除網(wǎng)易、新浪外，再次與今日頭條合作，可以為人類發(fā)布內(nèi)容留言，與人類進(jìn)行交互。

電視電臺(tái)方面，截止上個(gè)月末，微軟小冰已經(jīng)覆蓋中國及日本50家電臺(tái)/電視臺(tái)，69檔節(jié)目，累計(jì)已參與播出時(shí)長(zhǎng)為6908小時(shí)，今年生產(chǎn)時(shí)長(zhǎng)是去年的2.05倍。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

在此過程中，沈向洋總結(jié)時(shí)特別強(qiáng)調(diào)，微軟小冰從交互到交流也將是其不斷發(fā)展的一個(gè)方向。

AI Creation：量產(chǎn)化AI生產(chǎn)線

去年7月微軟成立了小冰工作室，小冰首席科學(xué)家宋睿華將小冰工作室定義為一個(gè)系統(tǒng)性地對(duì)人類創(chuàng)造力建模的人工智能平臺(tái)。在發(fā)布會(huì)上，宋睿華也進(jìn)一步公布了小冰工作室的最新動(dòng)態(tài)，而這樣的最新動(dòng)態(tài)也主要是基于文本、語音、視覺三方面技術(shù)能力的拓展。

在演唱模型方面，“微軟小冰在擁有越來越多接近人類嗓音的能力后，逐漸向技巧和風(fēng)格化邁進(jìn)?！爆F(xiàn)場(chǎng)，微軟官方現(xiàn)場(chǎng)編號(hào)為F10的微軟小冰以「民謠+戲曲」風(fēng)格的聲音演示了曉月老板的《少年弦》，以「音樂劇+High C」演示了周杰倫的牛仔很忙。

微軟小冰的人工智能的創(chuàng)造能力可以復(fù)制，一個(gè)模型學(xué)會(huì)后，多個(gè)模型可以復(fù)制該能力。

宋睿華介紹，人工智能創(chuàng)造更接近內(nèi)容生產(chǎn)角色，滿足未來高度定制化的用戶需求。

文本及視覺能力方面，據(jù)宋睿華在發(fā)布會(huì)上介紹稱，中信出版社將出版小冰的第一部繪畫作品集。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

我們希望將人工智能創(chuàng)造上升到內(nèi)容生產(chǎn)領(lǐng)域，這也是我們看到的未來時(shí)代發(fā)展趨勢(shì)。

宋睿華在大會(huì)上進(jìn)一步解釋，未來需要定制化的內(nèi)容，但是由于人類創(chuàng)作者難以實(shí)現(xiàn)高并發(fā)性，從內(nèi)容生產(chǎn)源頭做高度定制化不現(xiàn)實(shí)，人工智能有可能是解決這一矛盾的唯一方案。

微軟的人工智能創(chuàng)造模型來源于其小冰工作室的「AI Creation模型庫」，基于此實(shí)現(xiàn)在人力不參與的情況下實(shí)現(xiàn)高并發(fā)內(nèi)容的創(chuàng)造和分發(fā)。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

據(jù)微軟官方表示，目前微軟已經(jīng)實(shí)現(xiàn)兒童故事生產(chǎn)線，并交付給當(dāng)當(dāng)云閱讀，為聯(lián)通沃音樂平臺(tái)交付了作詞作曲生產(chǎn)線，與中國紡織工業(yè)聯(lián)合會(huì)共同搭建了服裝紋樣設(shè)計(jì)生產(chǎn)線并在發(fā)布會(huì)上正式公布上線。

宋睿華在發(fā)布會(huì)上特別強(qiáng)調(diào)了兒童故事生產(chǎn)線，“微軟小冰以「文本+聲音+視覺+實(shí)體搜索」技術(shù)能力為基礎(chǔ)構(gòu)建了「可交互有聲繪本」，只要上傳文本就可以生成類似劇本的有聲繪本?！?/p>

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

新技術(shù)突破：核心對(duì)話能力實(shí)現(xiàn)“主導(dǎo)對(duì)話”、全雙工語音落地車用場(chǎng)景、多模態(tài)感官完成公測(cè)

在介紹微軟小冰新技術(shù)能力突破時(shí)，小冰技術(shù)負(fù)責(zé)人周力首先上臺(tái)表示，“我們不僅僅是為了打造一個(gè)微軟小冰這樣一個(gè)少女模型，而更在于其背后技術(shù)框架的能力提升?！?/p>

當(dāng)AI在對(duì)話過程中處在平等或主導(dǎo)的地位時(shí)，人類反而能夠獲得更豐富的信息，人機(jī)對(duì)話也更有價(jià)值，這其中EQ起到關(guān)鍵作用。

第一，在核心對(duì)話引擎上，微軟小冰的對(duì)話引擎此次實(shí)現(xiàn)了“平等對(duì)話”向“主導(dǎo)對(duì)話”方向的跨越，主要表現(xiàn)為第七代微軟小冰已經(jīng)可以預(yù)先籌劃未來對(duì)話，以在各種場(chǎng)合中主導(dǎo)對(duì)話走向。

如下圖所示，當(dāng)小冰在第四輪開啟主導(dǎo)對(duì)話能力時(shí)，亮粉色的標(biāo)記為小冰嘗試主導(dǎo)對(duì)話，可以預(yù)先判斷整個(gè)對(duì)話未來的若干走向，根據(jù)人類真實(shí)反映引導(dǎo)進(jìn)入不同對(duì)話分支。第四輪到第十五輪整個(gè)對(duì)話過程由AI主導(dǎo)，“這也使得直男從最初不會(huì)聊天，到之后可以獲得更多有用信息”。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

這一能力被微軟應(yīng)用到在線零售場(chǎng)景中，官方表示，擁有主導(dǎo)對(duì)話在線推薦能力的在線零售場(chǎng)景的應(yīng)用中，實(shí)現(xiàn)了零投訴的推銷。

第二，在全雙工語音交互技術(shù)上，繼電話、智能音箱后，微軟進(jìn)一步將其拓展到汽車應(yīng)用領(lǐng)域。

通過車載設(shè)備，我們已經(jīng)在一些車型上測(cè)試，同時(shí)希望可以在5G普及后，提升微軟小冰全雙工在汽車上的落地普及。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

第三，去年微軟小冰多模態(tài)感官的Demo如今已經(jīng)完成公開測(cè)試。微軟小冰多模態(tài)感官是一種融合了全雙工語音、實(shí)時(shí)視覺與核心對(duì)話引擎的交互感官。今年2月通過安卓手機(jī)上的APP在日本邀請(qǐng)媒體進(jìn)行了測(cè)試。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

Avatar Framework：推出首個(gè)面向B端用戶的工具包

微軟（亞洲）互聯(lián)網(wǎng)工程院副院長(zhǎng)、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛上臺(tái)介紹稱，Avatar Framework是小冰今年最大的一個(gè)飛躍。

首先，李笛解釋了微軟對(duì)人工智能的理解：對(duì)于人工智能諸如助理的定義可能會(huì)比較粗糙，微軟將其定義為AI beings，目前主要包括四類角色：

助理，從屬于某個(gè)特定人類，幫助人類實(shí)現(xiàn)某種用途或價(jià)值；
替身，某個(gè)特定人類授權(quán)其代為完成相應(yīng)工作；
參與者，小冰在QQ群里作為參與者的出現(xiàn)，這類應(yīng)用不從屬于某個(gè)特定人類，而是作為參與者與人類進(jìn)行交互；
創(chuàng)造者，不直接與人類進(jìn)行交互，而是通過AI衍生物與人類交互。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

Avatar Framework被微軟定義為一個(gè)可以孵化各種AI beings的通用架構(gòu)。簡(jiǎn)言之，Avatar Framework提供的是一套工具包，此次公布的首個(gè)工具包版本關(guān)鍵信息如下：

該工具包與微軟小冰框架同源，可構(gòu)建具有完整情感計(jì)算能力的人工智能助手、社交對(duì)話機(jī)器人、人工智能內(nèi)容創(chuàng)作和IP人物角色等；
該工具包包含對(duì)話、聲音、視覺、觀點(diǎn)、技能、知識(shí)及創(chuàng)造力等豐富工具，并可驅(qū)動(dòng)兼容的3D人物模型進(jìn)行實(shí)時(shí)交互；
在本次發(fā)布前，微軟已通過Avatar Framework框架賦能軟銀Pepper等數(shù)十個(gè)第三方客戶AI，以及微軟小冰自身。本次發(fā)布會(huì)宣布了微軟與閱文集團(tuán)針對(duì)100部小說主人公I(xiàn)P的合作；
本次發(fā)布的Avatar Framework V1版本是面向全部合作伙伴及客戶的版本。面向個(gè)人使用者的版本預(yù)計(jì)將于2020年春季發(fā)布。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

據(jù)官方介紹，Profile工具是Avatar Framework的基礎(chǔ)，通過Profile構(gòu)建一個(gè)AI being的人格主要分為三步：

第一步，填入76項(xiàng)基礎(chǔ)信息，微軟官方還特別強(qiáng)調(diào)，這一步驟支持通過批量上傳文本信息，自動(dòng)分析文本內(nèi)容的知識(shí)圖譜，從中抽取基本信息；

第二步，設(shè)置27項(xiàng)性格特征參數(shù)，例如這一階段如果將嚴(yán)肅程度調(diào)得很低，將自信程度調(diào)得很高，就可能打造出比較受小朋友歡迎的智能助理；

原型是一切的基礎(chǔ)，性格是原型的關(guān)鍵，這主要是因?yàn)橐粋€(gè)AI being的性格參數(shù)決定了其創(chuàng)造、提供服務(wù)時(shí)候態(tài)度及傾向。

第三步，設(shè)置AI being喜歡或討厭的話題類型和客觀事物。

以上三步完成AI being的人格定義后，后續(xù)所有工具會(huì)在Profile中得到初始數(shù)據(jù)，訓(xùn)練結(jié)果也會(huì)反饋影響到初始數(shù)據(jù)值。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

隨后通過對(duì)話工具、聲音工具、視覺工具實(shí)現(xiàn)相應(yīng)能力設(shè)置。此外，可以通過輸入兼容的3D模型，可以形成可視模型，具體3D模型兼容性要求如下圖左圖所示：

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

用微軟此次發(fā)布的工具驅(qū)動(dòng)3D模型主要分為四步：使用推薦3D模型或?qū)胄碌?D模型，設(shè)計(jì)宏觀動(dòng)作風(fēng)格，設(shè)計(jì)標(biāo)志性動(dòng)作，設(shè)置面部表情的豐富度。具體信息設(shè)置完成后，還可以根據(jù)此前人設(shè)定義自動(dòng)匹配相關(guān)參數(shù)，此外還可以手動(dòng)調(diào)整相關(guān)參數(shù)。

微軟小冰商業(yè)化進(jìn)程ing

去年開始進(jìn)行商業(yè)化，經(jīng)過一年的發(fā)展，微軟人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理、小冰團(tuán)隊(duì)商業(yè)負(fù)責(zé)人徐元春在發(fā)布會(huì)上揭秘了當(dāng)下進(jìn)程。

微軟小冰的商業(yè)模式到底是什么樣呢？

據(jù)微軟官方表示，目前微軟小冰已落地的商業(yè)客戶覆蓋金融、零售、汽車、地產(chǎn)、紡織等十個(gè)領(lǐng)域，客戶包括萬科、萬得資訊、萬事利、中國聯(lián)通等。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

徐元春在發(fā)布會(huì)上也舉例進(jìn)行了說明：

資訊領(lǐng)域，去年微軟利用AI Creation文本生成技術(shù)，幫助萬得進(jìn)行滬深兩市上市企業(yè)的公告摘要，目前這個(gè)系統(tǒng)已經(jīng)準(zhǔn)確和穩(wěn)定的運(yùn)行超過21個(gè)月，從最開始面向機(jī)構(gòu)投資者的長(zhǎng)摘要拓展到面向個(gè)人投資者的短摘要，覆蓋了從系統(tǒng)服務(wù)到應(yīng)用服務(wù)的全方位領(lǐng)域;
金融領(lǐng)域，我們和合作伙伴一起開發(fā)了金融電臺(tái)產(chǎn)品，通過這個(gè)產(chǎn)品，可以讓摘要和財(cái)經(jīng)信息即時(shí)、高質(zhì)量、24小時(shí)不間斷的通過語音輸出給機(jī)構(gòu)投資者和個(gè)人用戶；
知識(shí)產(chǎn)權(quán)領(lǐng)域，我們和青島出版社合作，利用語音合成技術(shù)，通過版權(quán)的雙向授權(quán)，開發(fā)了全新系列的兒童讀物《小紅馬》；
紡織領(lǐng)域，我們和中國紡織信息中心、國家紡織品開發(fā)中心推出了面向中小型紡織企業(yè)的AI設(shè)計(jì)平臺(tái)，這個(gè)設(shè)計(jì)平臺(tái)集成了流行趨勢(shì)預(yù)測(cè)、大數(shù)據(jù)、AI設(shè)計(jì)模塊，能夠完整的滿足一個(gè)中小型企業(yè)在AI設(shè)計(jì)領(lǐng)域全部的技術(shù)訴求；
音樂領(lǐng)域，我們與聯(lián)通沃音樂的合作，通過允許沃音樂在平臺(tái)層面集成我們的AI作詞、作曲、編曲，以及其它音樂生成的能力，同時(shí)結(jié)合運(yùn)營商的能力和海量的音樂數(shù)據(jù)庫，以及其他合作伙伴模塊，共同打造了完整和獨(dú)立的音樂平臺(tái)，這個(gè)音樂平臺(tái)可以為幾億用戶同時(shí)提供100%的音樂定制內(nèi)容生產(chǎn)的能力。

第七代微軟小冰：入駐vivo、OPPO，登陸汽車平臺(tái)，發(fā)布首個(gè)開發(fā)工具包

人工智能進(jìn)程中，技術(shù)進(jìn)入迭代期、商業(yè)化探索仍在繼續(xù)

從第七代微軟小冰的能力更新，雷鋒網(wǎng)也看到，微軟小冰在技術(shù)上已經(jīng)覆蓋了當(dāng)下可見的文本、語音、視覺三方面，此次發(fā)布更多強(qiáng)調(diào)的是能力的迭代升級(jí)、合作廠商的進(jìn)一步拓展、架構(gòu)的開放應(yīng)用，以及人工智能的商業(yè)化探索與進(jìn)程。

人工智能似乎離我們很遠(yuǎn)，我們走在城市街道上仍難以看到網(wǎng)上盛傳的配送機(jī)器人，多數(shù)人家中也沒有新聞中看到的高逼格的智能家居系統(tǒng)，當(dāng)下的人機(jī)交互方式仍以觸屏為主；人工智能似乎又離我們很近，你聽到的電臺(tái)主持人可能已經(jīng)是人工智能系統(tǒng)，您看到的即時(shí)新聞也有可能是人工智能系統(tǒng)所生產(chǎn)，人工智能也逐漸滲透到城市監(jiān)控、工業(yè)生產(chǎn)、教育體系等你可能還不曾關(guān)注的領(lǐng)域。

一切都未必如期而至，但一切都在進(jìn)程中。

相關(guān)文章：

微軟李笛：為什么說畫家小冰是最艱難的一次養(yǎng)成？

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。