0
2017年高考今天就結(jié)束了,跟往年一樣的是作文題目出來以后引發(fā)網(wǎng)友吐槽和創(chuàng)作、交警組織送考車隊、以及幫迷路和丟失準(zhǔn)考證的考生及時赴考。不一樣的也有,那就是來自清華大學(xué)蘇州研究院的高考機(jī)器人AI-MATHS和來自教育機(jī)構(gòu)“學(xué)霸君”的智慧教育機(jī)器人Aidam,它們都通過數(shù)學(xué)試卷和人類一絕高下。
考試結(jié)果是,AI-MATHS在2017文科數(shù)學(xué)北京卷獲得105分,在2017文科數(shù)學(xué)全國卷II獲得100分;Aidam在2017文科數(shù)學(xué)全國卷獲得134分,不過它需要人工為機(jī)器人輸入題目,審題難度大大降低了。
下面雷鋒網(wǎng) AI 科技評論就來聊一聊他們兩位都是什么情況。
2015年,科技部公布了國家高新技術(shù)研究發(fā)展計劃(863計劃)信息技術(shù)領(lǐng)域2015年第一批項目,科大訊飛股份有限公司牽頭的“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項目獲得立項支持,安排863計劃專項經(jīng)費概算超5000萬元,“高考機(jī)器人”就是項目中的重要研究目標(biāo)之一。科大訊飛作為牽頭單位,聯(lián)合清華大學(xué)、中科院自動化所、北京大學(xué)、北京理工大學(xué)、中科院軟件所、南京大學(xué)、電子科技大學(xué)、哈爾濱工業(yè)大學(xué)等超過30家科研院校和企業(yè)共同負(fù)責(zé)項目的研發(fā)與實施,科大訊飛執(zhí)行總裁胡郁任項目的首席科學(xué)家。整個項目分成了許多不同的子項目,比如有專門做語文的、做數(shù)學(xué)的,科大訊飛除了牽頭之外還要提供一些底層的平臺技術(shù)給大家分享,還要設(shè)計測試方法和測試平臺對每個子項目成果進(jìn)行評估。
據(jù)雷鋒網(wǎng) AI 科技評論了解,今年應(yīng)試數(shù)學(xué)的成都AI-MATHS團(tuán)隊就是國家863類人答題項目組成員,主要負(fù)責(zé)攻關(guān)數(shù)學(xué)學(xué)科。 “AI-MATHS”之父林輝是清華大學(xué)蘇研院大數(shù)據(jù)處理中心主任,同時也是該中心智慧教育事業(yè)部從2013年開始技術(shù)孵化的成都準(zhǔn)星云學(xué)科技有限公司CEO。除了這次應(yīng)試數(shù)學(xué)的AI-MATHS機(jī)器人,準(zhǔn)星云學(xué)還研發(fā)了準(zhǔn)星智能評測機(jī)器人(即準(zhǔn)星智能評測系統(tǒng)),能對學(xué)生答案正誤、錯誤知識點、錯誤原因進(jìn)行智能判定。準(zhǔn)星云學(xué)還亮相2016年“十二五”科技創(chuàng)新成就展并獲得榮譽證書。
AI-MATHS誕生于2014年,于去年5月宣布參加高考,今年2月以較高分通過中期評測。林輝介紹,AI-MATHS是通過綜合邏輯推理平臺來解題,而非學(xué)習(xí)儲存題庫。“它可以學(xué)習(xí)小學(xué)到高中的7000多個考點,運算量可達(dá)2的800次方?!?/p>
“AI這次是系統(tǒng)階段性成功公開測試,由于此次活動無法與高考同時同臺進(jìn)行,所以命名為模擬高考,但最關(guān)鍵的是整個過程是嚴(yán)格按照斷網(wǎng)、斷庫、自然語言理解、綜合復(fù)雜推理等嚴(yán)格流程進(jìn)行的公開透明測試?!绷州x介紹,近1年多來,AI在復(fù)雜邏輯推理、直覺觀察推理、計算機(jī)算法、深度學(xué)習(xí)上都進(jìn)行了深入攻關(guān),“AI是通過綜合邏輯推理平臺來解題,而非學(xué)習(xí)儲存題庫,因此在完全掐斷題庫、斷網(wǎng)、無人干涉、僅有12臺服務(wù)器、1.2萬道題的小樣本訓(xùn)練量的諸多限制下,在今年2月時取得了93分的成績?!?/p>
昨日傍晚6點,離2017年全國高考數(shù)學(xué)科目的考試結(jié)束只有1個小時,AI在位于成都高新區(qū)天府新谷一個關(guān)閉外部網(wǎng)絡(luò)的房間內(nèi),通過內(nèi)部服務(wù)器的計算,在2小時內(nèi)作答兩份高考數(shù)學(xué)試題,之后由教師批改答卷。
經(jīng)過共2小時的解題、等待、評分后,AI-MATHS此次模擬高考成績?yōu)椋?017年高考文科數(shù)學(xué)北京卷獲得105分,用時22分鐘;2017年高考文科數(shù)學(xué)全國卷II獲得100分,用時10分鐘。2份考卷對比2月中期評測的基礎(chǔ)上均有大幅提升。相比試前林輝110的目標(biāo),差距已經(jīng)很小了;而這個答題速度則是人類根本無法比擬的。
值得一提的是,這款機(jī)器人目前仍有一些漏洞需要不斷改進(jìn),比如,AI-MATHS欠缺對常識的理解能力,這導(dǎo)致AI-MATHS不能理解一些題目,在解答題中有0分答案的出現(xiàn)。這次挑戰(zhàn)的結(jié)果將運用到該公司對AI-MATHS的技術(shù)驗證和準(zhǔn)星產(chǎn)品迭代中。“此后AI-MATHS將接受大樣本訓(xùn)練、測驗彈性擴(kuò)展能力,乃至于遷移到其他領(lǐng)域的學(xué)習(xí)能力。”林輝說。
昨晚在北京,教育機(jī)構(gòu)“學(xué)霸君”請到6名去年的理科狀元來和他們的智能教育機(jī)器人Aidam進(jìn)行同臺對決,共同解答今年高考文科數(shù)學(xué)試題。
六名高考狀元在高考數(shù)學(xué)結(jié)束拿到試題后,立即開始答題,答題時間是五十五分鐘。人機(jī)雙方分別完成了包括客觀題和主觀題在內(nèi)的整張試卷,并按照評分標(biāo)準(zhǔn)得出最終成績。經(jīng)過數(shù)學(xué)特級老師、奧賽教練韓兆勇的評審,Aidam的分?jǐn)?shù)最終公布:134 分。三組高考狀元陪他一起進(jìn)行測試,狀元一組得分119分。狀元二組得分140分。狀元三組得分146分。
三組高考狀元平均分135分,Aidam與平均分只差一分,但是離最好成績還有一段距離。另外據(jù)雷鋒網(wǎng) AI 科技評論了解,現(xiàn)場是人工為機(jī)器人Aidam輸入題目的,這將會導(dǎo)致難度大大降低,因為直接跳過了審題、提取信息這一解題過程中非常重要、也很有難度的一步。所以Aidam的通用性比AI-MATHS要差一些,離我們理想中嚴(yán)格斷網(wǎng)、斷庫、自然語言理解的答題機(jī)器人也要更遠(yuǎn)一點。
不過學(xué)霸君的思路強(qiáng)調(diào)大題庫(已經(jīng)有超過7000萬的巨大題庫),通過海量的題庫,用戶行為數(shù)據(jù),以及 Ai 自我博弈,從海量題目中找到適合共通的知識組件和解題模式。
相比高考狀元們花了將近一個小時才完成考試,Aidam僅僅在10分鐘內(nèi)就完成了所有的答題。學(xué)霸君創(chuàng)始人張凱磊坦言自己很緊張,“就像送自己的女兒參加高考”。他表示,為了展示,Aidam昨天答題放慢六倍速度,平時每道題完成時間應(yīng)該在七至十五秒。
Aidam解題全程展示
Aidam放慢的原因是不僅需要把題目做對,還需要給大家展示他是如何做到的。根據(jù)要求,Aidam會通過禮堂前部的大屏幕來展示:左邊是一個由無數(shù)藍(lán)色光點組成的大腦,每算一道題,藍(lán)色大腦里就會跳出若干以紅色、黃色、藍(lán)色節(jié)點構(gòu)建的知識鏈。每個節(jié)點旁邊有一行白色的字,標(biāo)注著這道題涉及了哪些知識。
參加了昨晚對決的2016年河北省理科狀元孟祥熙現(xiàn)就讀于北京大學(xué)光華管理學(xué)院,他受訪時表示,“人機(jī)大戰(zhàn)贏了很開心,但是機(jī)器人技術(shù)很先進(jìn),想知道自己解題錯在哪里”。
“想知道自己解題錯在哪里”正是學(xué)霸君想要幫學(xué)生達(dá)到的重要目標(biāo)之一。
學(xué)霸君是一家以技術(shù)為驅(qū)動的創(chuàng)業(yè)公司,自成立之初就一直致力于人工智能服務(wù)教育領(lǐng)域的探索,目標(biāo)是通過機(jī)器理解為老師和學(xué)生在薄弱知識點的學(xué)習(xí)提供豐富的支持。學(xué)霸君潛心研究的智能教育機(jī)器人就是機(jī)器理解技術(shù)的一種典型應(yīng)用,也是人工智能領(lǐng)域的重要挑戰(zhàn)。學(xué)霸君推出的同名手機(jī)app就在為學(xué)生和老師提供著解題、答疑相關(guān)服務(wù)。
作為863“高考機(jī)器人”項目的“領(lǐng)頭羊”,科大訊飛認(rèn)為,研發(fā)“高考機(jī)器人”的主要目標(biāo)并不是PK掉人類考生,而是為了更好地服務(wù)人類,利用相關(guān)技術(shù)成果可以在教育全過程中起到非常大的幫助,技術(shù)和算法的突破后,同樣的成果可以用在醫(yī)療、用在客服、用在越來越多的領(lǐng)域。
“像在客服系統(tǒng)、還有一些車載的人機(jī)交互系統(tǒng)里,都需要我們預(yù)先對一些行業(yè)知識的理解,同時基于這個理解的結(jié)果能夠做一些決策判斷、一些相關(guān)問題的回復(fù)。”科大訊飛輪值總裁吳曉如介紹說,“現(xiàn)在,我們已有一些中間技術(shù)應(yīng)用到一些行業(yè)里面了,比如說教育領(lǐng)域中作文的自動閱卷;還有機(jī)器翻譯這塊,我們已經(jīng)推出了相關(guān)的口語對口語的翻譯系統(tǒng)。所以,雖然現(xiàn)在我們還沒有向社會公布我們這個系統(tǒng)在高考中的最后得分,我們在不同的行業(yè)里面已經(jīng)形成了一些應(yīng)用?!?/p>
根據(jù)吳曉如介紹,在研究中除了答題,訊飛的高考機(jī)器人還有閱卷的功能。應(yīng)用在大學(xué)的普通話等級測試時,他們請了一組最權(quán)威的專家留下了很多測試樣本,以這些測試樣本作為機(jī)器學(xué)習(xí)的對象,然后建立模型來測試。最后的結(jié)果是,一組21個人的平均分,機(jī)器和專家的絲毫不差;分?jǐn)?shù)排序的相關(guān)性也很高。以后作文閱卷也可能交給機(jī)器。
在科大訊飛研究院院長胡國平看來,高考機(jī)器人戰(zhàn)略也將是中國人工智能實現(xiàn)“彎道超車”的一個助推器,同時,巨大的應(yīng)用市場、高水平的人力資源將確保中國在人工智能發(fā)揮實效上前途無限?!拔覀兊母呖紮C(jī)器人從開始的時候就已經(jīng)很清楚,我們的目標(biāo)就是高考,而且是中國的高考。實際上,和東京大學(xué)自主命題的考試一樣,難度是非常大的。我們一開始就是奔著這個真正有難度的任務(wù)去努力的,所以換個角度來說,中國在整個人工智能領(lǐng)域特別在內(nèi)容智能領(lǐng)域持續(xù)領(lǐng)先的可能性會更大?!焙鷩綄φ麄€高考機(jī)器人項目表示了信心。
AI科技評論招業(yè)界記者啦!
在這里,你可以密切關(guān)注海外會議的大牛演講;可以采訪國內(nèi)巨頭實驗室的技術(shù)專家;對人工智能的動態(tài)了如指掌;更能深入剖析AI前沿的技術(shù)與未來!
如果你:
*對人工智能有一定的興趣或了解
* 求知欲強(qiáng),具備強(qiáng)大的學(xué)習(xí)能力
* 有AI業(yè)界報道或者媒體經(jīng)驗優(yōu)先
簡歷投遞:
lizongren@leiphone.com
相關(guān)文章:
機(jī)器人參加2017年數(shù)學(xué)高考得105分,最快答題時間不用1s
科大訊飛胡郁:我們要做一個機(jī)器人參加高考 | 新浪C+
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。