0
本文作者: 李詩 | 2017-07-07 12:52 |
雷鋒網(wǎng)按:2017年7月5日,專注于智能視覺交互技術提供商未動科技(Untouch)正式發(fā)布4款3D視覺交互產(chǎn)品:3D手勢識別產(chǎn)品——黎曼平臺,3D人臉識別產(chǎn)品——歐拉平臺,SLAM產(chǎn)品——笛卡爾平臺,及場景重建產(chǎn)品——高斯平臺。
在發(fā)布會開始,Untouch CEO孫錚調侃道,“今天是7月5號,都快被命名為是中國或者世界AI日了,今天一天好幾個發(fā)布會了,上午是百度(2017百度AI開發(fā)者大會),下午是阿里(智能音響天貓精靈X1的發(fā)布會),晚上又是我們。”作為低頭研發(fā)剛剛露面的科技公司,趕在同一天與大佬們一起發(fā)布產(chǎn)品,可以說是趕上了AI浪潮,他們卻也擔心自己的產(chǎn)品能不能分得聚焦于大佬產(chǎn)品的目光。
今天的發(fā)布會是Untouch在媒體上的首次亮相,而其實公司成立已經(jīng)有3年。未動科技有限公司成立于2014年,2015年完成數(shù)百萬人民幣天使輪融資,由英諾資本及大河資本領投,2016年底完成數(shù)百萬美元Pre-A輪融資,漢能創(chuàng)投獨家投資。在這3年時間里他們一直致力于技術的研發(fā),少有在媒體露面。未動科技專注于計算機3D視覺智能交互軟硬件方案,基于自主研發(fā)的智能3D視覺交互算法,例如3D手勢識別、3D人臉識別、運動追蹤(SLAM)、場景重構等,賦予新型消費級智能設備與人、與場景的視覺交互能力。
黎曼平臺基于深度圖,實現(xiàn)3D手勢交互功能,可以為智能手機、機器人/無人機、AR/VR等提供手部26自由度追蹤與識別。據(jù)介紹,傳統(tǒng)的手勢識別對每一幀的手勢圖像進行獨立分析,而Untouch采用曾成功應用于機器翻譯的深度學習算法LSTM(Long Short-Term Memory),把手勢動作當做一個時間序列來處理,提高了識別精度與運算效率。
另外,黎曼平臺考慮到移動端的功耗與運算性能等限制性因素,經(jīng)過深度算法裁剪與大量工程優(yōu)化,使得3D手勢識別可以流暢精準地運行在手機等移動設備上。傳統(tǒng)手勢識別產(chǎn)品基于PC,黎曼平臺是一款基于深度攝像頭并可運行在手機等移動設備上的手勢識別產(chǎn)品。
小型化、嵌入式的3D手勢識別產(chǎn)品使手勢交互植入移動設備,這是目前顯而易見的一個大的趨勢。雷鋒網(wǎng)了解到,蘋果正在測試iPhone8的手勢識別功能和3D人臉識別功能,這將引爆移動端的交互方式。
未動科技的3D視覺智能交互軟硬件方案不僅使得手勢交互從PC端轉移到了移動端,帶來移動設備交互的更多可能,視覺智能還有更多可以發(fā)展和應用的方面。發(fā)布會還推出了另外三個3D視覺平臺,能實現(xiàn)3D人臉識別的歐拉平臺,其基于深度圖,實現(xiàn)人臉的實時建模與3D特征識別,實現(xiàn)人臉3D表情的實時追蹤、識別與分析。除了身份識別驗證與表情分析,笛卡爾平臺還可以讓用戶建立自己的頭像,體驗更有趣、好玩的社交體驗。運動跟蹤(SLAM)的笛卡爾平臺實現(xiàn)空間計算與位置追蹤功能,可以為智能手機、機器人/無人機、AR/VR等提供6 DoF inside-out位置追蹤、路徑規(guī)劃軟硬件解決方案,厘米級別精度、低延遲、低功耗,為智能設備創(chuàng)造更多應用場景。場景重構的高斯平臺基于深度攝像頭與RGB攝像頭,實現(xiàn)實時的空間計算,重建與渲染出真實的物理場景結構,從而實現(xiàn)障礙物躲避、AR追蹤、三維重建等功能,為計算設備的判斷與決策提供三維場景信息。
這些都是依靠視覺AI來實現(xiàn)的。亞馬遜的Echo和阿里的天貓精靈X1智能音響做的都是語音AI,而未動科技的出發(fā)點是視覺交互。孫錚介紹道,“我們做這些3D視覺軟硬件產(chǎn)品都是想為設備提供視覺感知,現(xiàn)在的智能產(chǎn)品越來越像人,人的特點就是感知。AI一定要有感知,要跟Sensor結合。AI要么是基于聽覺的,要么是基于視覺的,是因為人有這些感知。這是為什么我們這次和PMD合作,他是一個Sensor的芯片廠商。只有抓住了sensor,才能去生產(chǎn)大腦?!?/p>
聯(lián)合專注3D傳感器廠商PMD
PMD是一家無晶圓廠IC公司,公司位于德國西格根與美國圣何塞,是全球領先的基于CMOS的3D飛行時間數(shù)字圖像技術供應商。創(chuàng)立與2002年,公司擁有涉及ToF的應用程序、測量原理與實現(xiàn)方法的全球150個專利,PMD的3D傳感器的應用主要包括工業(yè)自動化、自動駕駛、以及廣闊的消費電子領域例如AR/VR。全球第一款Tango手機聯(lián)想Phab2上的深度傳感模塊就是PMD所提供。華碩最近推出的Tango&Daydream手機ZenFone的深度傳感技術也來自于PMD。
專注ToF深度傳感器廠商PMD宣布,選擇Untouch的黎曼平臺作為中間件為客戶提供非接觸式的交互方案,雙方深度合作,推出了完整的手勢識別軟硬件一體方案。PMD總裁 Bernd Buxbaum表示:“我們非常激動能夠與Untouch緊密合作,有了Untouch提供的先進3D手勢識別技術,我們可以為移動終端設備提供直觀的、非接觸式的交互體驗。我們堅信,通過兩個公司的緊密合作,能夠加速手勢交互的大規(guī)模普及?!?/p>
新的交互方式帶來新的交互體驗。在《數(shù)字化生存》一書中,尼葛洛龐帝指了我們的數(shù)字化生活的發(fā)展趨勢,并不是更豐富的數(shù)據(jù),更清晰的圖像,而是更自然的人機交互。例如,他認為,電視所要追求的并不是更高的清晰度,數(shù)字化電視引起的電視生產(chǎn)和消費的模式的變化才是更值得追求的。在“虛擬現(xiàn)實”這一章,他認為圖像的更新速度比圖像的分辨率更為重要,我們對于圖像的感知不僅僅是視覺的,還與其他感官緊密相連,我們的運動神經(jīng)會影響圖像的感知。目前,“計算機對人的存在的感覺真是遲鈍……很可能在不久的將來,計算機就能看到你“。他認為,未來的個性化界面能識別人的聲音,表情,手勢,還能追蹤人的眼球。對于各類消費電子來說,智能視覺交互技術會帶來更加自然友好的體驗。
數(shù)學家團隊
雷鋒網(wǎng)注意到,Untouch的核心團隊里不少數(shù)學家。他們發(fā)布的幾個3D視覺平臺的名字:歐拉、笛卡爾、高斯這些都是著名數(shù)學家的名字。CEO孫錚有跨國高科技企業(yè)17年工作經(jīng)驗,歷任微軟中國移動事業(yè)部總經(jīng)理,中興芬蘭分公司總經(jīng)理,中興西歐區(qū)副總經(jīng)理,愛立信瑞典高級系統(tǒng)工程師,瑞典計算機研究所研究員,曾帶領中興西歐銷售團隊在4年間實現(xiàn)從0到10億歐元銷售額的突破。他也是全國數(shù)學奧林匹克競賽獲獎者,發(fā)現(xiàn)的數(shù)學定理被國際數(shù)學權威著作命名為“孫氏定理”。團隊其他成員由世界頂尖的計算機視覺、深度學習、嵌入式系統(tǒng)領域的專家組成,來自于微軟、中科院、清華、北大等公司或研究機構。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。