華捷艾米：關(guān)于3D體感技術(shù)核心環(huán)節(jié)的③大揭秘

本文作者：朱恒偉

2015-08-18 09:09

導語：3D體感核心技術(shù)包括3D拍攝、人物提取和骨架識別。我們來淺析一下3D體感技術(shù)每個核心環(huán)節(jié)的技術(shù)特點。

3D體感的技術(shù)是光學精密儀器與制造、模式識別、圖形圖像、機器學習和神經(jīng)網(wǎng)絡(luò)技術(shù)集大成者，跨越多個領(lǐng)域的高精尖技術(shù)。所以，在2010年微軟Kinect推出以來，鮮有第二家公司和研究機構(gòu)完全突破體感交互的所有技術(shù)環(huán)節(jié)。3D體感核心技術(shù)包括3D拍攝、人物提取和骨架識別。我們來淺析一下3D體感技術(shù)每個核心環(huán)節(jié)的技術(shù)特點。

一、骨架識別技術(shù)

骨架識別的技術(shù)解決方案主要由數(shù)模邏輯推理和機器學習兩種方案。數(shù)模邏輯推理是通過有人體的某個關(guān)鍵可識別的關(guān)節(jié)點，通過人體特征推理出人體每個關(guān)節(jié)點的位置，這種方法簡單易實現(xiàn)，但是人體是柔性、易變形，隨機動態(tài)變化的，沒有一種邏輯推理方案能夠把人體的運動給模擬出來，導致識別準確率不高沒有實用價值。這就是OMEK（被Intel收購）和Softkinetic（Intel合作伙伴）幾年也不能推出商用化產(chǎn)品的原因。機器學習的方法是通過大集群計算機“學習”幾千甚至萬億的人體行為樣本，來得到基本人體行為模型，就像小孩子成長的過程。但是機器學習和神經(jīng)網(wǎng)絡(luò)是近幾年來逐步興起的技術(shù)，還不是太成熟，選擇什么樣的“學習”方法和什么樣的特征樣本是至關(guān)重要的，是需要不斷試驗的。但是大集群計算機計算本身成本就異常的高，動則千萬人民幣，沒有扎實的研究基礎(chǔ)，一般廠商不敢輕易嘗試。

二、人物提取技術(shù)

對于人物提取來說，就是要把復雜的動態(tài)的環(huán)境去除，把真實的“人”提取出來。這個在工程上也是有較高的難度，比如人與桌子接觸，人與人握手和人體被局部遮擋。抽象理解就是人體分割和人物跟蹤在現(xiàn)有的基礎(chǔ)條件下，不會有完全精確的解決辦法，只是相對的解決。

人體的動作是三維的，當然對人體動作的測量也必須是三維的。3D拍攝或測量技術(shù)實際上是相對比較成熟的技術(shù)，具有多種解決方案，比如單彩色攝像頭，雙彩色攝像頭，光干涉，超聲波、結(jié)構(gòu)光散斑和TOF（測量光的飛行時間）等等。除了TOF，其他的測量方式可以說都是基于三角測距的原理，不同在于對特征點的提取的不同。

對于人體動作來說最主要的難題就是三維測量的實時性和3D測量數(shù)據(jù)對骨架識別的適用性，人眼的反應(yīng)時間一般小于120毫秒，也就是說3D測量到骨架識別最大允許時間必須小于100毫秒，才能夠與應(yīng)用對接，這就要求三維測量的計算量不能太大，要不然成本太高就不適合消費級產(chǎn)品使用。

三、3D拍攝技術(shù)

彩色攝像頭是以顏色和紋理為基礎(chǔ)的，光線細微的變化都會帶來圖像處理上較大的差別，對于紋理的細微分別決定了彩色攝像頭只能局限在近距離（0.8米以內(nèi)），這就是我們可以看到三維拍攝的圖像都是黑白的灰度圖的原因。彩色圖像顏色提取的方式，抗光線和同色系干擾的能力極差，原理上決定很難把不同的物體區(qū)隔出來，得到的三維圖像體感也是無法使用的。這就是為什么leapmotion必須是室內(nèi)向上拍攝，通過LED把手掌點亮的原因。

光干涉的原理精度高，但是計算原理就決定了該方法計算量超大，為了減小計算，就要想辦法省略掉物體的整體構(gòu)建，只計算物體的邊緣輪廓。但是物體的邊緣輪廓的三維信息根本就做不出骨架識別的訓練算法。Intel的realsense，還有Pepplesinterface面臨的困境，可以三維測量，卻不可以體感。

Primisense的結(jié)構(gòu)光散斑測量方法，就是在測量精度和計算量上面向體感技術(shù)做出平衡的最優(yōu)方案之一。Primesense的精度為厘米級，判斷人體動作已經(jīng)足夠了。

TOF的方案分辨率很難再提高了，而且測量光飛行時間的晶振芯片和攝像頭模組技術(shù)難度太高，從圖像質(zhì)量和成本的角度，TOF在很長一段時間仍然落后于結(jié)構(gòu)光方案。超聲波的精度太低，遠距離實用性不強。

3D體感拒絕山寨，與全社會一起做中國創(chuàng)造

國內(nèi)現(xiàn)在體感宣傳滿天飛，手柄是一類，只能夠識別人體幾個點而已，用戶體驗與微軟Kinect相差太大，也不可能有很大的市場機會。其他的所謂體感技術(shù)都沒有人物提取和骨架識別技術(shù)，妄圖采用蘋果釋放出來的OPENNITE骨架方案，這樣做是要不從技術(shù)原理上根本就無法對接，即使能夠?qū)拥?，也是赤裸裸侵犯蘋果的知識產(chǎn)權(quán)，蘋果產(chǎn)品推廣在即，想蘋果沒有劇烈的反應(yīng)都難。這樣的后果就是中國永遠只能做低端的山寨，也無法根據(jù)客戶定制性需求提供技術(shù)服務(wù)，無法達到3D體感技術(shù)全社會推廣的目的。

華捷艾米：關(guān)于3D體感技術(shù)核心環(huán)節(jié)的③大揭秘

華捷艾米（微信號：IMI_NANJING)研發(fā)團隊經(jīng)過5年的潛心研發(fā)，突破了3D體感技術(shù)所有的技術(shù)環(huán)節(jié)，開發(fā)出具有完全自主知識產(chǎn)權(quán)、多平臺（windows、Andriod、Linux）、低成本、高準確度、嵌入式的體感交互產(chǎn)品，包括 IMI-3D傳感芯片、IMI-3D體感傳感器、骨架識別軟件、SDK中間件等產(chǎn)品和全套軟硬件技術(shù)解決方案。與該公司的交流過程中，深深的感覺到了公司管理層的危機感和使命感。

華捷艾米軟件科技公司總經(jīng)理楊高峰表示：3D體感技術(shù)的應(yīng)用最大的瓶頸是應(yīng)用的開發(fā)，華捷艾米旨在和投資商一起打造共同打造“人眼“智能生態(tài)鏈，深度挖掘體感技術(shù)應(yīng)用空間。沒有一家公司有這樣的實力把生態(tài)鏈都做了，3D體感技術(shù)的根本前途在于全社會的參與。

技術(shù)與微軟無差，產(chǎn)品即將跟進

華捷艾米技術(shù)總監(jiān)李朔表示：與國內(nèi)廠家相比，我們是全球第三家具有完整自有知識產(chǎn)權(quán)3D體感技術(shù)方案的公司，我們在3D傳感器上充分的考慮了用戶的使用特點，在算法層面就考慮的設(shè)備摔打變形等客觀因素照成的影響，最大化的考慮了環(huán)境噪聲的影響。與微軟相比我們的技術(shù)層次是沒有差距的，但是在對用戶消費行為的特點理解和工程化工具的開發(fā)和表現(xiàn)形式還有一定的差距，我們正在努力降低這種差距。

路漫漫兮修遠兮，祝福華捷艾米，祝福中國的技術(shù)宅。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章