0
我們搭乘在數(shù)字化高速前行的列車上,大數(shù)據(jù)精準推薦、AI解決一大部分繁復工作、智能家電提供便捷居家服務......人工智能發(fā)展給我們的生活帶來更多改變。
但在社會的角落,有這樣一群人,或因身體機能老去、或因生理條件不允許,這些障礙人士成為數(shù)字世界中的弱勢群體。
駐足在自助辦理機前進退兩難的老人;因為環(huán)境嘈雜,在火車站入閘口聽不清安檢指令的聽障人士;看不清公交提示錯過站點的視障者......他們似乎被快速變化的數(shù)字時代遺忘了。
如何越過障礙,將科技力量平等惠及每個角落?
近日,《無障礙環(huán)境建設法》頒布,這是我國首次就無障礙環(huán)境建設制定專門法律。立法次日,騰訊與中國殘聯(lián)公益組織簽署戰(zhàn)略合作協(xié)議。未來五年,雙方將在無障礙環(huán)境建設多個領域展開探索。
在這場翻越障礙的探索中,騰訊找到了新方向——下一代互聯(lián)網(wǎng)技術。這是包括人工智能、大數(shù)據(jù)、游戲科技等在內(nèi)的前沿科技。騰訊正積極將下一代互聯(lián)網(wǎng)技術,應用于無障礙領域。
前沿技術如何與無障礙結合?突破口在哪里?實現(xiàn)了哪些創(chuàng)新應用?在公司內(nèi)部數(shù)個業(yè)務團隊,多領域?qū)嵺`中,騰訊無障礙的技術路徑成形了。
“假摔”筑起防護墻
北京海淀銀科大廈一間不足20平米的辦公室,聚集了七八個年輕的算法工程師。室內(nèi)地面只鋪了兩層薄薄的褥墊,幾個人排著隊,輪流上前,以各種不同的姿勢摔倒。這一次次正面摔、側身摔的“摔倒”數(shù)據(jù),都被王楠認真記錄下來。
王楠是騰訊SSV (可持續(xù)社會價值事業(yè)部)銀發(fā)科技實驗室運營負責人。2017年,在深圳市政府及民政局邀請下,騰訊與之合作開始搭建智能養(yǎng)老研發(fā)團隊。王楠帶著成員調(diào)訪了數(shù)十家養(yǎng)老院。
團隊了解到,養(yǎng)老領域普遍存在的痛點主要有兩方面:一是人力稀缺,人員素質(zhì)良莠不齊,穩(wěn)定性不高;二是事故責任認定不清。其中,老人摔倒事故在責任認定不清方面占據(jù)極大比重。
目前,國內(nèi)大部分養(yǎng)老院床位約一千個,在人力稀缺的情況下,單個護理員難以同時兼顧數(shù)十個老人的看顧,一旦老人發(fā)生跌倒或意外,會導致無人救助或救助延遲,從而直接錯過最佳救助時間。同時,老人摔倒是由于自身的身體問題、亦或是院方的責任,也亟需科技的手段來幫助完成場景追溯。
沒有過多猶豫,王楠便敲定將摔倒作為技術團隊探索的首個場景。
但進入研發(fā)階段,問題也隨之出現(xiàn)了。王楠發(fā)現(xiàn),在老齡化領域的科技應用上,全球當前仍處于初級階段,如養(yǎng)老機構、社區(qū)、居家等場景都是一個需要不斷學習和調(diào)整適應的階段。這直接導致了數(shù)據(jù)缺乏問題。不管什么場景,王楠團隊的數(shù)據(jù)獲取量幾乎為零,無法實現(xiàn)人體姿態(tài)檢測,難以支撐起一個簡單的AI算法研發(fā)。
這個發(fā)現(xiàn)給王楠團隊“倒”下了一盆冷水。怎樣才能在短時間內(nèi)獲取真實可靠的樣本數(shù)據(jù)?她想到了用“假摔”積累樣本的方法。
這個想法聽起來有些“異想天開”。畢竟只有七八人的團隊,就想摔出成百甚至上千數(shù)據(jù),這是個不小的挑戰(zhàn)。但團隊成員并沒有質(zhì)疑或怨言,反而每個人都積極加入“騰訊試摔官”隊伍。
“試摔官”們在不同場景測試摔倒
為了積累許多不同的數(shù)據(jù),他們嘗試著用各種角度、姿勢、速度和時長進行摔倒測試,因此也就有了開頭的那一幕。幾乎每隔一段時間,就能看到銀發(fā)科技實驗室的工程師們擠在一個小小的房間里,排著隊輪番朝地上摔倒,解鎖各式各樣的姿勢。
也正是有了這成百上千次的“假摔”后,王楠和團隊把“隱形護理員”摔了出來。
“隱形護理員”融合了騰訊的AI技術,通過攝像頭和AI姿態(tài)識別的算法能力,可實現(xiàn)無感知、全方位、及時準確地發(fā)現(xiàn)老人可能出現(xiàn)的摔倒意外事件,在照護老人身體健康的同時,也降低了護理員等照護者的壓力和工作強度。
之所以選擇用攝像頭作為硬件載體,一方面是因為其性能更穩(wěn)定,另一方面也考慮到產(chǎn)品的適配性和普惠性。王楠表示,“我們希望通過騰訊技術的公益賦能,讓智能產(chǎn)品性能更優(yōu)、普惠性更強,讓更多的老年人受益于科技助老的產(chǎn)品和服務。”
在技術推向產(chǎn)品落地的過程中,往往要面臨更大規(guī)模、不同場景、多交互等情況,為此,銀發(fā)科技實驗室研發(fā)團隊以個人家庭和養(yǎng)老院這兩大代表性場景,在“隱形護理員”中設計了兩個不同的解決方案:
其中養(yǎng)老院版本,提供隱形護欄、跌倒監(jiān)測、火災報警、軌跡還原等服務,主要扮演輔助看護角色,幫助提高機構場景下養(yǎng)老服務的看護效率和專業(yè)度,例如在隱形護欄功能中,當老人夜間離床、離房,或是有非機構人員闖入時,系統(tǒng)會在第一時間告警并通知看護人員,保障老人安全。
而居家版本,包括攝像頭跌倒檢測、呼救詞檢測、雙向語音通話以及攝像頭實時監(jiān)測功能,以預防老人在獨居或者子女不在家的情況下,一旦發(fā)生摔倒或其他意外事件,無人救助或救助延遲而錯過最佳救助時間的情況。
王楠告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),“隱形護理員”雙向語音通話功能,其使用遠超出原本的產(chǎn)品設想。他們在調(diào)研中發(fā)現(xiàn),無論是養(yǎng)老院還是居家養(yǎng)老,許多老人都很喜歡用攝像頭與家人或護工聊天,一個監(jiān)測工具在日積月累中轉(zhuǎn)變成了老人聯(lián)結外界的的情感紐帶。
AI之外,技術不是冷冰冰的名詞,科技的力量正成為解決養(yǎng)老問題的重要手段,在保障老年人生存安全、改善老年人生活質(zhì)量的同時,已逐漸成為了溫暖老年群體精神世界的慰藉。
讓“聽清”提升四成
對老年人來說,聽力下降伴隨著老去緩慢發(fā)生。除此之外,中國還有近3000萬聽障人士,他們長期生活在暗淡的“無聲”世界里。
1969年,世界上首款可穿戴式的人工耳蝸問世,作為治療重度和極重度聽力障礙最有效的方法,人工耳蝸技術經(jīng)過多年發(fā)展,如今被國內(nèi)的聽障群體廣泛認知和接納,幫助許多聽障人士實現(xiàn)從“無聲”到“聽見”的跨越。
但是,在商場、火車站、機場等較為嘈雜的公共環(huán)境中,他們有時仍面臨著“聽不清楚”的問題。如何實現(xiàn)從“聽見”到“聽清”的進階,騰訊會議天籟實驗室關注到這一問題。
搭載騰訊天籟AI音頻技術的天籟inside助聽器
作為騰訊會議旗下專注音頻通信技術研究的團隊,天籟實驗室也希望探索用技術服務反饋社會的可能。騰訊天籟實驗室主任商世東曾帶著團隊四處尋訪,在同許多聽障人群的交流中,他深刻地感受到聽障人士對解決“聽清”困擾的緊迫性。
騰訊天籟實驗室有技術,也有優(yōu)秀的工程師人才,但對于哪些技術適用,需要提供怎樣的方案或產(chǎn)品等等,這是他們不擅長的。天籟實驗室需要找到更了解聽障者的團隊,來幫助他們回答這些問題。
在聯(lián)系多家人工耳蝸廠商無果之下,偶然一次活動中,商世東團隊經(jīng)人介紹,認識了諾爾康神經(jīng)刺激科學重點企業(yè)研究院副院長黃穗。黃穗從事人工耳蝸產(chǎn)品研究多年,對存在的問題和痛點有深刻見解。
彼時,黃穗正為如何解決人工耳蝸在不同場景下識別成功率低的問題四處奔走,騰訊天籟實驗室的到來,無異于雪中送炭。
雙方在合作目標上出奇一致,第一次見面,就敲定了兩個合作方向:首先,提高場景識別技術在應用場景中的成功率;其次,共同開發(fā)一款App,借助手機更強大、便捷的處理能力,對所采集的語音信號進行預處理,通過藍牙傳輸至人工耳蝸,以進一步改善聽覺效果。
但現(xiàn)實的問題很快就出現(xiàn)了。
對于視頻會議產(chǎn)品,決定用戶體驗的關鍵因素之一是聲音凈化。為此,騰訊會議天籟實驗室在采集了上千小時的語音噪聲數(shù)據(jù)后,利用天籟AI算法和深度學習能力,成功消除300余種噪音,為用戶提供了清晰流暢的語音體驗。
可團隊發(fā)現(xiàn),天籟音頻AI技術在解決會議場景下的問題效果很好,但將算法遷移到人工耳蝸中,由于使用習慣、聽覺限制等因素影響,算法的復用效果并不好,聽障用戶使用感受不佳。
例如,處理環(huán)境聲降噪時,為了達到最純凈的聲音體驗,研發(fā)團隊將噪音降至最低,經(jīng)聽障者體驗后反饋,過度降噪導致了聲音失真,反而聽起來很不舒服。
為此,天籟實驗室的成員們必須將算法重新打磨,調(diào)整一個新版本給到黃穗放入研發(fā)軟件內(nèi),再給到用戶測試和收集反饋。重復的流程經(jīng)歷后,才最終提出一個適用于聽障場景的方案。
經(jīng)過一年多的努力,騰訊會議天籟實驗室與黃穗團隊,共同解決了國內(nèi)首個突破人工耳蝸動態(tài)實時噪音處理的難題,幫助佩戴人工耳蝸的聽障人士在語音清晰度、信息可懂度上提高了40%。
在解決聽障人群難題上,AI的能量遠不止于此。
目前,急救知識尚未大規(guī)模普及,在急救能力缺失、急救器械配備不足等情況下,難以有效滿足全部的急救需求。當突發(fā)性疾病發(fā)生在聽障人士身上時,由于無法獨立撥打120,必須求助他人,分毫拖延都可能給聽障者的生命安全帶來巨大風險,耽誤最佳的急救時間。
為了改善呼救流程,提高對聽障者的急救效率,騰訊應急開放平臺在2021年推出“無障礙急救”小程序:當發(fā)生危險時,聽障人士可以使用小程序進行文字報警,系統(tǒng)會自動將文字轉(zhuǎn)譯成語音撥打至本地的120急救中心,并將位置同步傳輸至120,減少溝通環(huán)節(jié)、提高急救效率;隨后調(diào)度人員的語音回復,系統(tǒng)也會將回復同步轉(zhuǎn)譯成文字、發(fā)送給報警人,從而實現(xiàn)聽障者獨立急救報警。
AI的力量正在滲透聽障群體生活的方方面面,在解決少數(shù)者生存、生活等問題中挖掘科技工具的可能性,提高聽障人士的生活質(zhì)量,保障他們生存和擁有幸福的權利。
與此同時,AI也在不斷深入另一個障礙群體——視障人士的生活中。
用“觸摸”破解難題
“盲人們一直擁有一個頑固的認識,他們把有眼睛的地方叫做主流社會?!边@句出自電影《推拿》的旁白,直擊了隱身于大眾社會背后視障群體的真實生活。
世界衛(wèi)生組織報告顯示,目前,全球視力受損或失明人群已超過22億,僅我國就有1700多萬視障人士,大約每80人中就有一人面臨視力問題。他們或許無法看到物理空間的圖案,但每個人的世界都是豐富多彩的,只是人們鮮少去關心,他們的生活輪廓究竟是怎樣的。
出行,是視障群體主動邁向“主流社會”的第一步,而出行的體驗如何,不僅關系到他們后續(xù)對外的互動交往,同時也制約著其個人生活方向和職業(yè)選擇等。
不可否認的是,無障礙意識在國內(nèi)尚未廣泛建立,視障群體的出行安全難以得到充分保障。舉個例子,在辦公樓、教學樓等公眾建筑都有無障礙坡道,視障或肢障人群可以通過坡道進入建筑內(nèi),但現(xiàn)實的情況是,很多駕駛電動車或自行車的人,會不自覺地將交通工具停在坡道口造成擁堵,以至于真正有使用需求的人士無法利用。這就是一個無障礙的意識問題。
在騰訊,有個團隊正嘗試用觸覺反饋技術改善視障群體的生活體驗。鮮少有人知道,觸覺反饋最早是一項為游戲而研發(fā)的技術。游戲是一個多模態(tài)互動的行為,涉及到視覺、聽覺等多個觸覺感官。2019年,騰訊游戲MTGPA團隊探索觸覺反饋技術,為游戲中的角色、武器、載具等超過200個場景開發(fā)了專屬的振動效果,該技術于2021年4月在《和平精英》中得以應用。
同年10月,一次與障礙用戶的交流中,MTGPA團隊了解到這部分人群正面臨著艱難的出行安全問題。他們開始思考,團隊在游戲世界中的技術發(fā)現(xiàn),能否被應用在解決障礙用戶出行這一場景?
很快,MTGPA團隊聯(lián)合騰訊志愿者協(xié)會、深圳市信息無障礙研究會,針對障礙人群展開數(shù)次用戶需求調(diào)研,他們進一步了解到,不僅僅是出行,障礙人群在日常的瀏覽資訊、來電接聽、社交互動等場景中也面臨著許多難題。
隨即,團隊基于觸覺反饋技術迅速做出了一款方案給到視障用戶體驗,令他們驚喜的是,方案得到的反饋出人意料地好:上手沒有難度,甚至反饋速度比聽覺更快更直接。這也給予了MTGPA團隊投入服務視障人群項目中的決心。
為了使這套觸覺反饋方案更加契合障礙人群的使用場景和需求,擁有扎實科研能力和技術沉淀的高校成為MTGPA團隊合作的選擇。他們找到東南大學宋愛國教授團隊合作,共同打造面向手持設備的振動測試平臺,根據(jù)六點盲文規(guī)則、設計了一套與六點盲文編碼規(guī)則匹配的無障礙振動方案。
不僅如此,MTGPA團隊還與騰訊搜狗輸入法、騰訊地圖等團隊合作,將觸覺反饋技術在步行導航方向提醒、公交出行到站提醒、觸覺輸入三個場景實現(xiàn)了落地應用。據(jù)騰訊游戲技術運營部總經(jīng)理劉棲銅介紹,僅需20分鐘到半小時,視障人士即可了解振動觸覺反饋的使用方法。
騰訊搜狗輸入法觸覺輸入鍵盤示意圖
具體到應用場景中,研發(fā)團隊對輸入法鍵盤中的錨點字符,如“刪除鍵、S、G、K”等字母鍵處引入不同的振動效果,使視障用戶可以通過特殊的振動、迅速辨別所觸碰到的字符內(nèi)容,解決了僅依靠聽覺獲取信息的單一途徑,提高了障礙群體的信息安全性。
比如,當時視障人士在嘈雜環(huán)境下輸入密碼時,依靠讀屏語音,可能會導致密碼泄露,影響賬戶和資金安全。而借助觸覺反饋技術,即是在不便使用聲音反饋的情況下,視障人士也能通過觸覺來輸入或修改密碼,保護個人隱私同時,提升輸入的效率和準確度。
此外,觸覺反饋技術也與騰訊地圖的步行導航偏移矯正、公交地鐵導航振動提醒兩大無障礙場景結合。
步行導航時,當視障人士的方向與導航路線出現(xiàn)角度偏差,騰訊地圖會以振動提醒協(xié)同語音播報,距離指針方向越近振動越輕,距離目標方向越遠振動越強烈。
當視障人士搭乘公交出行時,系統(tǒng)也提供了“到站候車、即將到站、到站、到達目的地”四種不同場景的定制振動效果,以準確獲取站點信息,提醒用戶下車。
在游戲世界中發(fā)現(xiàn)技術應用更寬闊的可能性,MTGPA團隊利用觸覺反饋技術,為障礙群體解決了生活場景中的部分困擾,讓視障人群得以更“平等”地融入到數(shù)字時代。
無障礙的技術路徑
如今,我們身處在數(shù)字化轉(zhuǎn)型的時代浪潮中,社會前進和技術發(fā)展已經(jīng)無法脫離數(shù)字行為。技術發(fā)展與社會進步,“無障礙”在當下也被擴展了更多含義,包括信息無障礙、無障礙環(huán)境建設以及無障礙社會。
數(shù)字技術已經(jīng)成為無障礙建設的基礎支撐。找到一條從無障礙需求發(fā)掘、技術應用,到成果轉(zhuǎn)化的成熟路徑,勢在必行。
2007年,一個特殊的需求,給到了騰訊QQ的產(chǎn)品經(jīng)理,讓他們意識到竟然有一批依賴盲寫和讀屏軟件使用QQ的用戶。彼時,QQ剛剛在登陸環(huán)節(jié)加入驗證碼等安全機制。沒想到,這一保護賬號安全的功能卻成為了視障用戶的使用障礙。
因為無法獨立通過驗證碼,盲人用戶只能求助他人。在那個用戶反饋機制還不完善的年代,這群視障用戶只能求助中國盲人協(xié)會。
通過協(xié)會,騰訊收到這一需求,并很快給出解決方案:由盲協(xié)支持,將部分盲人用戶的QQ賬號加入無需驗證碼的白名單。這一看起來相對原始的解決方式,也成為騰訊信息無障礙建設的開端。
過去十六年,騰訊針對所有產(chǎn)品自發(fā)做了無障礙改造,還開發(fā)了40多項專門的功能和產(chǎn)品,為所有障礙人士提供服務。在此基礎上,騰訊還將研發(fā)成熟的技術,以技術開源、專利開放等方式,對外輸出。
2022年1月,由中國殘疾人輔助器具中心指導,騰訊搜狗輸入法聯(lián)合多方發(fā)起“眾聲”無障礙輸入公益計劃,基于搜狗輸入法、騰訊技術公益的無障礙技術積累,搭建無障礙輸入開放平臺,向全行業(yè)免費開放視障輸入、肢障輸入、長輩輸入、AI手語翻譯等技術解決方案。
天籟實驗室也在持續(xù)面向聽障領域的開發(fā)者、設備廠商、NGO等,開放騰訊會議的天籟音頻AI技術,提升助聽設備降噪效果。近期,騰訊還向社會免費開放了四件“觸覺反饋”無障礙技術專利,通過專利開放許可方式,推動前沿技術在無障礙領域更廣泛落地。
如今,騰訊還與中國殘聯(lián)公益組織成立無障礙聯(lián)合創(chuàng)新實驗室?;谶@個平臺,騰訊計劃面向社會招募1萬名障礙用戶,作為產(chǎn)品體驗官,共創(chuàng)式參與無障礙產(chǎn)品研發(fā),探索技術創(chuàng)新應用場景。此外,這個實驗室還會沉淀更多無障礙數(shù)字化服務,陸續(xù)對外輸出,實現(xiàn)社會多方共創(chuàng),構建信息無障礙。
數(shù)據(jù)顯示,中國殘障人群總數(shù)已超過8500萬人,包括視力障礙人數(shù)1200多萬,肢體障礙人數(shù)超2500萬,還有超2.64億60歲及以上老年人。無障礙事關3億人群,需要更多企業(yè)、機構等社會力量參與。
十六年,騰訊走出一條從自發(fā)到共創(chuàng)的無障礙技術路徑。
技術發(fā)展是一個持續(xù)迭代的過程,在推動社會進步同時,科技之手可以撥開籠罩障礙群體頭頂?shù)臑踉疲屜蛏频幕鹁嬲樟粮h、更廣闊的地方。
(雷峰網(wǎng)雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。