騰訊會議天籟實驗室用AI助聽障人群聽得更清晰
肖瑋(右三(san))和他(ta)的團(tuan)隊。
肖(xiao)瑋是騰訊會(hui)議(yi)天(tian)籟實驗(yan)室(shi)的(de)音頻算法工(gong)程師(shi)。他為騰訊會(hui)議(yi)等網上會(hui)議(yi)工(gong)具(ju)開發的(de)算法可(ke)以增強即時、端到端的數(shu)碼通訊(xun)效果。
肖瑋和他(ta)的團(tuan)隊相信(xin)騰訊會(hui)議背後先進(jin)的(de)會議技術能為世界各地的(de)人(ren)們(men)帶來便利,人(ren)們(men)可(ke)以(yi)在(zai)疫情(qing)期間繼續工作和溝通。
經(jing)過調查研(yan)究(jiu),他們(men)更(geng)發(fa)現音訊質量的(de)改善和降噪效果(guo)可以(yi)為聽障人群提(ti)供(gong)幫(bang)助(zhu),而這正好是騰訊(xun)「科技向善」使命的最佳實踐。
你的身邊可(ke)能就有(you)聽障人士(shi)
根據世界衛生組織(zhi)統計(ji),全球(qiu)有15億人聽力受損,到2050年(nian),這個數目(mu)預計會增加至25億,其中至少有(you)七億人需(xu)要(yao)復康服務。
聽障可能會帶來嚴重(zhong)後果,影響聽障人(ren)士(shi)的(de)學(xue)習和發展、就業(ye)、人際關係、社會活動參(can)與(yu)等等,也可(ke)以導致感到孤獨(du)、被孤立等心理健康問題。
幸好,聽障可(ke)以通(tong)過輔聽技術(shu)來緩減(jian),例如使用(yong)助聽器或(huo)人工耳蝸。
聽障去污(wu)名化,鼓(gu)勵早期檢測
如果你有近視或遠(yuan)視,一般很早(zao)就會被發現,能夠(gou)透過佩戴(dai)(dai)眼(yan)鏡來矯(jiao)正視力(li)。然(ran)而佩戴(dai)(dai)助聽器會讓人感到尷(gan)尬,因為(wei)這常(chang)被人視為(wei)一種身(shen)體障礙。
改變這種觀念需(xu)要時間和宣傳教育活動(dong)的(de)配合,與此同時(shi),騰訊會議天(tian)籟實驗室與中國(guo)國(guo)家耳鼻咽喉疾病臨床醫(yi)學(xue)研究中心發布了一款簡單的網上測聽(ting)工具。該工具融(rong)合了中國(guo)十二生肖的元素,可基(ji)於噪音場景下的言語可懂度測試方法(fa),幫助用戶(hu)快速初步(bu)評估和掌握(wo)自(zi)身的聽力健康情況。
善用AI音(yin)效幫助聽障人群
肖(xiao)瑋和騰(teng)訊(xun)會議天籟實驗室的同事(shi)最初使用通訊科技幫助聽障人(ren)群時,曾盡力消除或減低背(bei)景噪音。然而(er)(er),測試(shi)用戶的反(fan)饋表明,過度(du)(du)抑制(zhi)噪聲(sheng)反(fan)而(er)(er)降低了語(yu)音的可懂度(du)(du)。
有(you)一天(tian),肖瑋(wei)跟(gen)一位專家(jia)聊天(tian)時,對(dui)方提(ti)醒他(ta),從聽力學(xue)的(de)(de)(de)角度來說(shuo),語音(yin)(yin)(yin)的(de)(de)(de)可懂度是(shi)(shi)最(zui)重要(yao)(yao)的(de)(de)(de)。他(ta)突(tu)然意(yi)識到,「聽障人士想(xiang)聽到的(de)(de)(de)是(shi)(shi)語音(yin)(yin)(yin)。我們要(yao)(yao)做(zuo)的(de)(de)(de)不是(shi)(shi)對(dui)抗噪音(yin)(yin)(yin),而(er)是(shi)(shi)必須保留語音(yin)(yin)(yin)結構,保留好用戶想(xiang)感知的(de)(de)(de)聲音(yin)(yin)(yin)成分(fen)。」
工(gong)程師們(men)借鑑(jian)騰訊會議使(shi)用的AI增強技術和深(shen)度學習模型,設計了(le)新的方法(fa),在降噪之前先努力保留語(yu)音成份,可以有效提升噪音場景下的語音(yin)可懂度(du)。
騰訊天籟實驗室(shi)的研(yan)究(jiu)員正(zheng)在(zai)採集室(shi)外(wai)噪音。
借助智能手機駕馭AI音(yin)效
智能手機已經成為AI音(yin)(yin)訊技術的重要組成部分。它們對(dui)於(wu)捕捉和(he)處理聲(sheng)音(yin)(yin)至(zhi)關重要,也能通過藍牙將(jiang)聲(sheng)音(yin)(yin)傳(chuan)輸到聽力設備(bei),例如(ru)人工(gong)耳蝸或助聽器。
對於(wu)肖瑋(wei)來說,難度(du)在於設計算法,根據環(huan)境和用(yong)戶的聽(ting)力,增強或降(jiang)低(di)噪音。他把這比作(zuo)「為(wei)近視(shi)者提(ti)供度數合適(shi)的鏡片」。現在,聽障(zhang)人士(shi)可(ke)以使用一款App來設置個人化的降噪(zao)或語音增強程度,獲(huo)得最貼近個人需要的輔聽效果,即(ji)使專業醫生不在場(chang)亦能輕鬆單(dan)獨完成設定。
騰(teng)訊會(hui)議天籟實驗(yan)室還為輕度聽損人士找到了經濟實惠的解(jie)決方案,他們(men)只需使用耳機,不(bu)需要定製耳蝸或助聽(ting)器。例如(ru),當他們在課(ke)室或演(yan)講廳,可以把(ba)智能手機放(fang)在講員附(fu)近的(de)桌子上。借助一款免費(fei)App,手機可以捕捉和(he)處(chu)理語音,然後通過藍(lan)牙(ya)傳輸(shu)到用戶的耳機。與此同時(shi),App上也可以即時顯示字幕,幫(bang)助聽障(zhang)用戶(hu)理解內容。
以長者為優(you)先(xian)考量
長者(zhe)是深受聽障問題影響的群體(ti),全球65歲以上人士有三分之一存在(zai)至(zhi)少中度的聽力受損,且問題一(yi)般會隨著年齡增長而惡化。研究顯示聽障問題與失智和抑鬱相關。
為了(le)評(ping)估音(yin)訊技術在現實生活中的應用效果,肖瑋和團(tuan)隊成(cheng)員會去(qu)菜市場等嘈雜的地(di)方實地(di)評(ping)估。這(zhe)天,他們(men)觀察(cha)了一位婆婆如何使用App來與商販交談,這個App是(shi)利用騰訊(xun)會議(yi)天籟實驗室的音訊(xun)技術開發的。App能(neng)處(chu)理商販說的話,然(ran)後轉換成字體較大的文字(zi)顯示在(zai)智能(neng)手機上。
同(tong)樣,長者若想跟(gen)親朋(peng)好友們(men)通電(dian)話(hua),只要接聽電(dian)話(hua)就會自動啟(qi)動一個微信小程序(xu),長(chang)者可以(yi)一(yi)邊聽(ting)電話,一(yi)邊看到手機屏幕上顯示的字(zi)幕。在這種(zhong)場景下(xia),字(zi)幕輔聽(ting)和聲音輔聽(ting)一起(qi)發揮作用。
跨行業協作找(zhao)到問題的解決方案
跨行業(ye)協作是騰(teng)(teng)訊天籟實驗室的(de)(de)核(he)心(xin)工(gong)(gong)作。實驗室的(de)(de)工(gong)(gong)程師經(jing)常(chang)(chang)與不同行業(ye)的(de)(de)專(zhuan)(zhuan)家(jia)聯絡,這些專(zhuan)(zhuan)家(jia)會請他們(men)協助解決難題。設(she)備製造商也經(jing)常(chang)(chang)向騰(teng)(teng)訊天籟實驗室尋求(qiu)技術(shu)支持(chi)。憑藉強大(da)的AI音(yin)頻算法和深度學習能(neng)力,騰訊天籟實驗室團隊(dui)充分(fen)發揮這(zhe)項技術的潛力,賦能(neng)合作方(fang)實現(xian)突破。
「將算法(fa)技(ji)術(shu)(shu)有(you)效地應用(yong)於另一個專業(ye)領域並非易事。」肖瑋說(shuo),「這有(you)賴於堅實的(de)技(ji)術(shu)(shu)基礎,技(ji)術(shu)(shu)人員(yuan)對新應用(yong)領域的(de)敏感度,以及打(da)通(tong)技(ji)術(shu)(shu)和應用(yong)之間(jian)的(de)連接(jie)點。最重要(yao)的(de)是,你需要(yao)從對方(fang)的(de)角度來理解問(wen)題(ti),保持開放的(de)心態。」