免费人成在线观看,老熟女草bx×,老师的奶好大下面好紧漫画,乡村爱情3,久久av高潮av无码av喷吹

「噪音獵人」讓聲音更清晰

2021.07.14

「豬肉鋪開始(shi)剁(duo)(duo)肉了(le),我們去吧!」王(wang)燕南(nan)小(xiao)心翼(yi)翼(yi)地在肉枱上(shang)放好收音設備,希望能夠採集(ji)到剁(duo)(duo)肉的聲(sheng)音。燕南(nan)及(ji)其團隊已(yi)經收集(ji)了(le)吆喝(he)聲(sheng)、剁(duo)(duo)肉聲(sheng)和(he)腳步聲(sheng),這些聲(sheng)音都被用於騰訊天籟(lai)實驗室的研究項目(mu)。

對於燕(yan)南和穿(chuan)梭在(zai)大街上的(de)同事而言(yan),噪音就像(xiang)他(ta)們的(de)「獵(lie)物」,被他(ta)們追蹤、捕(bu)獲並(bing)銷毀。這些工程師被戲稱為「噪音獵(lie)人」,他(ta)們運用高超的(de)「捕(bu)獵(lie)」技能,幫(bang)助全世界聽(ting)到更優(you)質、更清晰的(de)聲音。

騰訊天籟實驗室的研究員正在採集室外噪音。

燕南在聲音領域(yu)擁(yong)有多年的(de)研(yan)究經驗(yan),因(yin)此對(dui)聲音極為(wei)敏感(gan)。他認為(wei)降噪(zao)技術可以為(wei)很多人(ren)的(de)生活(huo)帶來(lai)積(ji)極的(de)改(gai)變。

隨著通信設備(bei)不斷更(geng)新和完善,人(ren)們(men)的通話(hua)場(chang)景(jing)可能是行人(ren)路上或擁擠的人(ren)群(qun)中(zhong)等(deng)五花八門的地點。因此,想要改善收聽的效果(guo),重點在於(wu)了解如何降噪。

對此(ci),燕(yan)南(nan)解釋道(dao):「我(wo)們(men)在街市(shi)也能夠(gou)清晰地(di)聽到豬肉鋪老闆說話,是因為我(wo)們(men)的耳朵選擇性地(di)屏(ping)蔽了剁肉聲(sheng)。我(wo)們(men)團隊想要開(kai)發出比擬人耳功能的技(ji)術(shu)。要想消(xiao)除噪音(yin),先要識別噪音(yin),然後(hou)再主動干預。」

這個解決(jue)方案看似(si)簡單,但卻困擾了工(gong)程(cheng)師(shi)多年,其難處在於(wu)如何區分噪音與人(ren)的(de)(de)聲(sheng)音。騰訊天(tian)籟實驗室(shi)的(de)(de)工(gong)程(cheng)師(shi)坦(tan)言(yan),聲(sheng)音處理之所(suo)以(yi)難,是(shi)(shi)因為聲(sheng)音資料(liao)是(shi)(shi)一(yi)維(wei)的(de)(de)。圖像是(shi)(shi)二維(wei)的(de)(de),視頻是(shi)(shi)三維(wei)的(de)(de),因此區分後兩(liang)種(zhong)格(ge)式的(de)(de)不(bu)同層次相對(dui)容易。

要(yao)識別音(yin)(yin)(yin)頻中(zhong)的噪(zao)音(yin)(yin)(yin),工(gong)程(cheng)師(shi)首先需(xu)要(yao)收集大量噪(zao)音(yin)(yin)(yin)資料(liao),然後(hou)剪(jian)接、清理和提取這些數據的共同特徵,並將其放入演算法模型(xing)。疫情之前(qian),騰訊工(gong)程(cheng)師(shi)們每天(tian)都會帶著錄音(yin)(yin)(yin)設(she)備在辦公室四處走(zou)動,捕捉同事敲擊鍵盤的聲(sheng)音(yin)(yin)(yin)、關門(men)的聲(sheng)音(yin)(yin)(yin)以(yi)及商(shang)務環境中(zhong)的其他噪(zao)音(yin)(yin)(yin)。

騰訊天籟實驗室的工作設備。

疫情出現後(hou),由(you)於遙距工作(zuo)的需求(qiu)激增,更多(duo)人認識了(le)一款用(yong)戶過億的產品:騰訊會議。這(zhe)個廣受歡迎的視像(xiang)會議平(ping)臺(tai)背後(hou)所採用(yong)的核心技術便是騰訊天(tian)籟實驗(yan)室開發的AI降噪技術。

疫情(qing)前,電(dian)話會議普(pu)遍獲常(chang)規(gui)使用(yong),通(tong)(tong)話效果亦很好。人們(men)一般會在特定位置使用(yong)固網電(dian)話撥入會議。通(tong)(tong)話過程清晰可控,所(suo)需技術非常(chang)簡單。

但疫情改變了一(yi)(yi)切。在過去的一(yi)(yi)年(nian)到一(yi)(yi)年(nian)半左右,人(ren)們散布在很多(duo)不(bu)同類型的地點來進行電話(hua)或視像(xiang)會議,所採(cai)用的技術(shu)和網絡也迥異,這(zhe)給騰訊會議團隊帶來了極為(wei)複雜的技術(shu)挑戰。工作人(ren)員需要面對延遲(chi)、語音丟包及頻寬拉升(sheng)等種種新(xin)問(wen)題。

在所有挑(tiao)戰(zhan)中(zhong),最首要(yao)的(de)便是(shi)識別用戶加入會(hui)議的(de)地(di)點,例如機場、公共廣場、地(di)鐵車廂或其他嘈雜的(de)地(di)方。所有聲音(yin)以不同頻(pin)率混雜在一(yi)起,讓識別人聲的(de)難度驟增。面對這挑(tiao)戰(zhan),其中(zhong)一(yi)個解(jie)決辦法是(shi)使用統(tong)一(yi)的(de)音(yin)頻(pin)處理解(jie)決方案(an),通(tong)過一(yi)個複雜模型(xing)來辨別和過濾各種(zhong)場景(jing)中(zhong)的(de)噪音(yin)。

騰訊多媒體實驗室高級總監商世東在實驗室工作。

騰訊會(hui)議運用人工智能來識別和增(zeng)強(qiang)人聲(sheng)(sheng)(sheng),同(tong)時(shi)減(jian)少其他不(bu)必要的(de)(de)聲(sheng)(sheng)(sheng)音(yin),已(yi)實現語音(yin)通話(hua)品質提(ti)升近50%。通過分析和處理噪(zao)音(yin)獵人收集(ji)的(de)(de)聲(sheng)(sheng)(sheng)音(yin),包括巴士(shi)站(zhan)的(de)(de)嘈雜(za)聲(sheng)(sheng)(sheng)音(yin)、人聲(sheng)(sheng)(sheng)、雨聲(sheng)(sheng)(sheng)等,騰訊會(hui)議團(tuan)隊能夠更好地識別並消除視訊會(hui)議中出現的(de)(de)這(zhe)類(lei)聲(sheng)(sheng)(sheng)音(yin),從而使人聲(sheng)(sheng)(sheng)更加清晰。

騰(teng)(teng)訊(xun)會(hui)議團(tuan)隊(dui)憑(ping)藉(jie)強大的(de)技術(shu)工程和(he)研究能力令(ling)這解決(jue)方案得(de)以實現(xian),並以96%的(de)分辨準(zhun)確率在世(shi)界知名的(de)行業(ye)競(jing)賽中脫穎而出(chu)。這意味(wei)著,在96%的(de)情(qing)況(kuang)下,騰(teng)(teng)訊(xun)會(hui)議都能夠(gou)識別(bie)並去除多餘(yu)的(de)雜音。

「過(guo)去(qu),我們(men)的(de)工(gong)作重(zhong)點(dian)是(shi)利用新技術(shu)取得新突破、打造新產品。而如今,我們(men)將重(zhong)心放在持(chi)續改進演算法上,期望能夠發現部署AI降噪(zao)技術(shu)的(de)新方法,幫助更多人(ren)。」騰訊多媒(mei)體(ti)實(shi)驗室高級總監(jian)、天籟實(shi)驗室負(fu)責(ze)人(ren)商(shang)世(shi)東說道。「藉此技術(shu),我們(men)甚至(zhi)可能改善到長者的(de)生活品質。」