行業(yè)洞察 | 你的耳機(jī)能進(jìn)行骨傳導(dǎo)聲紋識別嗎?
發(fā)布時間 : 2022-09-16 閱讀量 : 1732
隨著人工智能的發(fā)展,對于聲紋識別很多人已不陌生。聲紋識別就是將聲信號轉(zhuǎn)換成電信號,再用計算機(jī)進(jìn)行識別。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù),如縮小刑偵范圍時可能需要辨認(rèn)技術(shù),而銀行交易時則需要確認(rèn)技術(shù)。
此前小米推出的降噪耳機(jī)4 Pro采用了骨聲紋降噪的方式,支持通話降噪功能。其實骨聲紋早在2020年就裝載在華為FreeBuds 3上發(fā)行。但很多人依然不知道何為骨聲紋識別?骨聲紋識別之于我們普通的聲紋識別又有那些優(yōu)勢,能夠先一步落地于耳機(jī)這樣的應(yīng)用場景?
「骨聲紋識別」
聲音傳導(dǎo)由于傳導(dǎo)介質(zhì)不同,所收錄的語音特色也不同。人體骨骼可以傳導(dǎo)聲音,我們一般聽到自己的聲音和他人聽到自己的聲音的音色有所不同,就是因為我們自己聽到的自己的聲音是通過空氣傳導(dǎo)加骨傳導(dǎo)進(jìn)入我們耳朵的,而他人聽到的我們的聲音是通過空氣傳播。骨傳導(dǎo)沒有空氣傳播容易,它產(chǎn)生的阻力會導(dǎo)致聲波頻率下降,因此音調(diào)會變的更加低沉。下圖描述了骨傳導(dǎo)耳機(jī)到耳蝸之間的傳導(dǎo):

什么是骨聲紋識別?確切的說應(yīng)該是根據(jù)骨傳導(dǎo)語音進(jìn)行聲紋識別,如同人的DNA、指紋一樣, 每個人的頭骨是獨一無二的,所以聲音的骨骼間的反射也是獨一無二的,每個人的骨傳導(dǎo)語音反射不同,用頭戴耳機(jī)收集后就可以用于識別此人的身份。
目前支持骨傳導(dǎo)聲紋的耳機(jī)主要有南卡Runner pro3、韶音OpenRun Pro運動耳機(jī)、骨聆SS900 TWS、艾刻IKKO ITG01骨傳導(dǎo)耳機(jī)、索愛GD06、聯(lián)想X4還有近期的華為FreeBuds 3和小米降噪耳機(jī)4 Pro。這些骨傳導(dǎo)耳機(jī)之前一直由國外骨傳導(dǎo)傳感器壟斷,目前華為采用歌爾骨傳導(dǎo)傳感器替換國外器件,這預(yù)示著國產(chǎn)骨傳導(dǎo)耳機(jī)以后可能會占據(jù)更多市場份額。
「對比普通聲紋識別的優(yōu)點」
對比Under-Air的普通聲紋識別,骨傳導(dǎo)聲紋識別的優(yōu)點如下:
(1) 由于每個人的頭骨是獨一無二的,加上每個人的音色也是獨一無二的,二者雙重判定,有更高的安全性。
(2) 骨傳導(dǎo)聲紋識別受到混響噪聲干擾小,降低噪聲對識別準(zhǔn)確率的影響,聲紋識別中域的不匹配問題也會降低,因此可以帶來更高的識別準(zhǔn)確度。
「對比普通聲紋識別的缺點」
對于普通聲紋識別,骨傳導(dǎo)聲紋識別需要佩戴無線耳機(jī)或者麥克風(fēng),異物感明顯,價格相比普通耳機(jī)較貴,且不是所有人都喜歡戴耳機(jī)。每次聲紋身份驗證都需要佩戴,便捷程度不足,應(yīng)用場景有限。用戶與智能家居設(shè)備之間的指令通常都是隨意且Under-Air的交流方式,讓用戶佩戴耳機(jī)與之交流恐怕不符合用戶習(xí)慣和應(yīng)用場景,因此推廣市場有限。
此外,目前市場上沒有開源骨傳導(dǎo)與語音數(shù)據(jù)集,需要為產(chǎn)品應(yīng)用錄制數(shù)據(jù),對比普通聲紋識別錄制,骨傳導(dǎo)語音錄制成本更高,需要更專業(yè)的團(tuán)隊提供數(shù)據(jù)支撐研究。Magic Data作為全球領(lǐng)先AI數(shù)據(jù)解決方案提供商,具有完善的采集流程和高效采集工具,采集數(shù)據(jù)符合全球數(shù)據(jù)安全規(guī)定,同時Magic Data自研標(biāo)注平臺Annotator提供一站式標(biāo)注,并支持3D點云、多模態(tài)等數(shù)據(jù)標(biāo)注。最終通過專業(yè)的數(shù)據(jù)測試模型校驗數(shù)據(jù),保證數(shù)據(jù)質(zhì)量。
