客戶案例|Magic Data助力新能源車企高效迭代智能座艙語音交互功能
發布時間 : 2023-02-23 閱讀量 : 1741
作為時下最熱的賽道之一,新能源汽車制造業的“內卷”程度有目共睹。而電動化、智能化、網聯化、自動化的“新四化”發展趨勢,也正重新定位汽車行業的價值鏈。
本期客戶就是國內高端智能電動汽車領航者之一,其愿景是將智能汽車打造為數智化第三空間。

客戶需求背景
一直以來,智能駕艙都是客戶公司“智行”戰略重點方向之一,是客戶產品的重要賣點。在接觸Magic Data前,客戶已有部分基礎智能模型,秉承著更好服務車主的想法,客戶希望借助Magic Data全鏈條數據服務,通過迭代當前基礎模型和不斷增加新功能,實現產品智能座艙差異化優勢,打造市場領先產品。
其中,客戶需求重點是針對自然對話場景迭代人機交互模型(特別是提高噪音環境下的識別),提高智能助手的語音識別、交互理解能力以及常見使用場景下的任務完成能力(對話場景下的具體任務,例如:訂餐)。
客戶痛點與挑戰
受限于數據合規、語料不足等問題,客戶座艙內語音助手模型迭代存在一些掣肘,如:
- 缺乏可用的艙內對話數據:客戶直接使用用戶艙內數據可能存在合規風險,進而導致模型迭代進度滯后。
- 缺乏對話數據中具體場景、領域對話數據:當前市面上,垂直領域對話數據稀缺,導致模型多輪對話訓練難以正常進行。
- 個性化控制命令泛化語料匱乏:對于艙內人機交互現有的,以及在使用中用戶新產生的個性化指令與需求,需要有基于真實場景下的個性化定制數據供模型訓練使用。
客戶希望借助Magic Data的服務,使模型達到“無論用戶有什么新的想法、需求,艙內智能助手都能夠順利識別用戶意圖并與之產生自然交互”的成熟狀態。

Magic Data解決方案
Magic Data通過與客戶多次深入溝通,分析客戶的需求,針對客戶痛點提供了成品數據集為主、定制化采標為輔助的整體解決方案:
- 針對艙內人機交互不自然問題,Magic Data提供了大量基于模擬真實場景下的自然對話成品數據集,包括無噪音及帶噪音模擬艙內對話數據,包含人們自然說話狀態下可能包含的猶豫、遲疑等發音特點,幫助提升機器在自然對話場景下的語音識別準確率。
- 針對智能助手完成功能型任務需求,Magic Data提供了各類領域相關對話數據,如旅游度假、數碼產品、休閑娛樂、商業經濟、家庭生活等領域的豐富多樣的主題語料,幫助提高機器完成特定領域具體任務能力。
- 針對命令控制的泛化需求,Magic Data在提供成品泛化庫同時,提供了定制命令泛化服務。針對單個功能點,最多泛化語料高達400條,以覆蓋用戶可能使用的每個潛在短語,幫助機器準確捕捉用戶意圖。
(為了確保數據的高質量合規交付,Magic Data提供的成品數據集及定制采標數據都經由智能標注平臺Annotator和文本泛化平臺處理。)
方案中使用的部分Magic Data成品數據集
(點擊可直接跳轉)
ASR:
MDT-ASR-C001中文普通話朗讀音頻數據集–人機交互、命令控制
NLP:
MDT-NLP-B002中文命名實體識別語料庫–中文新聞命名實體
MDT-NLP-G030中文車載命令控制文本語料庫–空調命令文本母句,含有槽位及槽值
MDT-NLP-G031中文車載命令控制文本語料庫–座椅命令文本為母句數據,涉及到動詞及句式的泛化,對功能(實體),連詞及介詞充分設計成槽位及槽值
TTS:
MDT-TTS-D003中文女聲情感TTS數據集–親切女生(中文、英文、中英混)
MDT-TTS-G005中文男聲TTS多情感庫–男中音(中文)

客戶反饋
通過采用Magic Data整體數據解決方案,客戶高效完成了其智能座艙人機交互系統迭代,智能語音識別模型性能有顯著提升,特別是在自然對話交互中,字識別錯誤率下降了大約30%。對此,客戶表示:”Magic Data的專業團隊反饋高效,可以在最短時間內明確我們的需求并提供相應的整體解決方案,對于我們這類時間緊迫的項目有相當大的幫助”。
