該數據集專為訓練更懂口語表達的AI模型打造,有利于提升英語語音識別的自然交互能力,重點捕捉自然對話中的連讀、弱讀及填充詞,覆蓋場景豐富,由多樣化人群錄制,字準率高。高完整度語句與符合母語習慣的標點標注,有效提升模型對英語韻律節奏的建模能力,實現語音精準識別。
語種
英語
數據風格
spontaneous
比特率
16bits
聲道
1
時長
20000+小時
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注