晴數智慧布局對話式AI數據集多年,關注到大模型帶來了大規模的對話式場景落地在3年前開始規劃語音翻譯數據集產品設計。高質量的語音翻譯數據集成為基礎能力制約的關鍵。晴數智慧設計生產了各個語言 (包括方言) 的端到端翻譯數據集:MagicData-CLAM-MT自然口語對話端到端翻譯數據。該數據集來自真實的人類自然對話,對話內容自然、豐富、具有個人特點且情感表達自然,可以使機器學習到人類的自然表達。
語種
中譯英
數據風格
對話式&朗讀式
采樣率
16kHz
比特率
16bits
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注