MagicData擁有1500小時日語語料庫,本次開源30小時數據集作為測試集。本語料庫的錄制文本為日常用語。采集方式為手機錄音;錄音輸出為PCM格式。37名來自日本不同區域(如東京、大阪、北海道等)的發言人參與采集。MagicData日語手機朗讀數據庫(30小時)由MagicData有限公司開發,免費發布供非商業使用。 Magic Data研發制作了朗讀、面對面對話、電話對話等多場景下的中文、英文、日語、韓語等數十種語言的語音數據庫。該數據庫得到了行業的廣泛認可。如您想了解更多愛數數據庫信息,歡迎您聯系我們。
語種
日語
錄音環境
安靜室內
有效時長
30 小時
錄音語料
日常口語句子
標注準確率
95%
發音人介紹
37名來自日本不同區域(如東京、大阪、北海道等)的發音人參與采集。
適用領域
語音識別
數據敏感項
無
版權所有者
Magic Data
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注