[{"@type":"PropertyValue","name":"データ規模","value":"411名、約262時間、147,668発話"},{"@type":"PropertyValue","name":"収録対象","value":"日本人児童(6歳~13歳)"},{"@type":"PropertyValue","name":"収録機器","value":"スマートフォン"},{"@type":"PropertyValue","name":"データ形式","value":"音声データ形式:WAV、書き起こしデータ形式:TSV"},{"@type":"PropertyValue","name":"データ内容","value":"読み上げ音声、低学年(6~9歳)および高学年(10~13歳)に分類して収録アノテーション内容発話書き起こし"},{"@type":"PropertyValue","name":"読み上げ原稿正確率文字正確率","value":"98%以上"},{"@type":"PropertyValue","name":"利用用途","value":"音声認識(ASR)、音声合成(TTS)、話者認識、発音評価"}]
{"id":2160,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"262時間日本人児童音声データセット","datazy":[{"isCheckLength":true,"title":"データ規模","content":"411名、約262時間、147,668発話"},{"isCheckLength":true,"title":"収録対象","content":"日本人児童(6歳~13歳)"},{"isCheckLength":true,"title":"収録機器","content":"スマートフォン"},{"isCheckLength":true,"title":"データ形式","content":"音声データ形式:WAV、書き起こしデータ形式:TSV"},{"isCheckLength":true,"title":"データ内容","content":"読み上げ音声、低学年(6~9歳)および高学年(10~13歳)に分類して収録アノテーション内容発話書き起こし"},{"isCheckLength":true,"title":"読み上げ原稿正確率文字正確率","content":"98%以上"},{"isCheckLength":true,"title":"利用用途","content":"音声認識(ASR)、音声合成(TTS)、話者認識、発音評価"}],"datatag":"Japanese,children,speech","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[],"officialSummary":"411名・約262時間の日本人児童音声データ。147,668発話の読み上げ音声を収録。話者は6歳から13歳の日本人児童で、低学年(6~9歳、179名)と高学年(10~13歳、232名)に分類され、男女比はバランスよく構成されている。スマートフォンを使用して収録された16kHz/16bit モノラルWAV形式の音声に、発話書き起こしおよび読み上げ原稿が付属する。本データセットは日本語児童音声認識(ASR)、音声合成(TTS)、話者認識、発音評価等のタスクに利用可能である。","dataexampl":null,"datakeyword":["日本語","児童","読み上げ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,DE,PT,ES,KO,FR\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"262 Hours - Japanese Children's Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://nexdata.jp/shujutang/static/image/index/datatang_yuyin_default.webp
[]
262時間日本人児童音声データセット
日本語
児童
読み上げ
411名・約262時間の日本人児童音声データ。147,668発話の読み上げ音声を収録。話者は6歳から13歳の日本人児童で、低学年(6~9歳、179名)と高学年(10~13歳、232名)に分類され、男女比はバランスよく構成されている。スマートフォンを使用して収録された16kHz/16bit モノラルWAV形式の音声に、発話書き起こしおよび読み上げ原稿が付属する。本データセットは日本語児童音声認識(ASR)、音声合成(TTS)、話者認識、発音評価等のタスクに利用可能である。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
411名、約262時間、147,668発話
データ形式
音声データ形式:WAV、書き起こしデータ形式:TSV
データ内容
読み上げ音声、低学年(6~9歳)および高学年(10~13歳)に分類して収録アノテーション内容発話書き起こし
利用用途
音声認識(ASR)、音声合成(TTS)、話者認識、発音評価
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
ac3788df-b349-47b5-afdd-b40e198da4e4