[{"@type":"PropertyValue","name":"言語","value":"日本語 (ja-JP)"},{"@type":"PropertyValue","name":"収録国","value":"日本"},{"@type":"PropertyValue","name":"フォーマット","value":"16kHz, 16bit, WAV, モノラル"},{"@type":"PropertyValue","name":"内容カテゴリ","value":"マクロ金融・ミクロ金融"},{"@type":"PropertyValue","name":"録音環境","value":"低ノイズ環境"},{"@type":"PropertyValue","name":"アノテーション項目","value":"テキスト, 時間スタンプ, 話者ID, 性別, ノイズ, 機密情報"},{"@type":"PropertyValue","name":"文字起こし精度","value":"98%"}]
{"id":2048,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"300時間日本語金融自然対話音声データセット","datazy":[{"title":"言語","content":"日本語 (ja-JP)"},{"title":"収録国","content":"日本"},{"title":"フォーマット","content":"16kHz, 16bit, WAV, モノラル"},{"title":"内容カテゴリ","content":"マクロ金融・ミクロ金融"},{"title":"録音環境","content":"低ノイズ環境"},{"title":"アノテーション項目","content":"テキスト, 時間スタンプ, 話者ID, 性別, ノイズ, 機密情報"},{"title":"文字起こし精度","content":"98%"}],"datatag":"Japanese,Financial,Casual Conversation,Monologue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"000012_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000012_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PogHZtu0zq2KjlgzInzmnJdPWOc%3D","intro":"一方で今日も引き続きバリューや中小型株優位で、セクターローテーションの一環とも言えるのか、","size":200330,"progress":100,"type":"mp3"},{"name":"000012_11.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000012_11.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=1DTXLErsV4NW%2FoZniqM2W38PoDM%3D","intro":"決算が物足りないと受け止められた、アドバンストマイクロデバイスが急落していました。","size":164192,"progress":100,"type":"mp3"},{"name":"000011_7.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000011_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Mm5nc8PecIdGi253irVV7lExwpU%3D","intro":"えまず、資料は、ええ最初のデータとしてこういうのを持ってきました。過去二十回取ってきました。","size":152612,"progress":100,"type":"mp3"}],"officialSummary":"実世界の金融シーンにおける多様性に対応するため本日本語音声データセット。実際のインタラクションを反映した口語コーパスを採用しています。金融特有の専門用語や複雑な文脈を自然に含むことでASRやNLPモデルのロバスト性と汎用性を大幅に向上させます。98%の高精度アノテーション済みデータとしてテキストだけでなく時間スタンプや話者分離からノイズ、機密情報まで詳細にラベリングされており、モデルの学習効率と認識精度の最大化に貢献します。低ノイズ環境で収録された16kHz/16bitのWAVフォーマットは前処理の負荷を軽減しディープラーニングにおける本質的な特徴抽出を可能にする理想的なASR学習データです。さらにGDPRやCCPAなど厳格なデータ保護規制に完全準拠しており企業規模のAI開発にも安心してお導入いただけます。","dataexampl":null,"datakeyword":["音声認識データセット","日本語音声認識データ","金融分野音声データセット","金融音声データ","金融チャットボット音声データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"300 Hours - Japanese(Japan) Financial Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://nexdata.jp/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000012_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PogHZtu0zq2KjlgzInzmnJdPWOc%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000012_11.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=1DTXLErsV4NW%2FoZniqM2W38PoDM%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20260402165416/000011_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Mm5nc8PecIdGi253irVV7lExwpU%3D"}]
300時間日本語金融自然対話音声データセット
音声認識データセット
日本語音声認識データ
金融分野音声データセット
金融音声データ
金融チャットボット音声データ
実世界の金融シーンにおける多様性に対応するため本日本語音声データセット。実際のインタラクションを反映した口語コーパスを採用しています。金融特有の専門用語や複雑な文脈を自然に含むことでASRやNLPモデルのロバスト性と汎用性を大幅に向上させます。98%の高精度アノテーション済みデータとしてテキストだけでなく時間スタンプや話者分離からノイズ、機密情報まで詳細にラベリングされており、モデルの学習効率と認識精度の最大化に貢献します。低ノイズ環境で収録された16kHz/16bitのWAVフォーマットは前処理の負荷を軽減しディープラーニングにおける本質的な特徴抽出を可能にする理想的なASR学習データです。さらにGDPRやCCPAなど厳格なデータ保護規制に完全準拠しており企業規模のAI開発にも安心してお導入いただけます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
16kHz, 16bit, WAV, モノラル
アノテーション項目
テキスト, 時間スタンプ, 話者ID, 性別, ノイズ, 機密情報
![サンプル]()
サンプル
Audio
一方で今日も引き続きバリューや中小型株優位で、セクターローテーションの一環とも言えるのか、
Audio
決算が物足りないと受け止められた、アドバンストマイクロデバイスが急落していました。
Audio
えまず、資料は、ええ最初のデータとしてこういうのを持ってきました。過去二十回取ってきました。
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
6a8d8504-9988-4be6-a5a3-5f4d0a619161