「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

音声認識データセット

既製の高品質なデータセットでAIモデルのパフォーマンスを
即座に向上させます。

言語

全て
183
アラビア語
3
ミャンマー語
2
中国語方言
3
英語
41
フランス語
7
ドイツ語
8
ヒンディー語
6
インドネシア語
8
イタリア語
7
日本語
9
韓国語
12
マレー語
5
中国語共通語
2
その他
34
ポルトガル語
11
ロシア語
5
スペイン語
12
タイ語
5
ベトナム語
5

データタイプ

全て
183
読み上げ
89
対話
95

101時間のイタリア語の子供の音声データ_口語表現

202人のマルチアングル唇形状マルチモーダルビデオデータは、屋内の自然光シーンと屋内の蛍光灯シーンという収集環境で収集されました。収集設備は携帯電話です。収集の多様性は、さまざまなシーン、さまざまな年齢、13 の撮影アングルをカバーしています。使用される言語は中国語普通語です。録音は汎用分野であり、内容は制限されません。このデータは、音声と画像の分野におけるマルチモーダル学習アルゴリズムの研究に使用できます。
自然な音声データ テキストアノテーション イタリア語

34時間分のインドヒンディー語児童音声データ_口語形式

本データはソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つインドの児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
ヒンディー語 カジュアルな会話 モノローグ ASR(自動音声認識) 子供

144.6時間のスペイン・スペイン語児童音声データ_口語形式

スペイン・スペイン語児童音声データ_口語形式は、ソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つスペイン児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
スペイン語 自然 スピーチ テキストアノテーション

98時間インドネシア語子供音声データ_口語化

インドネシア語児童音声データ_口語版は、内容がセルフメディア、対話、ライブ配信、講義、バラエティ等の汎用分野を網羅し、実世界のインタラクションシーンを反映する。本データセットはテキスト内容、話者識別、性別、アクセント等多様な属性でアノテーションを実施した。12歳以下の異なる地域・文化的背景を持つインドネシアの児童により録音され、高精度で扱いやすく、音声認識関連の研究・応用に豊富なリソースを提供。モデルの実世界多様性対応を支援。データ保護法規とプライバシー規定を厳格に順守し、データ収集、保存、利用の全過程でユーザーのプライバシーと法的権利を保護する。全データはGDPR、CCPA、PIPLに準拠する。
インドネシア語 文字起こし 音声データ

128時間のオーストラリア英語児童音声データ_口語形式

オーストラリア英語児童音声データ_口語形式は、ソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つオーストラリア児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
オーストラリア英語 自然 スピーチ テキストアノテーション

189時間のラテンアメリカスペイン語児童音声データ_口語形式

ラテンアメリカスペイン語児童音声データ_口語形式は、ソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つラテンアメリカ児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
ラテンアメリカのスペイン語 自然 スピーチ

1218時間分のベトナム語口語音声データ

ベトナム語音声データ_口語化。内容は、自メディア、対話、ライブ配信など複数の一般的な分野をカバーしており、現実世界のインタラクション状況を反映している。本データセットには、テキスト内容、話者の身元、セックスなど多くのプロパティが編集されており、正確性が高く、使いやすい。 「私たちはデータ保護規則およびプライバシー規定を遵守しており、データの収集、保存、利用の過程においてユーザーのプライバシーと正当な権利利益を守ることを確保している。すべてのデータはGDPR、CCPA、PIPLに準拠している。
ベトナム語 口語映像 テキストアノテーション

55時間のイギリス英語の子供音声データ_音読(マイク)

イギリス英語の子供の音声データ_朗読(マイク)は、201人のイギリスの地元の子供たちに指定されたスクリプトの音読と模擬録音に基づいていて、高忠実度のマイクを使用して録音されたものです。録音内容は児童向けで、児童向けの教科書や絵本などが中心です。テキストは手動で校正されており、精度が高く、音声認識関連の研究やアプリケーションに豊富なリソースを提供します。多くのAI企業によって検証されており、現実世界の多様性に直面したときにモデルがうまく機能するのに役立ちます。当社は、データの収集、保管、使用中にユーザーのプライバシーと法的権利が保護されるように、データ保護法とプライバシー規制を厳守しています。すべてのデータは、GDPR、CCPA、PIPL に準拠しています。
イギリスの子供たちの音声 子供たちの音声データ 子供たちの音声データ

299時間のアメリカ児童音声データセット_音読(スマートフォン収録)

アメリカ児童音声データセット_音読(スマートフォン収録)は、指定された台本を読み上げて録音され、児童書、教科書など多岐にわたるカテゴリーをカバーしています。内容は豊富で、子供の言語使用習慣に適合しています。本データセットには、テキスト内容など複数の属性がアノテーションされており、200人以上の異なる地域や文化的背景を持つアメリカの子供たちが録音に参加。アメリカ英語のネイティブスピーカーによる発音で、テキストは手作業で校正され、高精度となっています。音声認識関連の研究やアプリケーションに豊富なリソースを提供します。複数のAI企業による検証済みで、モデルが実世界の多様性に対応する上で優れた効果が確認されています。当社はデータ保護法規制とプライバシー規定を厳守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護しています。すべてのデータはGDPR、CCPA、PIPLに準拠して管理されています。
アメリカ児童音声 マイク収集音声データ 子ども音声データ
. . .

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
71aa7661-7767-4f7b-a002-6fa1188c6a5b