「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

3億組の高品質画像説明データ

マルチモーダル
画像
説明

3億枚の画像、各画像に対応する1つの説明。全て写真家が公開した正版画像作品。大部分は英語説明、ごく一部は中国語説明。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ規模
3億枚の画像、各画像に対応する1つの説明。全量図庫(写真画像+ベクター画像など)は約3億枚、生成AIトレーニング用の全量図庫(編集ニュース画像を除いた写真画像+ベクター画像)は約1億枚
データフォーマット
画像データフォーマットは.jpg、.png、.svgを含み、説明ドキュメントフォーマットは.txt
データ内容
作者が公開した正版画像作品及びその説明
画像タイプ
写真画像とベクター画像、多種のシーンカテゴリをカバー
画像解像度
4K以上
説明言語
大部分は英語説明、ごく一部は中国語説明
サンプル サンプル
おすすめデータセットおすすめデータセット
89,007枚日本語・アラビア語画像質問応答データセット

現在、マルチモーダル大規模言語モデルや多言語画像理解システムの開発では、高品質な画像テキストペアデータの確保が課題です。 弊社が提供する本データセットは、89,007セットの画像テキストペアを収録。日本語46,913セット、アラビア語42,094セットをバランスよく包括。各サンプルは1枚の画像と1つのJSONドキュメントで構成されます。 収録タスクは4種類。画像キャプション生成、視覚的質問応答(VQA)、OCR文字認識、OCRベースVQAを網羅。さらに6つの専門分野(ビジネス/金融、コーディング/コンピュータサイエンス、法/政治/行政、科学技術/工学/数学、社会/文化/人文/宗教、スポーツ/ライフスタイル)をカバー。 アノテーション精度は95%超を保証。画像ドメイン分類精度、画像テキスト整合性、OCR認識精度のすべてで高品質を実現。データ形式は画像がJPG、注釈がJSON。 本データセットは、マルチモーダル大規模言語モデルの学習や、多言語画像キャプション生成、視覚的質問応答システム開発に最適。日本語・アラビア語対応の多言語OCR、クロスランゲージ画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。 お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語比率・タスク種別・分野構成・アノテーション粒度などを柔軟に調整。独自性の高い多言語マルチモーダルソリューション開発を、最適な学習データ基盤でサポートいたします。

画像質問応答 学習データセット 画像キャプション教師データ 日本語画像テキストデータ
240万セット英語中国語画像キャプションデータセット

弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。 説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。 アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。 本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。 お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。

画像キャプションデータセット 画像テキストペア 教師データ シーン理解 画像 教師データ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

805b25b1-9ae9-46f7-ac9f-10e706c6e5f2

bf604932-787d-4379-bc69-bc4c4117c15f