「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

89,007枚日本語・アラビア語画像質問応答データセット

画像質問応答 学習データセット
画像キャプション教師データ
日本語画像テキストデータ

現在、マルチモーダル大規模言語モデルや多言語画像理解システムの開発では、高品質な画像テキストペアデータの確保が課題です。弊社が提供する本データセットは、89,007セットの画像テキストペアを収録。日本語46,913セット、アラビア語42,094セットをバランスよく包括。各サンプルは1枚の画像と1つのJSONドキュメントで構成されます。収録タスクは4種類。画像キャプション生成、視覚的質問応答(VQA)、OCR文字認識、OCRベースVQAを網羅。さらに6つの専門分野(ビジネス/金融、コーディング/コンピュータサイエンス、法/政治/行政、科学技術/工学/数学、社会/文化/人文/宗教、スポーツ/ライフスタイル)をカバー。アノテーション精度は95%超を保証。画像ドメイン分類精度、画像テキスト整合性、OCR認識精度のすべてで高品質を実現。データ形式は画像がJPG、注釈がJSON。本データセットは、マルチモーダル大規模言語モデルの学習や、多言語画像キャプション生成、視覚的質問応答システム開発に最適。日本語・アラビア語対応の多言語OCR、クロスランゲージ画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語比率・タスク種別・分野構成・アノテーション粒度などを柔軟に調整。独自性の高い多言語マルチモーダルソリューション開発を、最適な学習データ基盤でサポートいたします。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データタイプ
89,007セットの画像テキストペア。日本語46,913セット、アラビア語42,094セット。各サンプルは1画像+1JSONドキュメントで構成。
コンテンツ
画像キャプション生成、視覚的質問応答(VQA)、OCR文字認識、OCRベースVQAの4種類。VQAは少なくとも1ラウンドのQ&Aを含む。
分野カバレッジ
ビジネス/金融、コーディング/コンピュータサイエンス、法/政治/行政、科学技術/工学/数学(STEM)、社会/文化/人文/宗教、スポーツ/ライフスタイルの6分野
アノテーション品質
画像ドメイン分類精度・画像テキスト整合性・OCR認識精度のすべてで95%超を保証。データ形式は画像がJPG、注釈がJSON。
活用シーン
マルチモーダル大規模言語モデル学習、多言語画像キャプション生成、視覚的質問応答システム開発、多言語OCR、クロスランゲージ画像理解、グローバル展開対応マルチモーダルAI基盤整備に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。
サンプル サンプル
おすすめデータセットおすすめデータセット
240万セット英語中国語画像キャプションデータセット

弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。 説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。 アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。 本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。 お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。

画像キャプションデータセット 画像テキストペア 教師データ シーン理解 画像 教師データ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

4be86961-ed31-4cf5-80ce-1f9fe6d299f4

5975c6bb-b0d8-430d-a65b-f4ba96366874