「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

カスタマーサービス

お問い合わせ

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

ホーム > 全てのデータセット > LLMデータセット > 89,007枚日本語・アラビア語画像質問応答データセット

89,007枚日本語・アラビア語画像質問応答データセット

画像質問応答学習データセット

画像キャプション教師データ

日本語画像テキストデータ

現在、マルチモーダル大規模言語モデルや多言語画像理解システムの開発では、高品質な画像テキストペアデータの確保が課題です。弊社が提供する本データセットは、89,007セットの画像テキストペアを収録。日本語46,913セット、アラビア語42,094セットをバランスよく包括。各サンプルは1枚の画像と1つのJSONドキュメントで構成されます。収録タスクは4種類。画像キャプション生成、視覚的質問応答（VQA）、OCR文字認識、OCRベースVQAを網羅。さらに6つの専門分野（ビジネス/金融、コーディング/コンピュータサイエンス、法/政治/行政、科学技術/工学/数学、社会/文化/人文/宗教、スポーツ/ライフスタイル）をカバー。アノテーション精度は95%超を保証。画像ドメイン分類精度、画像テキスト整合性、OCR認識精度のすべてで高品質を実現。データ形式は画像がJPG、注釈がJSON。本データセットは、マルチモーダル大規模言語モデルの学習や、多言語画像キャプション生成、視覚的質問応答システム開発に最適。日本語・アラビア語対応の多言語OCR、クロスランゲージ画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語比率・タスク種別・分野構成・アノテーション粒度などを柔軟に調整。独自性の高い多言語マルチモーダルソリューション開発を、最適な学習データ基盤でサポートいたします。

このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。

データ仕様

データタイプ

89,007セットの画像テキストペア。日本語46,913セット、アラビア語42,094セット。各サンプルは1画像＋1JSONドキュメントで構成。

コンテンツ

画像キャプション生成、視覚的質問応答（VQA）、OCR文字認識、OCRベースVQAの4種類。VQAは少なくとも1ラウンドのQ&Aを含む。

分野カバレッジ

ビジネス/金融、コーディング/コンピュータサイエンス、法/政治/行政、科学技術/工学/数学（STEM）、社会/文化/人文/宗教、スポーツ/ライフスタイルの6分野

アノテーション品質

画像ドメイン分類精度・画像テキスト整合性・OCR認識精度のすべてで95%超を保証。データ形式は画像がJPG、注釈がJSON。

活用シーン

マルチモーダル大規模言語モデル学習、多言語画像キャプション生成、視覚的質問応答システム開発、多言語OCR、クロスランゲージ画像理解、グローバル展開対応マルチモーダルAI基盤整備に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。

サンプル

サンプル

おすすめデータセット

おすすめデータセット

700万組の高品質ビデオ説明データ

700万本のグローバル正版高品質ビデオ。全てグローバル写真家が公開した正版ビデオ作品。うち600万本は英語説明、100万本は中国語説明。人物、風景、動物など多種のカテゴリをカバー。解像度は全て1080p以上。

マルチモーダルビデオ説明キャプション LLMデータセット

3億組の高品質画像説明データ

3億枚の画像、各画像に対応する1つの説明。全て写真家が公開した正版画像作品。大部分は英語説明、ごく一部は中国語説明。

マルチモーダル画像説明

240万セット英語中国語画像キャプションデータセット

弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。

画像キャプションデータセット画像テキストペア教師データシーン理解画像教師データ

ご要望をご相談ください

プロジェクトの成熟度

初期検討段階（具体的な仕様は未定）

目標は明確だが、専門的な支援が必要

開発中または最適化フェーズ

データ／アノテーションの専門チーム（明確な仕様あり）

フルネーム *

電話番号*

会社名 *

ビジネスメール *

データ要件 *

プライバシー保護に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか？

Nexdata の LLM データセットには、指示追従型（SFT）、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか？

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか？カスタマイズは可能ですか？

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

ニュースレターを購読する

AI学習用データ製品: 全てのデータセット; フィジカルAIデータセット; LLMデータセット; 画像・動画データセット; 音声認識データセット; 音声合成データセット; OCRデータセット; 発音辞書データセット; 自然言語理解データセット

データサービス: 3D点群データ; ストリートビューデータ; OCRデータ; 行動識別データ; ID識別データ; 音声認識データ; 音声合成データ; マルチモーダルデータ

活用事例: エンボディドAI; 生成AI; 自動運転; 製造業; チャットボット; AR/VR; スマートホーム; リテール; ヘルスケア

企業情報: 運営会社; 資料ダウンロード; お役立ち情報; パートナー; データセキュリティ; イベント
リンク: OPENMPD; DataPlus; Datarade

プラットフォーム: プラットフォーム
コンテスト: コンテスト
リソース: オープンデータセット

より高品質なデータでより高精度なAIを構築

0362568911

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

サイドマップ利用規約

当社は、お客様のブラウジング体験を向上させ、パーソナライズされた広告やコンテンツを提供し、当社のトラフィックを分析するためにクッキーを使用します。「すべてを受け入れる」をクリックすると、クッキーの使用に同意したことになります。

b6811178-8b7e-4b23-a978-cf8069c8861b

b6650488-e731-407c-8040-385ce32bec6d