3億組の高品質画像説明データ

マルチモーダル

画像

説明

3億枚の画像、各画像に対応する1つの説明。全て写真家が公開した正版画像作品。大部分は英語説明、ごく一部は中国語説明。

このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。

データ仕様

データ規模

3億枚の画像、各画像に対応する1つの説明。全量図庫（写真画像＋ベクター画像など）は約3億枚、生成AIトレーニング用の全量図庫（編集ニュース画像を除いた写真画像＋ベクター画像）は約1億枚

データフォーマット

画像データフォーマットは.jpg、.png、.svgを含み、説明ドキュメントフォーマットは.txt

データ内容

作者が公開した正版画像作品及びその説明

画像タイプ

写真画像とベクター画像、多種のシーンカテゴリをカバー

画像解像度

4K以上

説明言語

大部分は英語説明、ごく一部は中国語説明

大規模言語モデル学習用としてどのような分類・構造化データがありますか？

Nexdata の LLM データセットには、指示追従型（SFT）、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか？

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか？カスタマイズは可能ですか？

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

マルチモーダル 画像 説明