「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

151万セット画像編集インストラクションデータセット

生成AI教師データ画像編集
画像編集インストラクションデータセット
画像合成 学習データ 生成モデル

現在、生成AIや画像編集モデルの開発では、多様な編集指示に高精度で応答できるインストラクションベース画像編集データの確保が課題です。特に日本語対応の生成AI教師データセットや、ピクセルレベル編集注釈付きの画像合成学習データへの需要が急増しています。弊社が提供する本データセットは、151万セットの高品質な画像編集ペアを収録。対象ターゲットは人物(クローズアップ・半身・全身)をはじめ、動物・商品・植物・建物・風景・旅行写真・家庭シーンなど、実用的な画像カテゴリを幅広くカバーします。編集タイプは5種類。人物・物体の一貫性編集50万セット、構造的編集30万セット、複合編集21万セット、空間編集45万セット、スタイル転送編集5万セット。多様な編集ニーズに対応可能です。収録条件は高品質です。画像解像度は2K以上を保証。データ形式は画像が.jpg/.jpeg/.png、編集指示テキストが.txt。アノテーションは編集指示に従ったピクセルレベル編集を実施。精度保証も万全です。編集済みデータの適合率は97%超。編集対象と元対象のエッジ誤差は5ピクセル以内を維持。生成モデルの学習用として最適な品質を実現。本データセットは、画像合成モデルの学習や、データ拡張・仮想シーン生成アルゴリズム開発に最適。生成AI教師データセット、インストラクションベース画像編集学習、テキスト指示対応画像生成、マルチモーダルAI開発など、幅広い用途にご利用いただけます。多様な編集指示に高精度で応答する画像生成モデルを、効率的に実装可能です。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録ターゲット種別・編集タイプ・アノテーション粒度・データ形式などを柔軟に調整。独自性の高い生成AIソリューション開発を、最適な学習データ基盤でサポートいたします。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データタイプ
51万セットの高品質な画像編集ペア。画像解像度は2K以上を保証。データ形式は画像が.jpg/.jpeg/.png、編集指示テキストが.txt。
ターゲット種別
人物(クローズアップ・半身・全身)、動物、商品、植物、建物、風景(都市/田園/自然)、旅行写真、家庭シーンなど実用的カテゴリ
編集タイプ
人物/物体一貫性編集50万セット、構造的編集30万セット、複合編集21万セット、空間編集45万セット、スタイル転送編集5万セットの5種類。
アノテーション品質
編集指示に従ったピクセルレベル編集を実施。適合率97%超、エッジ誤差5ピクセル以内を保証。生成モデル学習用として最適な品質。
活用シーン
画像合成モデル学習、データ拡張・仮想シーン生成アルゴリズム開発、テキスト指示対応画像生成、マルチモーダルAI開発に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。
サンプル サンプル
  • 151万セット画像編集インストラクションデータセット
  • 151万セット画像編集インストラクションデータセット
  • 151万セット画像編集インストラクションデータセット
おすすめデータセットおすすめデータセット
20万件国際ランドマーク画像キャプションデータセット

弊社が提供する本データセットは、20万件のランドマーク画像テキストペアを収録。国内ランドマーク8万件、海外ランドマーク12万件をバランスよく包括。対象国は米国・英国・仏・独・露など20カ国以上を網羅します。 収録ランドマークは多様です。商業ビル・古代建築・記念碑・図書館・観光名所など、多様な建築種別をカバー。各ランドマークには1〜10枚の画像を収録。異なるアングル・距離・時間帯からの撮影データを含むため、実環境での汎化性能向上に貢献します。 アノテーションは高精度です。ランドマークの国・都市・所在地・分類・説明文を付与。ランドマーク情報の精度・説明文の精度ともに97%超を保証。データ形式は画像が.jpg、注釈が.json。 本データセットは、ランドマーク認識モデルの学習や、多言語画像キャプション生成、画像テキスト検索システム開発に最適。観光アプリ開発、文化遺産デジタルアーカイブ、グローバル展開を視野に入れた画像理解基盤の整備など、幅広い用途にご利用いただけます。 さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録国・建築種別・言語比率・アノテーション粒度などを柔軟に調整。独自性の高いランドマーク認識ソリューション開発を、最適な学習データ基盤でサポートいたします。

ランドマーク 画像 データセット 観光名所 認識 教師データ 画像キャプション 生成 学習データ 多言語 画像認識 データセット 世界遺産 認識 教師データ 建築 画像 分類 データセット
20,846セット料理画像キャプションデータ

20,846グループのレシピ画像テキストペアを収録。各レシピには4〜18枚の工程画像が含まれ、それぞれに詳細な手順説明が付属します。 収録料理は多国籍です。中国料理・西洋料理・韓国料理・日本料理など、多様な食文化を網羅。説明文は中国語(15語以上)と英語(30語以上)のバイリンガル対応。画像解像度は原則200万ピクセル以上を保証。 アノテーション品質も高く、各画像に詳細なステップバイステップ説明を付与。文章精度は95%超を維持。明瞭で客観的な記述、誤字脱字なし、機微コンテンツ排除を実現。データ形式は画像が.jpg、注釈が.txt。 本データセットは、視覚言語モデルの学習や、料理画像キャプション生成、マルチモーダルレシピ理解アルゴリズム開発に最適。中日英バイリンガル対応の調理手順説明生成、AIGC料理コンテンツ作成、指示追従型料理アシスタント開発など、幅広い用途にご利用いただけます。 さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録料理種別・言語比率・説明文言語・アノテーション粒度などを柔軟に調整。独自性の高い料理関連マルチモーダルソリューション開発を、最適な学習データ基盤でサポートいたします。

料理 画像キャプション データセット レシピ 画像テキスト 教師データ 視覚言語モデル学習データ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

2298f5f6-6ad8-4edd-a821-675f4d746e57

73265a90-b6cd-4c5f-8cac-2e99f3f6dd40