「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

カスタマーサービス

お問い合わせ

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

ホーム > 全てのデータセット > LLMデータセット > 20,011枚自然風景OCR記述データ

20,011枚自然風景OCR記述データ

多言語OCRデータ

多言語OCRデータ

OCRデータ

OCRデータセット

自然シーンOCR データセット

店舗看板文字認識学習データ

多言語画像キャプション教師データ

現在、多言語対応のOCRシステムや画像キャプション生成モデルの開発では、自然シーンに特化した高精度な多言語テキスト認識データの確保が課題です。弊社が提供する本データセットは、20,011枚の自然シーン画像と英語キャプションを収録。対象言語は14言語。アジア7言語（日本語・韓国語・中国語・タイ語・ベトナム語・インドネシア語・マレー語）と欧州7言語（英語・仏・独・伊・西・葡・露）を包括。収録環境は実用的な自然シーン中心。店舗看板・道路標識・ポスター・停止標識・案内表示など、多様な実環境を網羅。スマートフォン・カメラで撮影。複数アングル・多様な照明条件に対応。アノテーションは高精度です。画像内のテキスト配置・内容・色・シーンを英語で記述。原則30〜60語・3〜5文の簡潔な説明文。正解ラベル率は97%超を保証。データ形式は画像が.jpg、注釈が.txt。本データセットは、自然シーンOCRモデルの学習や、多言語画像キャプション生成、画像テキスト検索システム開発に最適。AIGCコンテンツ作成、多言語対応画像理解、グローバル展開を視野に入れたOCR基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語・シーン種別・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い多言語OCRソリューション開発を、最適な学習データ基盤でサポートいたします。

このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。

データ仕様

データ規模

20,011枚の画像、20,011件の記述

言語分布

アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語

収集環境

店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます

収集の多様性

14の言語、複数の自然シーン、複数の撮影アングルが含まれています

データフォーマット

画像のフォーマットは.jpg、テキストのフォーマットは.txtです。

収集設備

スマホ、カメラ

記述言語

英語

テキストの長さ

原則として、30～60語、通常は3～5文で構成されます。

主な記述内容

テキスト配置、テキスト内容、色、シーン

正確率

97%以上の画像が正しくアノテーションされています。

サンプル

サンプル

おすすめデータセット

おすすめデータセット

151万セット画像編集インストラクションデータセット

現在、生成AIや画像編集モデルの開発では、多様な編集指示に高精度で応答できるインストラクションベース画像編集データの確保が課題です。特に日本語対応の生成AI教師データセットや、ピクセルレベル編集注釈付きの画像合成学習データへの需要が急増しています。弊社が提供する本データセットは、151万セットの高品質な画像編集ペアを収録。対象ターゲットは人物（クローズアップ・半身・全身）をはじめ、動物・商品・植物・建物・風景・旅行写真・家庭シーンなど、実用的な画像カテゴリを幅広くカバーします。編集タイプは5種類。人物・物体の一貫性編集50万セット、構造的編集30万セット、複合編集21万セット、空間編集45万セット、スタイル転送編集5万セット。多様な編集ニーズに対応可能です。収録条件は高品質です。画像解像度は2K以上を保証。データ形式は画像が.jpg/.jpeg/.png、編集指示テキストが.txt。アノテーションは編集指示に従ったピクセルレベル編集を実施。精度保証も万全です。編集済みデータの適合率は97%超。編集対象と元対象のエッジ誤差は5ピクセル以内を維持。生成モデルの学習用として最適な品質を実現。本データセットは、画像合成モデルの学習や、データ拡張・仮想シーン生成アルゴリズム開発に最適。生成AI教師データセット、インストラクションベース画像編集学習、テキスト指示対応画像生成、マルチモーダルAI開発など、幅広い用途にご利用いただけます。多様な編集指示に高精度で応答する画像生成モデルを、効率的に実装可能です。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録ターゲット種別・編集タイプ・アノテーション粒度・データ形式などを柔軟に調整。独自性の高い生成AIソリューション開発を、最適な学習データ基盤でサポートいたします。

生成AI教師データ画像編集画像編集インストラクションデータセット画像合成学習データ生成モデル

20万件国際ランドマーク画像キャプションデータセット

弊社が提供する本データセットは、20万件のランドマーク画像テキストペアを収録。国内ランドマーク8万件、海外ランドマーク12万件をバランスよく包括。対象国は米国・英国・仏・独・露など20カ国以上を網羅します。収録ランドマークは多様です。商業ビル・古代建築・記念碑・図書館・観光名所など、多様な建築種別をカバー。各ランドマークには1〜10枚の画像を収録。異なるアングル・距離・時間帯からの撮影データを含むため、実環境での汎化性能向上に貢献します。アノテーションは高精度です。ランドマークの国・都市・所在地・分類・説明文を付与。ランドマーク情報の精度・説明文の精度ともに97%超を保証。データ形式は画像が.jpg、注釈が.json。本データセットは、ランドマーク認識モデルの学習や、多言語画像キャプション生成、画像テキスト検索システム開発に最適。観光アプリ開発、文化遺産デジタルアーカイブ、グローバル展開を視野に入れた画像理解基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録国・建築種別・言語比率・アノテーション粒度などを柔軟に調整。独自性の高いランドマーク認識ソリューション開発を、最適な学習データ基盤でサポートいたします。

ランドマーク画像データセット観光名所認識教師データ画像キャプション生成学習データ多言語画像認識データセット世界遺産認識教師データ建築画像分類データセット

20,846セット料理画像キャプションデータ

20,846グループのレシピ画像テキストペアを収録。各レシピには4〜18枚の工程画像が含まれ、それぞれに詳細な手順説明が付属します。収録料理は多国籍です。中国料理・西洋料理・韓国料理・日本料理など、多様な食文化を網羅。説明文は中国語（15語以上）と英語（30語以上）のバイリンガル対応。画像解像度は原則200万ピクセル以上を保証。アノテーション品質も高く、各画像に詳細なステップバイステップ説明を付与。文章精度は95%超を維持。明瞭で客観的な記述、誤字脱字なし、機微コンテンツ排除を実現。データ形式は画像が.jpg、注釈が.txt。本データセットは、視覚言語モデルの学習や、料理画像キャプション生成、マルチモーダルレシピ理解アルゴリズム開発に最適。中日英バイリンガル対応の調理手順説明生成、AIGC料理コンテンツ作成、指示追従型料理アシスタント開発など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録料理種別・言語比率・説明文言語・アノテーション粒度などを柔軟に調整。独自性の高い料理関連マルチモーダルソリューション開発を、最適な学習データ基盤でサポートいたします。

料理画像キャプションデータセットレシピ画像テキスト教師データ視覚言語モデル学習データ

204,522枚教育テスト問題画像OCRデータセット

現在、教育テックやAI採点システムの開発では、多様な科目・問題形式に対応した高精度なテスト問題画像データの確保が課題です。弊社が提供する本データセットは、204,522枚のテスト問題画像を収録。小学校・中学校・高校・大学・職業教育まで、幅広い学習領域をカバーします。収録問題形式は多岐にわたります。単一・複数選択式、穴埋め、短答、記述式、図版付き問題など、実用的な設問タイプを網羅。収集デバイスはスキャナーとスマートフォン。実環境での撮影バリエーションも確保。アノテーションは高精度です。問題文・選択肢・解答・図版に対して、四角形バウンディングボックスとテキスト転写を付与。数式・表はLaTeX形式で変換済み。データ形式は画像が.jpg、注釈が.json、数式が.tex。本データセットは、教育画像OCRモデルの学習や、自動採点システム・宿題チュータリングアプリ開発に最適。テスト問題認識、LaTeX数式変換、多科目一括処理、EdTechプラットフォーム構築など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録科目・問題形式・アノテーション粒度・データ形式などを柔軟に調整。GDPR/CCPA/PIPL準拠のプライバシー保護のもと、独自性の高い教育テックソリューション開発をサポートいたします。

教育画像OCR データセット試験問題認識教師データ自動採点システム学習データ

ご要望をご相談ください

プロジェクトの成熟度

初期検討段階（具体的な仕様は未定）

目標は明確だが、専門的な支援が必要

開発中または最適化フェーズ

データ／アノテーションの専門チーム（明確な仕様あり）

フルネーム *

電話番号*

会社名 *

ビジネスメール *

データ要件 *

プライバシー保護に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか？

Nexdata の LLM データセットには、指示追従型（SFT）、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか？

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか？カスタマイズは可能ですか？

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

ニュースレターを購読する

AI学習用データ製品: 全てのデータセット; フィジカルAIデータセット; LLMデータセット; 画像・動画データセット; 音声認識データセット; 音声合成データセット; OCRデータセット; 発音辞書データセット; 自然言語理解データセット

データサービス: 3D点群データ; ストリートビューデータ; OCRデータ; 行動識別データ; ID識別データ; 音声認識データ; 音声合成データ; マルチモーダルデータ

活用事例: エンボディドAI; 生成AI; 自動運転; 製造業; チャットボット; AR/VR; スマートホーム; リテール; ヘルスケア

企業情報: 運営会社; 資料ダウンロード; お役立ち情報; パートナー; データセキュリティ; イベント
リンク: OPENMPD; DataPlus; Datarade

プラットフォーム: プラットフォーム
コンテスト: コンテスト
リソース: オープンデータセット

より高品質なデータでより高精度なAIを構築

0362568911

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

サイドマップ利用規約

当社は、お客様のブラウジング体験を向上させ、パーソナライズされた広告やコンテンツを提供し、当社のトラフィックを分析するためにクッキーを使用します。「すべてを受け入れる」をクリックすると、クッキーの使用に同意したことになります。

2bcc1e86-c979-4863-abd6-3eb473a33b1f

a06ce46c-7e79-445c-88f4-e7909c812e38