[{"@type":"PropertyValue","name":"データ規模","value":"20,011枚の画像、20,011件の記述"},{"@type":"PropertyValue","name":"言語分布","value":"アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語"},{"@type":"PropertyValue","name":"収集環境","value":"店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます"},{"@type":"PropertyValue","name":"収集の多様性","value":"14の言語、複数の自然シーン、複数の撮影アングルが含まれています"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像のフォーマットは.jpg、テキストのフォーマットは.txtです。"},{"@type":"PropertyValue","name":"収集設備","value":"スマホ、カメラ"},{"@type":"PropertyValue","name":"記述言語","value":"英語"},{"@type":"PropertyValue","name":"テキストの長さ","value":"原則として、30~60語、通常は3~5文で構成されます。"},{"@type":"PropertyValue","name":"主な記述内容","value":"テキスト配置、テキスト内容、色、シーン"},{"@type":"PropertyValue","name":"正確率","value":"97%以上の画像が正しくアノテーションされています。"}]
{"id":1288,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"20,011枚自然風景OCR記述データ","datazy":[{"title":"データ規模","desc":"データ規模","content":"20,011枚の画像、20,011件の記述"},{"title":"言語分布","desc":"言語分布","content":"アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語"},{"title":"収集環境","desc":"収集環境","content":"店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます"},{"title":"収集の多様性","desc":"収集の多様性","content":"14の言語、複数の自然シーン、複数の撮影アングルが含まれています"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像のフォーマットは.jpg、テキストのフォーマットは.txtです。"},{"title":"収集設備","desc":"収集設備","content":"スマホ、カメラ"},{"title":"記述言語","desc":"記述言語","content":"英語"},{"title":"テキストの長さ","desc":"テキストの長さ","content":"原則として、30~60語、通常は3~5文で構成されます。"},{"title":"主な記述内容","desc":"主な記述内容","content":"テキスト配置、テキスト内容、色、シーン"},{"title":"正確率","desc":"正確率","content":"97%以上の画像が正しくアノテーションされています。"}],"datatag":"AIGC,English caption,OCR caption,Multiple shooting angles,Multinational scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??10.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??6.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??7.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"現在、多言語対応のOCRシステムや画像キャプション生成モデルの開発では、自然シーンに特化した高精度な多言語テキスト認識データの確保が課題です。弊社が提供する本データセットは、20,011枚の自然シーン画像と英語キャプションを収録。対象言語は14言語。アジア7言語(日本語・韓国語・中国語・タイ語・ベトナム語・インドネシア語・マレー語)と欧州7言語(英語・仏・独・伊・西・葡・露)を包括。収録環境は実用的な自然シーン中心。店舗看板・道路標識・ポスター・停止標識・案内表示など、多様な実環境を網羅。スマートフォン・カメラで撮影。複数アングル・多様な照明条件に対応。アノテーションは高精度です。画像内のテキスト配置・内容・色・シーンを英語で記述。原則30〜60語・3〜5文の簡潔な説明文。正解ラベル率は97%超を保証。データ形式は画像が.jpg、注釈が.txt。本データセットは、自然シーンOCRモデルの学習や、多言語画像キャプション生成、画像テキスト検索システム開発に最適。AIGCコンテンツ作成、多言語対応画像理解、グローバル展開を視野に入れたOCR基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語・シーン種別・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い多言語OCRソリューション開発を、最適な学習データ基盤でサポートいたします。","dataexampl":null,"datakeyword":["多言語OCRデータ","多言語OCRデータ","OCRデータ","OCRデータセット","自然シーンOCR データセット","店舗看板 文字認識 学習データ","多言語画像キャプション教師データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"20,011 Image Caption Data of OCR in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??9.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D"}]
20,011枚自然風景OCR記述データ
多言語OCRデータ
多言語OCRデータ
OCRデータ
OCRデータセット
自然シーンOCR データセット
店舗看板 文字認識 学習データ
多言語画像キャプション教師データ
現在、多言語対応のOCRシステムや画像キャプション生成モデルの開発では、自然シーンに特化した高精度な多言語テキスト認識データの確保が課題です。弊社が提供する本データセットは、20,011枚の自然シーン画像と英語キャプションを収録。対象言語は14言語。アジア7言語(日本語・韓国語・中国語・タイ語・ベトナム語・インドネシア語・マレー語)と欧州7言語(英語・仏・独・伊・西・葡・露)を包括。収録環境は実用的な自然シーン中心。店舗看板・道路標識・ポスター・停止標識・案内表示など、多様な実環境を網羅。スマートフォン・カメラで撮影。複数アングル・多様な照明条件に対応。アノテーションは高精度です。画像内のテキスト配置・内容・色・シーンを英語で記述。原則30〜60語・3〜5文の簡潔な説明文。正解ラベル率は97%超を保証。データ形式は画像が.jpg、注釈が.txt。本データセットは、自然シーンOCRモデルの学習や、多言語画像キャプション生成、画像テキスト検索システム開発に最適。AIGCコンテンツ作成、多言語対応画像理解、グローバル展開を視野に入れたOCR基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語・シーン種別・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い多言語OCRソリューション開発を、最適な学習データ基盤でサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
20,011枚の画像、20,011件の記述
言語分布
アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語
収集環境
店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます
収集の多様性
14の言語、複数の自然シーン、複数の撮影アングルが含まれています
データフォーマット
画像のフォーマットは.jpg、テキストのフォーマットは.txtです。
テキストの長さ
原則として、30~60語、通常は3~5文で構成されます。
主な記述内容
テキスト配置、テキスト内容、色、シーン
正確率
97%以上の画像が正しくアノテーションされています。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。
b9d784b4-23c7-4209-8e6d-89d00b5a7381