[{"@type":"PropertyValue","name":"データ規模","value":"105,941枚のデータには、アジア言語系として、日本語9,997枚、韓国語10,231枚、インドネシア語7,591枚、マレー語5,650枚、ベトナム語8,822枚、タイ語9,645枚が含まれています。ヨーロッパ言語系としては、フランス語10,015枚、ドイツ語7,213枚、イタリア語8,824枚、ポルトガル語7,754枚、ロシア語10,376枚、スペイン語9,823枚が含まれています。"},{"@type":"PropertyValue","name":"収集環境","value":"店舗の看板、バス停標識、ポスター、乗車券、道路標識、漫画、マンホールの絵、案内表示、警告表示、包装説明、メニュー、建物のサインなどが含まれます。"},{"@type":"PropertyValue","name":"収集の多様性","value":"12種類の言語、多様な自然シーン、複数の撮影角度(仰角、俯角、水平)が含まれます。"},{"@type":"PropertyValue","name":"収集デバイス","value":"スマートフォン、カメラ"},{"@type":"PropertyValue","name":"画像パラメータ","value":"画像フォーマットは.jpg、アノテーションフォーマットは.jsonです"},{"@type":"PropertyValue","name":"アノテーション内容","value":"行単位の四角形アノテーション、行単位の内容で文字起こし"},{"@type":"PropertyValue","name":"正解率","value":"四角形バウンディングボックスの頂点の偏差が5ピクセル以内であれば正しい検出とみなし、検出ボックスの精度は97%以上とします。テキスト文字起こしの精度も97%以上とします"}]
{"id":1064,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"105,941枚12言語自然シーンOCRデータセット","datazy":[{"title":"データ規模","desc":"データ規模","content":"105,941枚のデータには、アジア言語系として、日本語9,997枚、韓国語10,231枚、インドネシア語7,591枚、マレー語5,650枚、ベトナム語8,822枚、タイ語9,645枚が含まれています。ヨーロッパ言語系としては、フランス語10,015枚、ドイツ語7,213枚、イタリア語8,824枚、ポルトガル語7,754枚、ロシア語10,376枚、スペイン語9,823枚が含まれています。"},{"title":"収集環境","desc":"収集環境","content":"店舗の看板、バス停標識、ポスター、乗車券、道路標識、漫画、マンホールの絵、案内表示、警告表示、包装説明、メニュー、建物のサインなどが含まれます。"},{"title":"収集の多様性","desc":"収集の多様性","content":"12種類の言語、多様な自然シーン、複数の撮影角度(仰角、俯角、水平)が含まれます。"},{"title":"収集デバイス","desc":"収集デバイス","content":"スマートフォン、カメラ"},{"title":"画像パラメータ","desc":"画像パラメータ","content":"画像フォーマットは.jpg、アノテーションフォーマットは.jsonです"},{"title":"アノテーション内容","desc":"アノテーション内容","content":"行単位の四角形アノテーション、行単位の内容で文字起こし"},{"title":"正解率","desc":"正解率","content":"四角形バウンディングボックスの頂点の偏差が5ピクセル以内であれば正しい検出とみなし、検出ボックスの精度は97%以上とします。テキスト文字起こしの精度も97%以上とします"}],"datatag":"12 languages,Multiple photographic angles,Multiple scenes,Line-level quadrilateral bounding box annotation and transcription","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=TafXJxAg8o5Kg%2BGun3KIiEjsu%2BU%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9arI65%2BOzsdy2xK7XZfBGqmQ2og%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FiYq03v6ZQCDTNsEE6fB5DmAkGk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"多言語対応のOCRシステムやグローバル文書自動処理の開発では、自然シーンに特化した高精度な文字認識データの確保が課題です。特に日本市場では、日本語を含むアジア言語と欧州言語を両方カバーする多言語シーンテキスト認識データセットや、実環境に近い屋外撮影データの需要が高まっています。弊社が提供する本データセットは、105,941枚の自然シーン画像を収録。対象言語は12言語。アジア言語6言語(日本語・韓国語・インドネシア語・マレー語・ベトナム語・タイ語)と欧州言語6言語(フランス語・ドイツ語・イタリア語・ポルトガル語・ロシア語・スペイン語)をバランスよく包括。収録環境は実用的な自然シーン中心です。店舗看板・道路標識・ポスター・チケット・漫画表紙・包装指示・メニュー・建物サインなど、多様な実環境を網羅。撮影アングルも見上げ・見下ろし・アイレベルの3種類に対応。アノテーションは高精度です。行レベルの四角形バウンディングボックスとテキスト転写を付与。頂点誤差は5ピクセル以内。バウンディングボックス精度・文字転写精度ともに97%超を確保。データ形式は画像が.jpg、注釈が.json。本データセットは、多言語シーンテキスト認識モデルの学習や、屋外文字検出アルゴリズム開発に最適。日本語OCR教師データ、韓国語・タイ語・東南アジア言語対応の自然シーン文字認識、グローバル展開を視野に入れたクロスランゲージOCR基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語・シーン種別・アノテーション粒度・データ形式などを柔軟に調整。GDPR/CCPA/PIPL準拠のプライバシー保護のもと、独自性の高い多言語OCRソリューション開発をサポートいたします。","dataexampl":null,"datakeyword":["自然シーンOCR教師データ","屋外文字検出学習データ","道路標識テキスト検出データ","OCRデータセット",""],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"105,941 Images Natural Scenes OCR Data of 12 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ieEtznzUAUiNqtvqirs%2F8uIwe8Y%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=TafXJxAg8o5Kg%2BGun3KIiEjsu%2BU%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9arI65%2BOzsdy2xK7XZfBGqmQ2og%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FiYq03v6ZQCDTNsEE6fB5DmAkGk%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ieEtznzUAUiNqtvqirs%2F8uIwe8Y%3D"}]
105,941枚12言語自然シーンOCRデータセット
自然シーンOCR教師データ
屋外文字検出学習データ
道路標識テキスト検出データ
OCRデータセット
多言語対応のOCRシステムやグローバル文書自動処理の開発では、自然シーンに特化した高精度な文字認識データの確保が課題です。特に日本市場では、日本語を含むアジア言語と欧州言語を両方カバーする多言語シーンテキスト認識データセットや、実環境に近い屋外撮影データの需要が高まっています。弊社が提供する本データセットは、105,941枚の自然シーン画像を収録。対象言語は12言語。アジア言語6言語(日本語・韓国語・インドネシア語・マレー語・ベトナム語・タイ語)と欧州言語6言語(フランス語・ドイツ語・イタリア語・ポルトガル語・ロシア語・スペイン語)をバランスよく包括。収録環境は実用的な自然シーン中心です。店舗看板・道路標識・ポスター・チケット・漫画表紙・包装指示・メニュー・建物サインなど、多様な実環境を網羅。撮影アングルも見上げ・見下ろし・アイレベルの3種類に対応。アノテーションは高精度です。行レベルの四角形バウンディングボックスとテキスト転写を付与。頂点誤差は5ピクセル以内。バウンディングボックス精度・文字転写精度ともに97%超を確保。データ形式は画像が.jpg、注釈が.json。本データセットは、多言語シーンテキスト認識モデルの学習や、屋外文字検出アルゴリズム開発に最適。日本語OCR教師データ、韓国語・タイ語・東南アジア言語対応の自然シーン文字認識、グローバル展開を視野に入れたクロスランゲージOCR基盤の整備など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録言語・シーン種別・アノテーション粒度・データ形式などを柔軟に調整。GDPR/CCPA/PIPL準拠のプライバシー保護のもと、独自性の高い多言語OCRソリューション開発をサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
105,941枚のデータには、アジア言語系として、日本語9,997枚、韓国語10,231枚、インドネシア語7,591枚、マレー語5,650枚、ベトナム語8,822枚、タイ語9,645枚が含まれています。ヨーロッパ言語系としては、フランス語10,015枚、ドイツ語7,213枚、イタリア語8,824枚、ポルトガル語7,754枚、ロシア語10,376枚、スペイン語9,823枚が含まれています。
収集環境
店舗の看板、バス停標識、ポスター、乗車券、道路標識、漫画、マンホールの絵、案内表示、警告表示、包装説明、メニュー、建物のサインなどが含まれます。
収集の多様性
12種類の言語、多様な自然シーン、複数の撮影角度(仰角、俯角、水平)が含まれます。
画像パラメータ
画像フォーマットは.jpg、アノテーションフォーマットは.jsonです
アノテーション内容
行単位の四角形アノテーション、行単位の内容で文字起こし
正解率
四角形バウンディングボックスの頂点の偏差が5ピクセル以内であれば正しい検出とみなし、検出ボックスの精度は97%以上とします。テキスト文字起こしの精度も97%以上とします
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語OCRデータは、どのような形式・内容で提供されていますか?

手書き文字、帳票、商品ラベル、看板、公共文書など、実際の業務・生活シーンを想定した多様なデータを提供しています。すべてのデータセットには、行レベル・文字レベルのバウンディングボックスとテキスト転写が含まれ、用途に応じて柔軟にご利用いただけます。各データには詳細な仕様書とサンプルも同梱しており、事前にデータの特徴や適用可能性をご確認いただけます。

英語・日本語など多言語混在の帳票データも収集できますか?

はい、可能です。日本、アメリカ、中国、韓国など主要国を含むグローバルパートナー網を活用し、お客様の指定する業種・地域・フォーマットの実在帳票を現地で収集します。収集と並行して、ネイティブスピーカーによる高精度なアノテーションを即時実施できる体制を整えており、多言語混在文書や業界特化フォーマットにも柔軟に対応します。

多言語や業界特化データにも対応していますか?

はい。日本語(標準語・方言含む)に加え、英語、中国語、韓国語など12言語以上の自然シーンOCRデータを提供しています。製造、物流、小売、金融、公共サービスなど業界別のデータ構成も可能で、お客様のユースケースに最適なデータセットを迅速にご提案・提供いたします。
691fd634-e744-4be7-b244-ec69818bf893