[{"@type":"PropertyValue","name":"データタイプ","value":"204,522枚のテスト問題画像。収集デバイス:スキャナー・スマートフォン。データ形式:画像が.jpg、注釈が.json、数式/表が.tex(LaTeX形式)。"},{"@type":"PropertyValue","name":"学習領域","value":"小学校・中学校・高校・大学・職業教育など、幅広い教育段階をカバー。多科目一括対応。"},{"@type":"PropertyValue","name":"問題形式","value":"単一選択式・複数選択式・穴埋め・短答・記述式・図版付き問題など、実用的な設問タイプを網羅。"},{"@type":"PropertyValue","name":"アノテーション品質","value":"問題文・選択肢・解答・図版に対して、四角形バウンディングボックス+テキスト転写を付与。数式・表はLaTeX形式で高精度変換済み。"},{"@type":"PropertyValue","name":"活用シーン","value":"教育画像OCRモデル学習、自動採点システム開発、宿題チュータリングアプリ構築、多科目テスト問題認識、LaTeX数式変換、EdTechプラットフォーム整備に最適。GDPR/CCPA/PIPL準拠でプライバシー保護も万全。カスタマイズ対応により、独自ソリューション開発もサポートします。"}]
{"id":1574,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"204,522枚教育テスト問題画像OCRデータセット","datazy":[{"title":"データタイプ","content":"204,522枚のテスト問題画像。収集デバイス:スキャナー・スマートフォン。データ形式:画像が.jpg、注釈が.json、数式/表が.tex(LaTeX形式)。"},{"title":"学習領域","content":"小学校・中学校・高校・大学・職業教育など、幅広い教育段階をカバー。多科目一括対応。"},{"title":"問題形式","content":"単一選択式・複数選択式・穴埋め・短答・記述式・図版付き問題など、実用的な設問タイプを網羅。"},{"title":"アノテーション品質","content":"問題文・選択肢・解答・図版に対して、四角形バウンディングボックス+テキスト転写を付与。数式・表はLaTeX形式で高精度変換済み。"},{"title":"活用シーン","content":"教育画像OCRモデル学習、自動採点システム開発、宿題チュータリングアプリ構築、多科目テスト問題認識、LaTeX数式変換、EdTechプラットフォーム整備に最適。GDPR/CCPA/PIPL準拠でプライバシー保護も万全。カスタマイズ対応により、独自ソリューション開発もサポートします。"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[],"officialSummary":"現在、教育テックやAI採点システムの開発では、多様な科目・問題形式に対応した高精度なテスト問題画像データの確保が課題です。弊社が提供する本データセットは、204,522枚のテスト問題画像を収録。小学校・中学校・高校・大学・職業教育まで、幅広い学習領域をカバーします。収録問題形式は多岐にわたります。単一・複数選択式、穴埋め、短答、記述式、図版付き問題など、実用的な設問タイプを網羅。収集デバイスはスキャナーとスマートフォン。実環境での撮影バリエーションも確保。アノテーションは高精度です。問題文・選択肢・解答・図版に対して、四角形バウンディングボックスとテキスト転写を付与。数式・表はLaTeX形式で変換済み。データ形式は画像が.jpg、注釈が.json、数式が.tex。本データセットは、教育画像OCRモデルの学習や、自動採点システム・宿題チュータリングアプリ開発に最適。テスト問題認識、LaTeX数式変換、多科目一括処理、EdTechプラットフォーム構築など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録科目・問題形式・アノテーション粒度・データ形式などを柔軟に調整。GDPR/CCPA/PIPL準拠のプライバシー保護のもと、独自性の高い教育テックソリューション開発をサポートいたします。","dataexampl":null,"datakeyword":["教育 画像OCR データセット","試験問題 認識 教師データ","自動採点 システム 学習データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE,KO,FR,ES,JP\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"204, 522 Images – Test Paper VQA Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp
[]
204,522枚教育テスト問題画像OCRデータセット
教育 画像OCR データセット
試験問題 認識 教師データ
自動採点 システム 学習データ
現在、教育テックやAI採点システムの開発では、多様な科目・問題形式に対応した高精度なテスト問題画像データの確保が課題です。弊社が提供する本データセットは、204,522枚のテスト問題画像を収録。小学校・中学校・高校・大学・職業教育まで、幅広い学習領域をカバーします。収録問題形式は多岐にわたります。単一・複数選択式、穴埋め、短答、記述式、図版付き問題など、実用的な設問タイプを網羅。収集デバイスはスキャナーとスマートフォン。実環境での撮影バリエーションも確保。アノテーションは高精度です。問題文・選択肢・解答・図版に対して、四角形バウンディングボックスとテキスト転写を付与。数式・表はLaTeX形式で変換済み。データ形式は画像が.jpg、注釈が.json、数式が.tex。本データセットは、教育画像OCRモデルの学習や、自動採点システム・宿題チュータリングアプリ開発に最適。テスト問題認識、LaTeX数式変換、多科目一括処理、EdTechプラットフォーム構築など、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録科目・問題形式・アノテーション粒度・データ形式などを柔軟に調整。GDPR/CCPA/PIPL準拠のプライバシー保護のもと、独自性の高い教育テックソリューション開発をサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データタイプ
204,522枚のテスト問題画像。収集デバイス:スキャナー・スマートフォン。データ形式:画像が.jpg、注釈が.json、数式/表が.tex(LaTeX形式)。
学習領域
小学校・中学校・高校・大学・職業教育など、幅広い教育段階をカバー。多科目一括対応。
問題形式
単一選択式・複数選択式・穴埋め・短答・記述式・図版付き問題など、実用的な設問タイプを網羅。
アノテーション品質
問題文・選択肢・解答・図版に対して、四角形バウンディングボックス+テキスト転写を付与。数式・表はLaTeX形式で高精度変換済み。
活用シーン
教育画像OCRモデル学習、自動採点システム開発、宿題チュータリングアプリ構築、多科目テスト問題認識、LaTeX数式変換、EdTechプラットフォーム整備に最適。GDPR/CCPA/PIPL準拠でプライバシー保護も万全。カスタマイズ対応により、独自ソリューション開発もサポートします。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。
62d0c7f3-27dc-4d5d-880d-9beecdc0951f