[{"@type":"PropertyValue","name":"データタイプ","value":"約150万件の英語理工系試験問題。データ形式はjsonl。英語テキストベースの構造化データ。"},{"@type":"PropertyValue","name":"対象レベル","value":"大学レベル。数学・物理学・化学・生物学など、STEM分野を包括的にカバー。"},{"@type":"PropertyValue","name":"構造化項目","value":"各問題にタイトル・正解・解析・科目・学年・問題形式の6項目を付与。数式は構造化形式に変換済み。表形式データも標準化処理済み。"},{"@type":"PropertyValue","name":"データ品質","value":"コンテンツクリーニング済み。大規模言語モデルの知識強化タスクや、専門分野の質問応答システム開発に最適な品質。"},{"@type":"PropertyValue","name":"活用シーン","value":"STEM分野LLMファインチューニング、学術的質問応答モデル構築、教育用AIアシスタント開発、英語理工系問題自動解析、数式処理対応知識強化、グローバル展開対応学術AI基盤整備に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。"}]
{"id":1881,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"227","type2str":null,"dataname":"150万件英語理工系試験問題データセット","datazy":[{"title":"データタイプ","content":"約150万件の英語理工系試験問題。データ形式はjsonl。英語テキストベースの構造化データ。"},{"title":"対象レベル","content":"大学レベル。数学・物理学・化学・生物学など、STEM分野を包括的にカバー。"},{"title":"構造化項目","content":"各問題にタイトル・正解・解析・科目・学年・問題形式の6項目を付与。数式は構造化形式に変換済み。表形式データも標準化処理済み。"},{"title":"データ品質","content":"コンテンツクリーニング済み。大規模言語モデルの知識強化タスクや、専門分野の質問応答システム開発に最適な品質。"},{"title":"活用シーン","content":"STEM分野LLMファインチューニング、学術的質問応答モデル構築、教育用AIアシスタント開発、英語理工系問題自動解析、数式処理対応知識強化、グローバル展開対応学術AI基盤整備に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"1.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20260115163218/1.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=G8vWOzpFilkvzhBgtK4A1vpHD%2F8%3D","intro":"","size":107946,"progress":100,"type":"jpg"},{"name":"2.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20260115163218/2.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gL9H8amJVFIfDWCYpyBfrtnwl2o%3D","intro":"","size":105841,"progress":100,"type":"jpg"}],"officialSummary":"現在、大規模言語モデルや教育テック開発では、大学レベルの専門知識を反映した高品質なSTEM問題データの確保が課題です。弊社が提供する本データセットは、約150万件の英語理工系試験問題を収録。対象は大学レベル。数学・物理学・化学・生物学など、STEM分野を包括的にカバーします。各問題には、タイトル・正解・解析・科目・学年・問題形式の6項目を付与。数式は構造化形式に変換済み。表形式データも標準化処理済み。コンテンツはクリーニング済みで、学習用として最適な品質を実現。データ形式はjsonl。英語テキストベースの構造化データです。大規模言語モデルの知識強化タスクや、専門分野の質問応答システム開発に最適です。本データセットは、STEM分野のLLMファインチューニングや、学術的質問応答モデルの構築、教育用AIアシスタント開発に最適。英語理工系問題の自動解析、数式処理対応の知識強化、グローバル展開を視野に入れた学術AI基盤の整備など、幅広い用途にご利用いただけます。開発企業の皆様。大学レベルの専門知識を高精度に学習可能な構造化データを活用し、モデルの学術的理解力を効率的に向上可能です。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録科目・問題形式・解析粒度・データ形式などを柔軟に調整。独自性の高いSTEM特化LLMソリューション開発を、最適な学習データ基盤でサポートいたします。","dataexampl":null,"datakeyword":["英語 STEM 教師データ","理工系 試験問題 データセット","LLM 学習データ 専門分野","構造化 QAデータセット"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"1.5 million - English Science And Engineering Test Questions Text Parsing And Processing Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20260115163218/1.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=G8vWOzpFilkvzhBgtK4A1vpHD%2F8%3D"},{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20260115163218/2.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gL9H8amJVFIfDWCYpyBfrtnwl2o%3D"}]
150万件英語理工系試験問題データセット
英語 STEM 教師データ
理工系 試験問題 データセット
LLM 学習データ 専門分野
構造化 QAデータセット
現在、大規模言語モデルや教育テック開発では、大学レベルの専門知識を反映した高品質なSTEM問題データの確保が課題です。弊社が提供する本データセットは、約150万件の英語理工系試験問題を収録。対象は大学レベル。数学・物理学・化学・生物学など、STEM分野を包括的にカバーします。各問題には、タイトル・正解・解析・科目・学年・問題形式の6項目を付与。数式は構造化形式に変換済み。表形式データも標準化処理済み。コンテンツはクリーニング済みで、学習用として最適な品質を実現。データ形式はjsonl。英語テキストベースの構造化データです。大規模言語モデルの知識強化タスクや、専門分野の質問応答システム開発に最適です。本データセットは、STEM分野のLLMファインチューニングや、学術的質問応答モデルの構築、教育用AIアシスタント開発に最適。英語理工系問題の自動解析、数式処理対応の知識強化、グローバル展開を視野に入れた学術AI基盤の整備など、幅広い用途にご利用いただけます。開発企業の皆様。大学レベルの専門知識を高精度に学習可能な構造化データを活用し、モデルの学術的理解力を効率的に向上可能です。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録科目・問題形式・解析粒度・データ形式などを柔軟に調整。独自性の高いSTEM特化LLMソリューション開発を、最適な学習データ基盤でサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データタイプ
約150万件の英語理工系試験問題。データ形式はjsonl。英語テキストベースの構造化データ。
対象レベル
大学レベル。数学・物理学・化学・生物学など、STEM分野を包括的にカバー。
構造化項目
各問題にタイトル・正解・解析・科目・学年・問題形式の6項目を付与。数式は構造化形式に変換済み。表形式データも標準化処理済み。
データ品質
コンテンツクリーニング済み。大規模言語モデルの知識強化タスクや、専門分野の質問応答システム開発に最適な品質。
活用シーン
STEM分野LLMファインチューニング、学術的質問応答モデル構築、教育用AIアシスタント開発、英語理工系問題自動解析、数式処理対応知識強化、グローバル展開対応学術AI基盤整備に最適。カスタマイズ対応により、独自ソリューション開発もサポートします。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。
b390966c-8d8c-4408-8598-069620e8d3b1