[{"@type":"PropertyValue","name":"データ規模","value":"100万組の画像と説明"},{"@type":"PropertyValue","name":"画像タイプ","value":"風景、動物、花木、人物、車、スポーツ、工業、建築など多種のタイプを含む"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像フォーマットは.jpg、テキストフォーマットは.txt"},{"@type":"PropertyValue","name":"説明言語","value":"中国語、英語"},{"@type":"PropertyValue","name":"テキスト長","value":"原則として200字以上"},{"@type":"PropertyValue","name":"主要説明内容","value":"画像全体のシーン、シーン内の詳細説明、および画像が表現する感情"},{"@type":"PropertyValue","name":"正解率","value":"正しい説明の画像比率は95%以上"},{"@type":"PropertyValue","name":"画像解像度","value":"200万ピクセル以上、大部分は500万ピクセル以上"}]
{"id":1437,"datatype":"1","titleimg":"https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"240万セット英語中国語画像キャプションデータセット","datazy":[{"title":"データ規模","content":"100万組の画像と説明","desc":"データ規模"},{"title":"画像タイプ","content":"風景、動物、花木、人物、車、スポーツ、工業、建築など多種のタイプを含む","desc":"画像タイプ"},{"title":"データフォーマット","content":"画像フォーマットは.jpg、テキストフォーマットは.txt","desc":"データフォーマット"},{"title":"説明言語","content":"中国語、英語","desc":"説明言語"},{"title":"テキスト長","content":"原則として200字以上","desc":"テキスト長"},{"title":"主要説明内容","content":"画像全体のシーン、シーン内の詳細説明、および画像が表現する感情","desc":"主要説明内容"},{"title":"正解率","content":"正しい説明の画像比率は95%以上","desc":"正解率"},{"title":"画像解像度","content":"200万ピクセル以上、大部分は500万ピクセル以上","desc":"画像解像度"}],"datatag":"AIGC,English description,Chinese description,Multiple image categories,Multiple descriptions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/1.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/1.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZE1joqM%2Fkptv4wFRlMnRt1e3MEI%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/2.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/2.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=pTcoPbnWlmGDbmXot7NGi%2BnKy1I%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。","dataexampl":null,"datakeyword":["画像キャプションデータセット","画像テキストペア 教師データ","シーン理解 画像 教師データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"2,858,306 Pairs Image Caption Data Of General Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://nexdata.jp/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/1.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZE1joqM%2Fkptv4wFRlMnRt1e3MEI%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240731001_demo1733565600188/2.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=pTcoPbnWlmGDbmXot7NGi%2BnKy1I%3D"}]
240万セット英語中国語画像キャプションデータセット
画像キャプションデータセット
画像テキストペア 教師データ
シーン理解 画像 教師データ
弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
画像タイプ
風景、動物、花木、人物、車、スポーツ、工業、建築など多種のタイプを含む
データフォーマット
画像フォーマットは.jpg、テキストフォーマットは.txt
主要説明内容
画像全体のシーン、シーン内の詳細説明、および画像が表現する感情
画像解像度
200万ピクセル以上、大部分は500万ピクセル以上
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。
1cf31065-f504-4448-878d-be51713440a3