「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

世界のAI大手企業、ベンチャー企業・スタートアップ、大学研究機関から信頼されます。

  • Baidu
  • Tsinghua University
  • iFlytek
  • Microsoft
  • Tencent
  • Shopee
  • NVIDIA
  • Deepmotion
  • AWS
  • Meta
  • Google
  • Intel
  • Qualcomm
  • SAMSUNG

マルチモーダル生成AIデータマップ

Nexdataは、テキスト、ビジョン、動画、オーディオ、3D、フィジカルAIドメインにわたる基盤モデルを、事前学習からファインチューニング、アライメント、評価まで一貫して支援します。あらゆる段階での信頼性の高い生成AI開発を加速します。

マルチモーダル生成AIデータマップ マルチモーダル生成AIデータマップ

生成AIカスタマイズ
サービス

Nexdataは、プロジェクトの実施、管理、人間と機械のインタラクティブデータプラットフォームにおける豊富な経験を生かし、教師なし学習データ収集・クリーニング、検証サービスだけでなく、教師あり学習向けカスタマイズデータサービスも提供しています。

マルチモーダルデータ

マルチモーダルデータ

ビジョン、動画、音声、テキスト、クロスモーダルインストラクション領域を網羅する包括的なデータセットを提供、最先端の生成AIシステム開発を強力に支援します。

テキストデータ

テキストデータ

小学から高校までの全科目と1,500以上の全版教科書をカバー。

パラレルコーパスデータ

パラレルコーパスデータ

2億組以上の大規模パラレルコーパスで、多言語翻訳をサポートしています。

教師ありファインチューニング(SFT)データ

教師ありファインチューニング(SFT)データ

モデルの推論力や複雑な指示への対応力、そして微妙なニュアンスの検知精度を高めるために、25万件のQ&Aペアを含む指示追従型データセットを提供しています。

ドメイン特化型データ

ドメイン特化型データ

金融・ヘルスケア・法務などの業界ニーズに合わせてカスタマイズしたデータセットにより、専門タスクにおけるモデル性能を向上させます。

ナレッジグラフ/構造化データ

ナレッジグラフ/構造化データ

モデルの推論力、エンティティ理解、情報検索能力を強化するための構造化データセットおよびナレッジグラフを提供します。

人間のフィードバックによる強化学習

人間のフィードバックによる強化学習

SFTで学習されたモデルによって生成された複数の結果に対して、ルールに従って手動でランキングと多要素スコアリングを行います。

レッドチーミング

レッドチーミング

不正確な情報(幻想)、有害なコンテンツ、虚偽の情報、差別、言語の偏りなどの観点から、お客様がモデルの問題を発見するお手伝いをします。

経験による評価

経験による評価

Nexdataの専門的なベンチマーキングと評価サービスは、貴社のモデル性能に関するエンドユーザの認識について重要な洞察を得るのに役立ちます。

コンプライアンスと
セキュリティ

Nexdataは、データセキュリティと顧客の信頼を最大限に重視しています。当社は個人情報保護法、GDPR、CCPA、PIPC、HIPAA規制に従っています。また、セキュリティと規制遵守のためにISO 27001、ISO 27701、ISO 9001の資格を取得しています。Nexdataは卓越したデータセキュリティを提供し、様々な国際的標準を遵守することで顧客の信頼を得ています。

GDPR
GDPR
CCPA
CCPA
SOC2
SOC2
ISO27701
ISO27701
ISO27001
ISO27001
ISO9001
ISO9001

Nexdataにより
迅速に信頼性高いAIを導入

Nexdataは、パイプラインによるアノテーションワークフローのコントロールを徹底しています。
AIプロジェクトを5倍スピードアップします。

ケーススタディ

大規模画像説明文の検証・修正
  • 事例:大規模画像説明文の検証・修正
  • 課題:お客様が保有する50万枚の自動生成画像説明文に、認識誤差や複雑なシーン起因の不正確・不完全な記述が含まれていた。
  • 解決策:構造化された品質管理とサンプリング検査により、50万件の画像説明文を全量検証・修正。高精度な修正アノテーションに加え、「共通課題分析レポート」と技術最適化提言を納品し月間30万件の画像説明文修正を達成しお客様のデータ処理コスト削減に貢献しました。
生成AI向け画像編集データセットの構築
  • 事例:生成AI向け画像編集データセットの構築
  • 課題:生成AI学習向けに、多様な編集タイプとシーンをカバーし、高い視覚的一貫性とピクセルレベルの精度を備えた大規模・高品質な画像編集データセットが必要とされました。
  • 解決策:アイデンティティ一貫性、構造化、ハイブリッド、空間、スタイル転送など多様な編集タイプに対応し、単一画像および複数画像融合を含む150万件以上の画像編集データペアを収集・作成しました。2K以上の解像度、ピクセルレベルの編集精度、97%以上のアノテーション精度を確保し、画像合成やデータ拡張などのアプリケーションを強力に支援しました。
教師なしデータクリーニング
  • 事例:教師なしデータクリーニング
  • 課題:お客様は有名な大手モデル開発会社です。Nexdataが、様々なフォーマットやレイアウトを持つ1,000万件のPDF論文の解析を依頼しました。
  • ソリューション:Nexdataは1,000万件の異なるフォーマットやレイアウトのPDF論文を解析し、高品質な教師なしデータを作成しました。
基盤モデル強化学習データアノテーション
  • 事例:基盤モデル強化学習データアノテーション
  • 課題:お客様は有名な上場AI企業で、LLM強化学習アルゴリズムを強化することを望んでいました。
  • ソリューション:Nexdataは、ユーザからの質問と出力にアノテーションを付け、同じスコアで出力を振り分けました。1週間の立ち上げ期間で、250人のアノテーターを選定・トレーニングし、わずか6ヶ月で500万件のデータと100万件のRLHFタスクのアノテーションを実現しました。
マルチモーダルデータアノテーション
  • 事例:マルチモーダルデータアノテーション
  • 課題:お客様は、家庭と企業の炭素管理に焦点を当てた革新的なハイテク企業で、独自のLLMを開発していました。
  • ソリューション:お客様は、LLMモデルによって生成されたラベル付けマルチモーダルデータを提供。Nexdataは、画像キャプションや画像オブジェクト検出のためのBboxなどのラベルを手作業でレビューし、アノテーション作業を支援しました。
Nexdata アノテーションツールのトライアルはこちら

音声、画像、ビデオ、点群、テキストデータなどあらゆるアノテーションに対応。

おすすめデータセット

240万セット英語中国語画像キャプションデータセット

弊社が提供する本データセットは、240万セットの画像テキストペアを収録。画像カテゴリは風景・動物・花・人物・車両・スポーツ・産業・建築など多岐にわたり、美的価値の高いサブセットも包括。各画像には英語と中国語の両方で記述されたキャプションが付属します。説明文の品質も高く、原則200文字以上の詳細な記述を収録。画像の全体シーン理解、要素の詳細描写、感情コンテキストの3層構造で構成。画像解像度は200万ピクセル以上、多くは500万ピクセル超の高解像度を保証。アノテーション精度は95%超を維持。データ形式は画像が.jpg、テキストが.txt。学習用として最適な品質を実現。本データセットは、画像キャプション生成モデルの学習や、マルチモーダル大規模言語モデル開発、シーン理解アルゴリズム構築に最適。英語中国語バイリンガル対応の画像説明文生成、感情分析付き画像理解、グローバル展開を視野に入れたマルチモーダルAI基盤の整備など、幅広い用途にご利用いただけます。お客様の開発要件に合わせてカスタマイズ対応も可能。収録カテゴリ・言語比率・説明文長さ・アノテーション粒度などを柔軟に調整。独自性の高い画像キャプション生成ソリューション開発を、最適な学習データ基盤でサポートいたします。

画像キャプションデータセット 画像テキストペア 教師データ シーン理解 画像 教師データ

Nexdataが選ばれる理由

ワンストップデータサービス

ワンストップデータサービス

Nexdata.aiは、幅広いデータ
アノテーションと収集サービスを提供し
お客様のAIプロジェクトを成功に導きます。

データQAシステム

データQAシステム

Nexdataは、インテリジェントな自己検査、
複数の品質チェックとISO9001認証により、
高品質なデータをお届けします。

豊富なアノテーションツール

豊富なアノテーションツール

30種類の実績あるアノテーションツール
音声、画像、ビデオ、3D点群、テキストなど
データアノテーションの要件を完全にカバーします。

コンプライアンスとセキュリティ

コンプライアンスとセキュリティ

個人情報保護法、
GDPR、ISO27001/ISO27701に
準拠しています。

AIによる事前認識

AIによる事前認識

AIによる事前認識機能により、
人間とコンピュータの協同による
半自動アノテーションを実現します。

データソリューションの詳細はこちら

2983297a-349c-4c58-ab8a-b658b394de26