レイチェル、ゴールデンファイナンス
AIデータタギングのようなタスクは、世界的な低コストの労働力と、地理的制約を打破するための暗号通貨を介した即時決済の助けを借りて、ブロックチェーンを介して行われるのが理想的だと、Zhao Changpeng氏は11月27日のXへの投稿で述べた。
データタギングとは、生データ(テキスト、画像、音声など)に手動または自動でラベルを付け、特定の構造化情報を与えることを指す。ラベル付けされたデータは、機械学習やAIモデルの学習に使用されます。たとえば、テキストにセンチメントカテゴリ(肯定、否定、中立)のラベルを付けることは、データラベル付けの一種です。AIデータのラベリングにブロックチェーンを使用することは、高い透明性、信頼性、分散コラボレーションを必要とするデータラベリングシナリオに特に適している。これは、データラベリングの効率と質を向上させるだけでなく、グローバルなコラボレーションやデータ取引の新たな可能性も生み出します。
現在、このトラックではどのような質の高いプロジェクトが行われているのでしょうか?また、同トラックの発展にはどのような展望がありますか?
AIデータタグ付けにおけるブロックチェーンの役割
ブロックチェーンは、透明性、不変性、、を備えた分散型の分散台帳技術です。、不変性、追跡可能性を持つ分散型台帳技術です。
データの真正性と改ざん防止:タグ付けされた記録は毎回ブロックチェーンに書き込まれるため、恣意的に改ざんされることはなく、タグ付けの信頼性が保証されます。
タスク割り当ての透明性:ブロックチェーンは、タスクの配布、実行、レビュープロセスを記録することができ、不公平なタスク割り当てや結果の改ざんを防ぐことができます。
インセンティブ:ブロックチェーンのスマートコントラクト技術を使用することで、データアノテーターはタスクを完了することで暗号通貨やその他の報酬を自動的に受け取ることができます。
データのトレーサビリティ:各タグのソース、注釈者、レビュアーを追跡できます。
応用シナリオ
Distributed Markup(分散マークアップ):ブロックチェーンを使用することで、データ注釈のタスクがブロックチェーンに分散されます。データ注釈タスクを世界中の注釈者に分散し、より効率的なデータ処理を実現する。
品質監査:複数人による注釈の結果は、ブロックチェーン技術を通じて比較・監査され、注釈の正確性が保証される。
ラベリングされたデータの取引:ラベリングされたデータはブロックチェーン上で取引でき、買い手と売り手はデータの完全性や真正性を心配する必要がありません。
プライバシー保護:ブロックチェーンを使用したラベル付きデータの暗号化された保存は、プライベートデータのセキュリティを保証します。
関連プロジェクト
プロジェクト・トークンの経済モデルは以下の通りです:
コミュニティの報酬:ユーザーは、データのラベリングや分析に参加することで、$OORTトークンで報酬を得ることができます。さらに、年率利回り(APY)報酬の増加、デバイスの割引、DAOの投票権などの追加特典を提供する貢献と結びついた独自のNFTを獲得できる可能性があります。
ミッションの担保:参加者は、ミッションへのコミットメントを示すために、最低210ドルのOORTトークンを誓約する必要があります。
販売収入のシェア:一部のNFT保有者は、将来のデータ販売収入のシェアも受け取ることができ、長期的な収益がさらに向上します。
プロジェクト・トークンの経済モデルは以下の通りです:
コミュニティ報酬:パブリック・トークンの10%は、ユーザーの事前交流に対するエアドロップ報酬に使用されます。エアドロップを得るには、AI Builderになる:高品質のインターネットコンテンツを収集する、AI Validatorになる:収集したコンテンツを検証する、AI Developerになる:検証済みのデータセットでAIエージェントを訓練する、の3つの方法があります。
トークンの配布:プロジェクトは、2024年1月に、IOBCキャピタル、Foresight Ventures、Solana Foundation、Everlana Venturesを含む投資家から、200万ドルのシードラウンドの資金調達を完了しました。PublicAIのトークン配布の詳細はまだ明らかになっていません。
課題
現在、いくつかの要因がこのトラックの開発を制約している。第1に、AIデータのタグ付けには高いコンピューティングとストレージのリソースが必要であること、第2に、ブロックチェーンのスケーラビリティによってプロジェクトのパフォーマンスが制約されること、第3に、技術の標準化と規制がまだ完全ではないことだ。不完全です。
2つ目の点は、おそらく現在私たちが直面している最大の課題です。というのも、AIのデータタギングとモデルトレーニングは通常、多くのコンピューティングリソースを必要とし、ブロックチェーンネットワークのノードのコンピューティングパワーには限りがあるからだ。ブロックチェーンの分散性を確保するという前提の下で、AIデータタギング・プロジェクトの計算ニーズを満たすために分散コンピューティング・リソースをどのように効果的に統合・利用するかは、解決すべき問題である。コイン社の子会社であるグリーンフィールド社がこのトラックにストレージのサポートを提供していることが報告されており、この分野ではより多くのストレージとコンピューティングリソースが実用化されることが期待される。