著者:Paul Veradittakit, Partner, Pantera Capital; Translated by Golden Finance xiaozou
Summary:
イノベーションとスケール効果により、手頃な価格で効率的かつ多用途な人型ロボットが誕生しています。
倉庫ロボットが消費者向けロボット市場に拡大する中、ロボットの安全性、資金調達、評価の仕組みは深く調査されるに値する。
暗号技術は、ロボットの安全性を経済的に保証し、ドッキングインフラ、待ち時間、データ収集プロセスを最適化することで、ロボット産業を牽引するでしょう。
ChatGPTは、AIに対する人間の認識の期待を完全に塗り替えます。大きな言語モデルが外部のソフトウェア世界と対話し始めたとき、多くの人がAIのインテリジェンスが究極の形だと思い込んでいた。しかし、『スター・ウォーズ』や『ブレードランナー』、『ロボコップ』のような古典的なSF映画を振り返ってみれば、人間が本当に夢見ていたのは、物理的な世界での相互作用を可能にするためにロボットのような形をとることができるAIだったことがわかるはずです。
Pantera Capitalの見解では、ロボット工学における「ChatGPTの瞬間」がやってきます。まず、ここ数年の人工知能の飛躍的な進歩が業界の状況をどのように変えたかを分析し、次にバッテリー技術、待ち時間の最適化、データ収集の改善がどのように未来を形作るのか、そしてその中での暗号の役割について見ていきます。最後に、ロボットの安全性、資金調達、評価、教育が注目すべき重要な分野であると考える理由を説明します。
1・変化の要素
(1) 人工知能のブレークスルー
マルチモーダルなビッグ・ランゲージ
マルチモーダルなビッグ・ランゲージ。モデリングの進歩は、ロボットに複雑なタスクを実行するために必要な「頭脳」を与えている。ロボットは主に視覚と聴覚の2つの感覚を通して環境を認識します。
畳み込みニューラルネットワークのような従来のコンピュータビジョンモデルは、オブジェクトの検出や分類タスクは得意ですが、視覚情報を目的のある行動指示に変換することは困難です。大規模な言語モデルは、テキストの理解や生成に優れていますが、物理的な世界を認識する能力には限界があります。
Vision-Language-Action (VLA)モデルにより、ロボットは視覚認識、言語理解、物理的行動を統一された計算フレームワークで統合することができます。2025年2月、Figure AIは汎用ヒューマノイドロボット制御モデルHelixをリリースしました。このモデルは、ゼロサンプル汎化機能とデュアルシステム1/システム2アーキテクチャにより、業界に新たなベンチマークを設定します。ゼロサンプル汎化機能により、ロボットはタスクごとにトレーニングを繰り返すことなく、新しいシナリオ、オブジェクト、コマンドに即座に適応することができます。システム1/システム2アーキテクチャは、高水準の推論と軽量の推論を分離し、人間のような思考とリアルタイムの精度を兼ね備えた市販のヒューマノイドロボットを可能にします。
(2)手頃な価格のロボット工学が現実に
世界を変えたテクノロジーには、「ユビキタス性」という共通の特徴があります。スマートフォン、パーソナルコンピュータ、3Dプリント技術はすべて、中間層が手に入れやすい価格によってユビキタスを実現した。Unitree G1のようなロボットの価格が、ホンダのアコードセダンやアメリカの最低年収34,000ドルよりも安いのであれば、手作業や日常的な作業の大部分がロボットによって行われる世界を想像しても不思議ではない。
<
(3)倉庫から消費者市場へ
ロボティクスは倉庫ソリューションから消費者空間へと拡大しています。世界は人間のために設計された。人間はプロのロボットができる仕事はすべてできるが、プロのロボットは人間ができる仕事はすべてできない。ロボット工学企業は、もはや工場専用ロボットの製造に限定されることなく、より汎用性の高い人型ロボットを開発している。そのため、ロボット工学の最前線は倉庫に存在するだけでなく、日常生活に浸透していくだろう。
コストはスケーラビリティの主なボトルネックの1つです。これは、トレーニングや充電にかかる時間、タスク実行にかかるコスト、ロボット取得にかかるコストの合計を、ロボットが稼働している総時間数で割ったものです。競争力を持つためには、このコストは関連業界の平均賃金よりも低くする必要があります。

競争力を高めるには、このコストを関連業界の平均賃金よりも低くする必要があります。/p>
倉庫スペースに完全に浸透するには、ロボットのコストを合わせて1時間あたり31.39ドル以下にする必要があります。また、最大の消費者向け市場である民間の教育・医療サービスでは、そのコストを35.18ドル以下に抑える必要があります。ロボットは現在、より安く、より効率的で、より汎用性の高い方向に向かっている。
2ロボット工学における次のブレークスルー
(1)バッテリーの最適化
バッテリー技術は常にボトルネックでした。技術は、常にユーザーフレンドリーなロボットのボトルネックとなってきた。BMW i3のような初期の電気自動車は、航続距離の短さ、コストの高さ、実用性の低さをもたらしたバッテリー技術の限界により、人気を得るのに苦労しましたが、ロボットも同じジレンマに直面しています。ボストン・ダイナミクスのロボット「スポット」は1回の充電で90分しか持たず、「ユニトリーG1」のバッテリー持続時間は約2時間だ。ユーザーは明らかに、2時間ごとに手動でバッテリーを充電したくないため、自律充電とドッキング・インフラが開発の重要な焦点となっている。現在、ロボットの充電には、バッテリー交換と直接充電の2つの主なモードがある。
バッテリー交換モードは、連続運転のために消耗したバッテリーパックを素早く交換することで、ダウンタイムを最小限に抑えるもので、現場や工場のシナリオに適しています。このプロセスは手動または自動で行うことができます。
誘導充電はワイヤレス電力を使用するため、完全な充電には時間がかかりますが、プロセスの完全自動化は容易です。
(2)遅延の最適化
低遅延操作は、環境感知と遠隔操作の2つのカテゴリに分けることができます。知覚とは、ロボットが環境を空間的に認識することを指し、遠隔操作とは、特に人間のオペレーターによるリアルタイムの制御を指します。
チントリーニの研究によると、ロボットの知覚システムは安価なセンサーから始まりますが、技術的な堀は融合ソフトウェア、低電力コンピューティング、ミリ秒精度の制御ループにあります。ロボットが空間定位を完了すると、軽量ニューラルネットワークが障害物、パレット、人間などの要素にタグを付ける。シーン・ラベルはプランニング・システムに入力され、足、ホイールセット、ロボットアームに送られるモーター・コマンドが即座に生成される。50ミリ秒未満の感覚的待ち時間は、人間の反射速度に相当します - この閾値を超える待ち時間は、不器用なロボットの動きにつながります。そのため、意思決定の90%は、単一の視覚-言語-行動ネットワークを通じて局所的に行われる必要があります。
完全自律型ロボットは、高性能VLAモデルの待ち時間が50ミリ秒以下であることを保証する必要があり、遠隔操作ロボットは、オペレータとロボット間の信号遅延が50ミリ秒以下であることを保証する必要があります。視覚入力とテキスト入力が別々のモデルで処理され、大規模な言語モデルに供給される場合、全体的な待ち時間は50ミリ秒のしきい値をはるかに超えることになります。
(3)データ収集の最適化
データを収集する主な方法は3つあります:実世界のビデオデータ、合成データ、テレプレゼンスデータです。実世界データと合成データの間の核となるボトルネックは、ロボットの物理的挙動とビデオ/シミュレーション・モデルの間のギャップを埋めることです。現実的なビデオデータには、力のフィードバック、関節運動の誤差、材料の変形などの物理的な詳細が欠けており、シミュレーションデータには、センサーの故障や摩擦係数などの予測不可能な変数が欠けています。
データ収集の最も有望な方法は遠隔操作で、人間のオペレーターがロボットを遠隔操作してタスクを実行します。しかし、マンパワーのコストは、遠隔操作によるデータ収集の大きな制約となっています。
カスタムハードウェアの開発も、高品質なデータ収集への新たなアプローチを提供しています。Meckaは、主流の手法とカスタムハードウェアを組み合わせて、多次元の人間の動作データを取得し、ロボットのニューラルネットワークのトレーニングに適したデータセットに処理し、高速反復サイクルと組み合わせて、AIロボットのトレーニングに大量の高品質データを提供しています。これらのテクノロジー・パイプラインを併用することで、生データから配備可能なロボットへの変換パスを短縮することができます。
3, 探究の主要分野
(1) 暗号とロボティクスの融合
暗号は、ロボットネットワークの効率を向上させるために、信頼されていない当事者にインセンティブを与えることができる。前のセクションで説明した重要な分野に基づき、暗号はドッキングインフラ、待ち時間の最適化、データ収集の3つの分野で効率を改善できると考えています。
分散型物理インフラネットワーク(DePIN)は、充電インフラに革命を起こすことを約束します。ヒューマノイドロボットは自動車のように世界規模で動作するため、充電ステーションはガソリンスタンドのようにアクセスしやすくする必要があります。集中型ネットワークは莫大な先行投資を必要としますが、DePINはノード運営者にコストを分散するため、充電設備をより多くの地域に急速に拡大することができます。
DePINはまた、分散型インフラを活用して、リモート処理の待ち時間を最適化します。地理的に分散したエッジノードのコンピューティングリソースを集約することで、遠隔制御コマンドをローカルまたは最近利用可能になったノードで処理することができ、データ伝送距離を最小限に抑え、通信待ち時間を大幅に短縮することができます。しかし、現在のDePINプロジェクトは、分散型ストレージ、コンテンツ配信、帯域幅共有に焦点を当てており、ストリーミングメディアやモノのインターネット(IoT)におけるエッジコンピューティングの利点を実証するプロジェクトはあるものの、ロボット工学や遠隔制御にはまだ拡張されていません。
遠隔操作はデータ収集の最も有望な形態ですが、データ収集のために専門家を雇うコストは、中央集権的な組織にとって法外に高いものです。dePINは、暗号トークンを通じて遠隔操作データを提供するよう第三者にインセンティブを与えることで、この問題を解決します。-参加者は、ガバナンスに参加し、AGIロボットのトレーニングに貢献しながら、収益を受け取る。
(2)安全性は常に核心的な関心事です
ロボット工学の究極の目標は完全な自律性を達成することですが、『ターミネーター』のフランチャイズが警告しているように、人間が最も望まないのは、自律性がロボットを攻撃的な兵器に変えてしまうことです。攻撃兵器になってしまうことだ。大規模な言語モデルの安全性については、すでに懸念が提起されており、これらのモデルが物理的な行動をとることができるようになれば、ロボットの安全性は社会的に受け入れられるための重要な前提条件となります。
経済的な安全性は、繁栄するロボット工学エコシステムの柱の1つです。この分野の企業であるOpenMindは、FABRICを構築しています。FABRICは、デバイス認証、物理的存在の確認、暗号証明によるリソースアクセスを可能にする分散型マシン調整レイヤです。FABRICは、単純なタスク市場管理とは異なり、中央集権的な仲介者に依存することなく、ロボットが自律的にアイデンティティ情報、地理的位置、行動記録を証明することを可能にします。
行動制約と認証は、誰でも監査可能なコンプライアンスを保証するオンチェーンメカニズムを通じて実施されます。安全基準、品質要件、地域規範を満たすロボットは報われ、違反者は罰則や失格に直面し、自律機械のネットワークに説明責任と信頼を生み出します。
Symbioticのようなサードパーティの再連帯ネットワークも同様に、相互のセキュリティ保証を提供することができます。ペナルティパラメーターシステムはまだ改良が必要ですが、関連技術はすでに実用段階に入っています。私たちは、業界のセキュリティガイドラインがまもなく形成され、ペナルティパラメータがこれらのガイドラインを参照してモデル化されることを期待しています。
実装例:
ロボティクスが共生ネットワークに参加する。
検証可能な没収パラメータを設定する(「2,500ニュートン以上の人間の接触力を加える」など);
プレッジャーは、ロボットがパラメータを守るように保証金を提供する。
違反があった場合、その誓約は被害者への補償として使われます。
このモデルは、企業に安全性を優先させるインセンティブを与えるとともに、誓約プールの保険メカニズムを通じて消費者の受け入れを促進します。
ロボット分野に対するSymbioticチームの洞察は次のとおりです:
SymbioticUniversal Pledge Frameworkは、共有モデルであれ単独モデルであれ、経済的安全性の裏付けを必要とするすべての分野に誓約の概念を拡張するように設計されています。保険からロボット工学まで、その適用シナリオはケースバイケースで設計する必要がある。例えば、ロボット工学のネットワークは、共生フレームワークの上に完全に構築することができ、利害関係者がネットワークの完全性に対して経済的保証を提供することを可能にする。
4、ロボティクス技術スタックのギャップを埋める
OpenAIはAIの人気を牽引しましたが、ChatGPTの瞬間の礎石はずっと前に築かれていました。クラウドサービスはローカル演算へのモデルの依存を解消し、Huggingfaceはモデルのオープンソースを可能にし、KaggleはAIエンジニアのための実験プラットフォームを提供しました。これらの漸進的なブレークスルーが相まって、AIの大量採用につながった。
AIとは異なり、ロボット工学の分野は、資金が限られている場合には参入が難しい。ロボット工学がユビキタスになるためには、開発の障壁をAIアプリケーション開発のような容易さまで下げる必要がある。私たちは、資金調達、評価、教育の3つのレベルで改善の余地があると考えています。
資金調達は、ロボット工学におけるペインポイントです。コンピュータプログラムを開発するには、コンピュータとクラウドコンピューティングリソースが必要なだけですが、完全に機能するロボットを構築するには、モーター、センサー、バッテリーなどのハードウェアを購入する必要があり、そのコストは簡単に10万米ドルを超えます。このハードウェアの属性は、ロボット開発をAIに比べて柔軟性がなく、コストがかかるものにしています。
実世界のシナリオに対するロボット工学の評価インフラは、まだ初期段階にあります。AIの分野では、明確に定義された損失関数システムが確立されており、テストは完全に仮想化できます。しかし、優れた仮想戦略は、効果的な実世界シナリオに直接変換することはできない。ロボットは、反復的な最適化を可能にするために、多様な実世界環境で自律的な戦略をテストするための評価施設を必要としています。
こうしたインフラが成熟すれば、人材が流入し、人型ロボットはWeb2の爆発曲線を繰り返すことになるでしょう。オープンソースのプロジェクトOM1(「Androidのロボット版」)は、未加工のハードウェアを経済的に認識できるスケーラブルなインテリジェンスに変換します。ビジョン、言語、運動計画モジュールは、携帯電話アプリのようにプラグアンドプレイが可能で、すべての推論ステップは平易な英語で表示されるため、オペレーターはファームウェアに触れることなく、動作の監査や調整を行うことができる。この自然言語による推論機能により、新世代の人材がロボット工学の分野にシームレスに参入することができ、オープンソース運動がAIを加速させたように、ロボット工学革命に火をつけるオープンプラットフォームへの重要な一歩を踏み出すことができます。

才能の密度が産業の軌道を決定する。openMindのNASDAQ上場は、金融イノベーションと実店舗型教育の両方に従事するインテリジェントマシンの新時代の幕開けを意味します。オープンマインドとロボストアは共同で、米国のK-12公立学校の立ち上げを発表。Unitree G1ヒューマノイドロボットをベースとした初の一般教育カリキュラムを発表しました。このカリキュラムは、プラットフォームにとらわれず、さまざまな形態のロボットに適応できるように設計されており、生徒たちに実践的な機会を提供します。このポジティブなシグナルは、今後数年間のロボット教育リソースの豊富さは、AIスペースに匹敵するだろうという我々の判断を補強するものです。倉庫ロボットがコンシューマーグレードの市場に拡大するにつれ、安全性、資金調達モデル、評価システムが探求すべき重要な方向性になっています。私たちは、安全性の経済的保証、充電インフラの最適化、レイテンシー性能とデータ収集パイプラインの改善という3つの柱を通じて、暗号がロボット工学を推進すると強く信じています。