☁️ 点群VPS オープンソース調査
Immersal に代わるオープンソースの点群ベース Visual Positioning System (VPS) を徹底比較。 カメラ映像から3D点群を構築し、リアルタイムに位置を特定する技術を調査します。
🎯 ORB-SLAM3
マルチマップ Visual-Inertial SLAM
サラゴサ大学開発の最先端 Visual SLAM。モノラル・ステレオ・RGB-D・魚眼カメラに対応し、 IMU融合による Visual-Inertial モードも搭載。マルチマップシステムにより、 トラッキングロスからの自動復帰と地図統合が可能。屋内外を問わず高精度な 自己位置推定を実現する、研究分野で最も引用されるSLAMシステム。
📊 主要スペック
🔄 処理フロー
⚠️ 課題と注意点
⚠️ GPLv3ライセンス
商用利用にはソースコード公開が必要。プロプライエタリ製品に組み込む場合はライセンス交渉が必須。
⚠️ 疎な点群のみ
ORB特徴点ベースのため密な3D再構成は不可。Immersal のような密な点群マップとは異なるアプローチ。
🗺️ RTAB-Map
密な点群 & LiDAR 対応 SLAM
IntRoLab(シャーブルック大学)開発のオープンソース SLAM ライブラリ。 Visual SLAM と LiDAR SLAM を統合し、密な3D点群マップ・OctoMap・ 占有格子マップを生成可能。大規模環境での長期運用を想定したメモリ管理機能と ループクローズ検出を搭載。RGB-Dカメラ(RealSense, Kinect)との相性が特に優秀で、 Immersal に最も近い密な点群マップを生成できるオープンソースソリューション。
📊 主要スペック
🔄 ワークフロー
✨ Immersal との比較
✅ RTAB-Map の優位性
完全オフライン動作、クラウド課金なし、BSD-3ライセンスで商用利用可能。LiDARとの統合で屋外にも拡張可能。
⚠️ Immersal の優位性
クラウドベースのマップ共有・更新、スマホカメラだけで対応、SDK統合の容易さ。大規模施設のマップ管理に優れる。
⚠️ 課題
⚠️ RGB-Dカメラ依存
密な点群にはRGB-Dカメラが必要。通常のスマホカメラでは疎な点群しか得られない。
⚠️ 計算負荷
密な点群生成は計算コストが高く、モバイルデバイスでのリアルタイム処理は困難。デスクトップ/ロボット向き。
📸 hloc
Hierarchical Localization
ETH Zürich / Microsoft Research 開発の6DoFビジュアルローカライゼーション。 SuperPoint + SuperGlue による最先端特徴マッチングを使い、 SfM(Structure from Motion)で構築した3D点群マップ上でカメラ姿勢を推定。 CVPR 2020 / ECCV 2020 のローカライゼーション・チャレンジで優勝。 スマホカメラだけで Immersal 相当のVPSを構築できる唯一のオープンソース。
📊 主要スペック
🔄 VPS ワークフロー
💡 なぜ hloc が最有力か
📱 スマホカメラで完結
特殊なハードウェアは不要。通常のスマホカメラで撮影した画像群からマッピングとローカライゼーションが可能。Immersal と同じユースケースをカバー。
🏆 学術的に証明済み
CVPR/ECCV のベンチマークで最高精度を記録。InLoc(屋内)データセットでも屋内ローカライゼーションの有効性が実証済み。
🔧 モジュラー設計
特徴抽出・マッチング・ローカライゼーションが独立モジュール。SuperPoint/SuperGlue を DISK/LightGlue に差替え可能。
⚠️ 課題
⚠️ オフライン・バッチ処理
マッピング(SfM構築)はバッチ処理で数分〜数時間かかる。リアルタイムSLAMではなく、事前構築型。
⚠️ GPU推奨
SuperPoint/SuperGlue のDNN推論にはGPU(CUDA)が推奨。CPU実行では処理時間が大幅に増加。
👁️ stella_vslam
マップ保存特化 Visual SLAM
旧 OpenVSLAM のコミュニティフォーク。マップの保存・読込・再ローカライゼーションに 重きを置いた設計で、事前に構築したマップを利用した位置特定ワークフローが特に充実。 モノラル・ステレオ・RGB-D・等距射影カメラに対応し、BSD-2ライセンスで商用利用が容易。
📊 主要スペック
💡 ユースケース
🏭 施設内ナビロボット
事前マッピング → マップ保存 → ロボット起動時に読込み → 再ローカライゼーション。マップの永続化が容易なため、定型ルートのロボット運用に適する。
🏗️ AR施工管理
施工現場のマップを毎日更新し、作業員がARデバイスで現場情報を重畳表示。軽量なBSD-2ライセンスで組み込みやすい。
⚠️ 課題
⚠️ コミュニティ規模
ORB-SLAM3 や RTAB-Map に比べてコミュニティが小さく、ドキュメントや事例が限定的。
⚠️ IMU非対応
Visual-Inertial 融合は未サポート。動きの速い環境やテクスチャの少ない場面でのロバスト性が劣る。
📐 Google Cartographer
LiDAR ベース SLAM
Google 開発の 2D/3D LiDAR SLAM。高精度なスキャンマッチングとループクローズにより、 大規模施設の精密な点群マップを構築。ロボットに搭載した LiDAR で施設全体を 自動マッピングするユースケースに最適。ROS 対応で産業用途での採用実績が豊富。
📊 主要スペック
💡 適用シナリオ
🏭 工場・倉庫の自動マッピング
LiDAR搭載ロボットが施設内を巡回し、mmレベルの超高精度な3D点群マップを自動構築。AGV/AMRの経路計画に直結。
🏢 BIM連携
施工後の建物をLiDARスキャンし、BIMモデルとの差分検出。as-built検証の自動化に活用。
⚠️ 課題
⚠️ LiDAR 必須
カメラのみでは動作不可。LiDARセンサー(Velodyne, Livox等)の導入コストが発生。スマホでは利用不可。
⚠️ メンテナンス状況
Google が公式メンテナンスを縮小傾向。2024年以降のアクティブな開発は鈍化している。
📋 5ソリューション 総合比較
| 項目 | 🎯 ORB-SLAM3 | 🗺️ RTAB-Map | 📸 hloc | 👁️ stella_vslam | 📐 Cartographer |
|---|---|---|---|---|---|
| 点群密度 | 疎 | ★ 密 | 中(SfM) | 疎 | ★ 超高密度 |
| 精度 | cm〜dm | cm | ★ cm | cm〜dm | ★ mm〜cm |
| カメラのみ | ✅ | ✅ | ★ スマホOK | ✅ | ❌ LiDAR必須 |
| マップ保存/再利用 | △ 要改造 | ✅ | ✅ | ★ 充実 | ✅ |
| リアルタイム SLAM | ✅ | ✅ | ❌ バッチ | ✅ | ✅ |
| IMU融合 | ✅ VI-SLAM | ✅ | ❌ | ❌ | ✅ |
| ROS対応 | △ 非公式 | ★ ROS1/2 | ❌ | △ ROS | ★ ROS1/2 |
| ライセンス | GPLv3 | BSD-3 | Apache 2.0 | BSD-2 | Apache 2.0 |
| Immersal類似度 | ★★★☆☆ | ★★★★☆ | ★★★★★ | ★★★☆☆ | ★★☆☆☆ |
💡 用途別おすすめ
📱 スマホVPS(Immersal代替)
hloc 一択。通常のスマホカメラで撮影した画像群からSfMで点群を構築し、新しい画像のカメラ姿勢を推定。Apache 2.0で商用利用可。
📷 RGB-Dで密な点群マップ
RTAB-Map。RealSense/Kinect と組み合わせて密な3Dマップを構築。マップ保存→再ローカライゼーションのワークフローが最も成熟。
🤖 リアルタイムロボットSLAM
ORB-SLAM3 または RTAB-Map。リアルタイム性が高く、IMU融合で高精度な自己位置推定。ORB-SLAM3 はGPLv3に注意。
🏭 LiDARで施設マッピング
Cartographer または RTAB-Map の LiDARモード。mm〜cm級の超高精度。AGV経路計画やBIM連携に。
ロボット自律学習、音声誘導、ARグラスなどの応用シナリオ