☁️ 点群VPS オープンソース調査

Immersal に代わるオープンソースの点群ベース Visual Positioning System (VPS) を徹底比較。 カメラ映像から3D点群を構築し、リアルタイムに位置を特定する技術を調査します。

🎯 ORB-SLAM3
マルチマップ Visual-Inertial SLAM

サラゴサ大学開発の最先端 Visual SLAM。モノラル・ステレオ・RGB-D・魚眼カメラに対応し、 IMU融合による Visual-Inertial モードも搭載。マルチマップシステムにより、 トラッキングロスからの自動復帰と地図統合が可能。屋内外を問わず高精度な 自己位置推定を実現する、研究分野で最も引用されるSLAMシステム。

🏛️ 開発元 — Universidad de Zaragoza
📜 ライセンス — GPLv3
GitHub Stars — 6,800+
📷 対応 — Mono / Stereo / RGB-D / Fisheye
🔗 GitHub — UZ-SLAMLab/ORB_SLAM3
成熟度
90%

📊 主要スペック

🎯
精度
cm〜dm級
☁️
点群密度
疎(ORB特徴点)
処理
リアルタイム
🗺️
マルチマップ
✅ 対応
📡
IMU融合
✅ VI-SLAM
🔄
再ローカライズ
△ 要改造

🔄 処理フロー

STEP 1
📷
画像取得
カメラフレーム入力
STEP 2
🔵
ORB特徴抽出
キーポイント検出
STEP 3
🔀
特徴マッチング
フレーム間対応
STEP 4
📍
姿勢推定
6DoFカメラ位置
STEP 5
☁️
マップ構築
疎な3D点群生成

⚠️ 課題と注意点

⚠️ GPLv3ライセンス

商用利用にはソースコード公開が必要。プロプライエタリ製品に組み込む場合はライセンス交渉が必須。

⚠️ 疎な点群のみ

ORB特徴点ベースのため密な3D再構成は不可。Immersal のような密な点群マップとは異なるアプローチ。

🗺️ RTAB-Map
密な点群 & LiDAR 対応 SLAM

IntRoLab(シャーブルック大学)開発のオープンソース SLAM ライブラリ。 Visual SLAM と LiDAR SLAM を統合し、密な3D点群マップ・OctoMap・ 占有格子マップを生成可能。大規模環境での長期運用を想定したメモリ管理機能と ループクローズ検出を搭載。RGB-Dカメラ(RealSense, Kinect)との相性が特に優秀で、 Immersal に最も近い密な点群マップを生成できるオープンソースソリューション。

🏛️ 開発元 — IntRoLab, Université de Sherbrooke
📜 ライセンス — BSD-3-Clause
GitHub Stars — 2,700+
📷 対応 — RGB-D / Stereo / LiDAR / 組み合わせ
🔗 GitHub — introlab/rtabmap
Immersal類似度
85%

📊 主要スペック

🎯
精度
cm級
☁️
点群密度
★ 密
💾
マップ保存
✅ 対応
🔄
再ローカライズ
✅ ネイティブ
🤖
ROS対応
ROS1 / ROS2
📊
出力形式
点群/OctoMap/Grid

🔄 ワークフロー

STEP 1
📷
RGB-D 取得
RealSense / Kinect
STEP 2
🧠
特徴+深度融合
Visual Odometry
STEP 3
🔄
ループクローズ
場所認識+最適化
STEP 4
☁️
密な点群生成
3Dマップ構築
STEP 5
📍
再ローカライズ
保存マップで位置特定

✨ Immersal との比較

✅ RTAB-Map の優位性

完全オフライン動作、クラウド課金なし、BSD-3ライセンスで商用利用可能。LiDARとの統合で屋外にも拡張可能。

オフライン BSD-3 LiDAR対応

⚠️ Immersal の優位性

クラウドベースのマップ共有・更新、スマホカメラだけで対応、SDK統合の容易さ。大規模施設のマップ管理に優れる。

クラウド スマホ対応 SDK

⚠️ 課題

⚠️ RGB-Dカメラ依存

密な点群にはRGB-Dカメラが必要。通常のスマホカメラでは疎な点群しか得られない。

⚠️ 計算負荷

密な点群生成は計算コストが高く、モバイルデバイスでのリアルタイム処理は困難。デスクトップ/ロボット向き。

📸 hloc
Hierarchical Localization

ETH Zürich / Microsoft Research 開発の6DoFビジュアルローカライゼーション。 SuperPoint + SuperGlue による最先端特徴マッチングを使い、 SfM(Structure from Motion)で構築した3D点群マップ上でカメラ姿勢を推定。 CVPR 2020 / ECCV 2020 のローカライゼーション・チャレンジで優勝。 スマホカメラだけで Immersal 相当のVPSを構築できる唯一のオープンソース。

🏛️ 開発元 — ETH Zürich / Microsoft Research
📜 ライセンス — Apache 2.0
🏆 実績 — CVPR/ECCV 2020 優勝
📷 対応 — 通常スマホカメラ OK
🔗 GitHub — cvg/Hierarchical-Localization
Immersal類似度
95%

📊 主要スペック

🎯
精度
★ cm級
☁️
点群
SfM 3D点群
📷
入力
★ スマホ対応
🧠
特徴抽出
SuperPoint
🔗
マッチング
SuperGlue / LightGlue
📐
出力
6DoF 姿勢

🔄 VPS ワークフロー

MAPPING
📷
画像群収集
施設内を撮影
MAPPING
🔵
SuperPoint抽出
特徴点検出
MAPPING
☁️
SfM 構築
COLMAP で3D点群
QUERY
🔍
画像検索
NetVLAD で候補絞込
QUERY
📍
姿勢推定
PnP+RANSAC で6DoF

💡 なぜ hloc が最有力か

📱 スマホカメラで完結

特殊なハードウェアは不要。通常のスマホカメラで撮影した画像群からマッピングとローカライゼーションが可能。Immersal と同じユースケースをカバー。

ハードウェア不要Immersal互換

🏆 学術的に証明済み

CVPR/ECCV のベンチマークで最高精度を記録。InLoc(屋内)データセットでも屋内ローカライゼーションの有効性が実証済み。

CVPR 2020ECCV 2020InLoc

🔧 モジュラー設計

特徴抽出・マッチング・ローカライゼーションが独立モジュール。SuperPoint/SuperGlue を DISK/LightGlue に差替え可能。

プラガブルApache 2.0

⚠️ 課題

⚠️ オフライン・バッチ処理

マッピング(SfM構築)はバッチ処理で数分〜数時間かかる。リアルタイムSLAMではなく、事前構築型。

⚠️ GPU推奨

SuperPoint/SuperGlue のDNN推論にはGPU(CUDA)が推奨。CPU実行では処理時間が大幅に増加。

👁️ stella_vslam
マップ保存特化 Visual SLAM

旧 OpenVSLAM のコミュニティフォーク。マップの保存・読込・再ローカライゼーションに 重きを置いた設計で、事前に構築したマップを利用した位置特定ワークフローが特に充実。 モノラル・ステレオ・RGB-D・等距射影カメラに対応し、BSD-2ライセンスで商用利用が容易。

🏛️ 開発元 — stella-cv コミュニティ
📜 ライセンス — BSD-2-Clause
📷 対応 — Mono / Stereo / RGB-D / 等距射影
💾 強み — マップ永続化 & 再利用
🔗 GitHub — stella-cv/stella_vslam
Immersal類似度
65%

📊 主要スペック

🎯
精度
cm〜dm級
☁️
点群密度
💾
マップ保存
★ 充実
🔄
再ローカライズ
✅ ネイティブ
🖥️
ビューワー
Socket / Pangolin
📜
ライセンス
BSD-2 (商用OK)

💡 ユースケース

🏭 施設内ナビロボット

事前マッピング → マップ保存 → ロボット起動時に読込み → 再ローカライゼーション。マップの永続化が容易なため、定型ルートのロボット運用に適する。

🏗️ AR施工管理

施工現場のマップを毎日更新し、作業員がARデバイスで現場情報を重畳表示。軽量なBSD-2ライセンスで組み込みやすい。

⚠️ 課題

⚠️ コミュニティ規模

ORB-SLAM3 や RTAB-Map に比べてコミュニティが小さく、ドキュメントや事例が限定的。

⚠️ IMU非対応

Visual-Inertial 融合は未サポート。動きの速い環境やテクスチャの少ない場面でのロバスト性が劣る。

📐 Google Cartographer
LiDAR ベース SLAM

Google 開発の 2D/3D LiDAR SLAM。高精度なスキャンマッチングとループクローズにより、 大規模施設の精密な点群マップを構築。ロボットに搭載した LiDAR で施設全体を 自動マッピングするユースケースに最適。ROS 対応で産業用途での採用実績が豊富。

🏛️ 開発元 — Google
📜 ライセンス — Apache 2.0
📡 入力 — 2D / 3D LiDAR + IMU
🔧 ROS — 完全対応
🔗 GitHub — cartographer-project/cartographer
Immersal類似度
45%

📊 主要スペック

🎯
精度
★ mm〜cm級
☁️
点群密度
★ 超高密度
📡
入力
LiDAR 必須
📐
次元
2D / 3D
🔄
ループクローズ
✅ 対応
🏭
産業実績
多数

💡 適用シナリオ

🏭 工場・倉庫の自動マッピング

LiDAR搭載ロボットが施設内を巡回し、mmレベルの超高精度な3D点群マップを自動構築。AGV/AMRの経路計画に直結。

AGV自動搬送

🏢 BIM連携

施工後の建物をLiDARスキャンし、BIMモデルとの差分検出。as-built検証の自動化に活用。

BIM建設

⚠️ 課題

⚠️ LiDAR 必須

カメラのみでは動作不可。LiDARセンサー(Velodyne, Livox等)の導入コストが発生。スマホでは利用不可。

⚠️ メンテナンス状況

Google が公式メンテナンスを縮小傾向。2024年以降のアクティブな開発は鈍化している。

📋 5ソリューション 総合比較

項目 🎯 ORB-SLAM3 🗺️ RTAB-Map 📸 hloc 👁️ stella_vslam 📐 Cartographer
点群密度 ★ 密 中(SfM) ★ 超高密度
精度 cm〜dm cm ★ cm cm〜dm ★ mm〜cm
カメラのみ ★ スマホOK ❌ LiDAR必須
マップ保存/再利用 △ 要改造 ★ 充実
リアルタイム SLAM ❌ バッチ
IMU融合 ✅ VI-SLAM
ROS対応 △ 非公式 ★ ROS1/2 △ ROS ★ ROS1/2
ライセンス GPLv3 BSD-3 Apache 2.0 BSD-2 Apache 2.0
Immersal類似度 ★★★☆☆ ★★★★☆ ★★★★★ ★★★☆☆ ★★☆☆☆

💡 用途別おすすめ

📱 スマホVPS(Immersal代替)

hloc 一択。通常のスマホカメラで撮影した画像群からSfMで点群を構築し、新しい画像のカメラ姿勢を推定。Apache 2.0で商用利用可。

hlocSuperPointCOLMAP

📷 RGB-Dで密な点群マップ

RTAB-Map。RealSense/Kinect と組み合わせて密な3Dマップを構築。マップ保存→再ローカライゼーションのワークフローが最も成熟。

RTAB-MapRealSenseROS2

🤖 リアルタイムロボットSLAM

ORB-SLAM3 または RTAB-Map。リアルタイム性が高く、IMU融合で高精度な自己位置推定。ORB-SLAM3 はGPLv3に注意。

ORB-SLAM3VI-SLAM

🏭 LiDARで施設マッピング

Cartographer または RTAB-Map の LiDARモード。mm〜cm級の超高精度。AGV経路計画やBIM連携に。

CartographerLiDARBIM
🧠 AI ナビゲーション・ユースケース調査を見る →

ロボット自律学習、音声誘導、ARグラスなどの応用シナリオ