Files
cvpr2026-3d-vision/.memory/cvpr2026-3d-vision.md
2026-04-25 19:23:17 +08:00

1.3 KiB
Raw Permalink Blame History

name, description, type
name description type
CVPR 2026 3D Vision Foundation Models 研究 CVPR 2026 基础视觉大模型在三维视觉领域的热门开源项目调研,含 G2VLM/VLM-3R/TALO/Flow3r待 eGPU+NVIDIA 卡到位后本地运行 project

项目信息

  • 路径~/Projects/research/20260319-cvpr2026-3d-vision/
  • 端口4070python3 -m http.server 4070
  • 内容:单文件 HTML 研究展示页

调研项目列表

项目 Stars 机构 最低 VRAM GitHub
G2VLM (2B) 291 上海AI Lab/UCLA/浙大 ~8GB InternRobotics/G2VLM
VLM-3R (7B) 363 UT Austin/Meta/UCLA ~16GB VITA-Group/VLM-3R
TALO 56 ~12GB Xian-Bei/TALO
Flow3r 60 ~8GB Kidrauh/flow3r

硬件需求

  • 全部依赖 CUDA 12.1+、flash-attention、tritonNVIDIA 专属)
  • macOS 不支持 NVIDIA eGPU 驱动Apple Silicon 也不支持外置 Linux+eGPU
  • 推荐RTX 409024GB VRAM覆盖全部项目
  • 待定:用户 Mac 型号Intel vs Apple Silicon决定 eGPU 方案或独立 Linux 小主机方案

可行方案

  1. eGPU + Linux(仅 Intel MaceGPU 盒子 + RTX 4090 + Ubuntu
  2. 独立 Linux 小主机(最稳,不限 Mac 型号mini-ITX + RTX 4090 + Ubuntu + SSH
  3. 云 GPU零投入Colab Pro+ / RunPod / Vast.ai