1.3 KiB
1.3 KiB
name, description, type
| name | description | type |
|---|---|---|
| CVPR 2026 3D Vision Foundation Models 研究 | CVPR 2026 基础视觉大模型在三维视觉领域的热门开源项目调研,含 G2VLM/VLM-3R/TALO/Flow3r,待 eGPU+NVIDIA 卡到位后本地运行 | project |
项目信息
- 路径:
~/Projects/research/20260319-cvpr2026-3d-vision/ - 端口:4070(
python3 -m http.server 4070) - 内容:单文件 HTML 研究展示页
调研项目列表
| 项目 | Stars | 机构 | 最低 VRAM | GitHub |
|---|---|---|---|---|
| G2VLM (2B) | 291 | 上海AI Lab/UCLA/浙大 | ~8GB | InternRobotics/G2VLM |
| VLM-3R (7B) | 363 | UT Austin/Meta/UCLA | ~16GB | VITA-Group/VLM-3R |
| TALO | 56 | — | ~12GB | Xian-Bei/TALO |
| Flow3r | 60 | — | ~8GB | Kidrauh/flow3r |
硬件需求
- 全部依赖 CUDA 12.1+、flash-attention、triton(NVIDIA 专属)
- macOS 不支持 NVIDIA eGPU 驱动,Apple Silicon 也不支持外置 Linux+eGPU
- 推荐:RTX 4090(24GB VRAM)覆盖全部项目
- 待定:用户 Mac 型号(Intel vs Apple Silicon),决定 eGPU 方案或独立 Linux 小主机方案
可行方案
- eGPU + Linux(仅 Intel Mac):eGPU 盒子 + RTX 4090 + Ubuntu
- 独立 Linux 小主机(最稳,不限 Mac 型号):mini-ITX + RTX 4090 + Ubuntu + SSH
- 云 GPU(零投入):Colab Pro+ / RunPod / Vast.ai