微软开源 | 单张图片生成生产级 3D 资产 | 40 亿参数
传统 3D 生成依赖 SDF(符号距离场)或 Flexicubes,只能处理封闭的流形网格。TRELLIS.2 发明了 O-Voxel(无场稀疏体素),突破性地支持:
| 分辨率 | 耗时 | 适用场景 |
|---|---|---|
| 512³ | ~3 秒 | 快速预览 |
| 1024³ | ~17 秒 | 标准生产 |
| 1536³ | ~60 秒 | 高精度 |
| 指标 | 数值 |
|---|---|
| 模型参数 | 40 亿 |
| 输出格式 | GLB(含 WebP 纹理) |
| 纹理分辨率 | 最高 4096 × 4096 |
| 维度 | 传统方法 | TRELLIS.2 |
|---|---|---|
| 几何表示 | 仅封闭网格 | 任意拓扑 |
| 材质 | 单一颜色 | 完整 PBR |
| 透明度 | 不支持 | 原生支持 |
| 生成方式 | 迭代优化(分钟级) | 直接生成(秒级) |
| 拓扑错误 | 常见 | 极少 |
| 项目 | 最低要求 |
|---|---|
| GPU | 24GB+ 显存(A100 / H100) |
| 系统 | Linux(仅验证平台) |
| CUDA | 12.4+ |
| Python | 3.8+ |
⚠ MacBook M2 Max 无法原生运行(无 CUDA),需要 GPU 云服务器或在线 Demo
O-Voxel 是 3D 生成领域的根本性创新,解决了困扰行业多年的拓扑限制问题。MIT 开源 + 完整论文 + 可复现代码,不是噱头。当前主要限制是硬件门槛(需 NVIDIA GPU),MacBook 暂时无法本地运行。