diff --git a/index.html b/index.html index 4ea9de0..f497c78 100644 --- a/index.html +++ b/index.html @@ -19,28 +19,241 @@ margin-bottom: 0.5rem; } .subtitle { color: #888; font-size: 1.1rem; margin-bottom: 2rem; } + .badge-row { display: flex; gap: 0.5rem; margin-bottom: 2rem; flex-wrap: wrap; } + .badge { + display: inline-block; padding: 0.3rem 0.8rem; border-radius: 20px; + font-size: 0.8rem; font-weight: 600; + } + .badge-ms { background: #1a3a5c; color: #60a5fa; } + .badge-open { background: #1a3c2a; color: #4ade80; } + .badge-gpu { background: #3c1a1a; color: #f87171; } + .badge-mit { background: #3c2e1a; color: #fbbf24; } + .card { background: #141414; border: 1px solid #222; border-radius: 12px; padding: 2rem; margin-bottom: 1.5rem; } .card h2 { color: #60a5fa; margin-bottom: 1rem; font-size: 1.3rem; } - .card p { line-height: 1.8; color: #aaa; } + .card p, .card li { line-height: 1.8; color: #aaa; } + .card ul { list-style: none; padding: 0; } + .card ul li::before { content: ""; margin-right: 0.5rem; } + + .grid { display: grid; grid-template-columns: repeat(auto-fit, minmax(340px, 1fr)); gap: 1.5rem; } + + table { width: 100%; border-collapse: collapse; margin-top: 0.5rem; } + th, td { text-align: left; padding: 0.7rem 1rem; border-bottom: 1px solid #222; } + th { color: #60a5fa; font-weight: 600; font-size: 0.9rem; } + td { color: #aaa; font-size: 0.9rem; } + + .highlight { color: #4ade80; font-weight: 600; } + .warn { color: #f87171; font-weight: 600; } + + .code-block { + background: #1a1a2e; border: 1px solid #2a2a4e; border-radius: 8px; + padding: 1.2rem; margin-top: 1rem; overflow-x: auto; + font-family: "SF Mono", "Fira Code", monospace; font-size: 0.85rem; + color: #c4b5fd; line-height: 1.6; + } + .code-comment { color: #555; } + + .pipeline { + display: flex; align-items: center; gap: 0; margin: 1.5rem 0; + flex-wrap: wrap; justify-content: center; + } + .pipeline-step { + background: #1a1a2e; border: 1px solid #2a2a4e; border-radius: 10px; + padding: 1rem 1.5rem; text-align: center; min-width: 140px; + } + .pipeline-step .icon { font-size: 1.8rem; margin-bottom: 0.3rem; } + .pipeline-step .label { font-size: 0.85rem; color: #a78bfa; font-weight: 600; } + .pipeline-step .desc { font-size: 0.75rem; color: #666; margin-top: 0.2rem; } + .pipeline-arrow { color: #333; font-size: 1.5rem; padding: 0 0.3rem; } + + .links { display: flex; gap: 1rem; margin-top: 1.5rem; flex-wrap: wrap; } + .links a { + display: inline-flex; align-items: center; gap: 0.4rem; + padding: 0.6rem 1.2rem; border-radius: 8px; text-decoration: none; + font-size: 0.9rem; font-weight: 600; transition: opacity 0.2s; + } + .links a:hover { opacity: 0.8; } + .link-gh { background: #1a1a2e; color: #c4b5fd; border: 1px solid #2a2a4e; } + .link-hf { background: #1a2e1a; color: #4ade80; border: 1px solid #2a4e2a; } + .link-paper { background: #2e1a1a; color: #fca5a5; border: 1px solid #4e2a2a; } + .link-demo { background: #1a2a3c; color: #60a5fa; border: 1px solid #2a3a5c; } + + .verdict { + background: linear-gradient(135deg, #1a1a2e, #141414); + border: 1px solid #a78bfa33; border-radius: 12px; + padding: 2rem; margin-top: 1.5rem; text-align: center; + } + .verdict h2 { color: #a78bfa; margin-bottom: 0.5rem; } + .verdict p { color: #888; max-width: 600px; margin: 0 auto; } + + footer { text-align: center; color: #333; margin-top: 3rem; font-size: 0.8rem; }
-

TRELLIS.2 3D生成模型

-

微软开源图像转3D模型,40亿参数,支持PBR材质

+

TRELLIS.2 — 3D 生成模型

+

微软开源 | 单张图片生成生产级 3D 资产 | 40 亿参数

-
-

概述

-

待补充研究内容...

+
+ Microsoft Research + 4B 参数 + 需 24GB+ GPU + MIT 开源
+
-

核心发现

-

待补充...

+

生成流程

+
+
+
🖼
+
输入图片
+
单张 RGB 照片
+
+
+
+
🧠
+
Flow Transformer
+
40亿参数推理
+
+
+
+
🧊
+
O-Voxel
+
稀疏体素生成
+
+
+
+
💎
+
3D 模型
+
GLB + PBR 材质
+
+
+ +
+ +
+

核心创新:O-Voxel

+

传统 3D 生成依赖 SDF(符号距离场)或 Flexicubes,只能处理封闭的流形网格。TRELLIS.2 发明了 O-Voxel(无场稀疏体素),突破性地支持:

+
    +
  • 任意拓扑结构(开放曲面、非流形几何)
  • +
  • 锐利几何特征保留
  • +
  • 完整 PBR 材质(含透明度和金属度)
  • +
  • 1536³ 体素 → 仅 9.6K 隐空间 token(16× 压缩)
  • +
+
+ + +
+

推理性能(H100 GPU)

+ + + + + +
分辨率耗时适用场景
512³~3 秒快速预览
1024³~17 秒标准生产
1536³~60 秒高精度
+ + + + + +
指标数值
模型参数40 亿
输出格式GLB(含 WebP 纹理)
纹理分辨率最高 4096 × 4096
+
+ + +
+

vs 传统方法

+ + + + + + + +
维度传统方法TRELLIS.2
几何表示仅封闭网格任意拓扑
材质单一颜色完整 PBR
透明度不支持原生支持
生成方式迭代优化(分钟级)直接生成(秒级)
拓扑错误常见极少
+
+ + +
+

硬件要求

+ + + + + + +
项目最低要求
GPU24GB+ 显存(A100 / H100)
系统Linux(仅验证平台)
CUDA12.4+
Python3.8+
+

+ ⚠ MacBook M2 Max 无法原生运行(无 CUDA),需要 GPU 云服务器或在线 Demo +

+
+ + +
+

已知局限

+
    +
  • 生成网格可能有小孔洞,需后处理修补
  • +
  • 未经 RLHF 对齐,输出风格随训练数据分布变化
  • +
  • 仅在 Linux + NVIDIA GPU 上测试
  • +
  • 复杂场景(多物体)效果不如单物体
  • +
+
+ + +
+

使用代码

+
+# 安装 +pip install trellis2 + +# 推理 +import torch +from trellis2.pipelines import Trellis2ImageTo3DPipeline +from PIL import Image + +pipeline = Trellis2ImageTo3DPipeline.from_pretrained( + "microsoft/TRELLIS.2-4B" +) +pipeline.cuda() + +image = Image.open("photo.png") +mesh = pipeline.run(image)[0] + +# 导出 GLB +import o_voxel +glb = o_voxel.postprocess.to_glb( + vertices=mesh.vertices, + faces=mesh.faces, + attr_volume=mesh.attrs, + voxel_size=mesh.voxel_size, + texture_size=4096 +) +glb.export("output.glb") +
+
+
+ + +
+

评价:真正的技术突破

+

O-Voxel 是 3D 生成领域的根本性创新,解决了困扰行业多年的拓扑限制问题。MIT 开源 + 完整论文 + 可复现代码,不是噱头。当前主要限制是硬件门槛(需 NVIDIA GPU),MacBook 暂时无法本地运行。

+
+ + + + +