腾讯的AI进程一直在加快。在刚刚过去的WAIC上,腾讯不仅携自己的AI全家桶亮相,更是发布了混元3D世界模型 1.0,并宣布全面开源,此外,腾讯在具身智能领域的布局也浮出水面,发布具身智能开放平台Tairos“钛螺丝”。
混元3D世界模型 1.0也是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。
简单来说,就是过去需要专业建模团队数周才能搭建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。
和过去文生图不一样的时候,3D资产是需要更复杂更强大的技术支撑。腾讯混元3D负责人郭春超在接受每次采访时表示,实际上3D资产和图片不太一样的点是图片是可以通过拍照等方式随时随地的获取,因此随着移动互联网的普及,图片的数量爆发式增长。3D的资产都是靠艺术家或者是建模师手工做的,因此整个存量就是几千万量级,它跟百亿千亿级的图片差了几个数量级,这也是3D资产获取难度高的原因。
如何让3D资产利用起来,这也是腾讯解决的事情。“提高3D资产的利用率,它包括了更好的模型表达,也就是说同样是这些数据,我们用更好的表达就能把它训练得更好,把它描述得更好,这是提高资产利用率的一个很重要的方式。”郭春超说道。
腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。
对游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程,只需输入“一座中世纪城堡,城堡塔楼宏伟壮阔,城堡周围是一座石头雕像,石头铺成的路以及美丽的花朵,卡通风格”等简单指令,模型即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。
对于普通用户来说,仅需一句话或者一张图即可快速生成360°沉浸式视觉空间。据悉,混元3D用纯生成的方式,这样的好处就是自由度会更大,创造力会更丰富。在技术路线上,腾讯也有区别。郭春超表示:“腾讯采用的是3D和2D相结合的路线,因为纯3D的方法前面提到了它的这种多样性,受数据的限制。如果用纯3D的生成一个大的场景,它的多样性是会欠缺,但是纯2D的方法它的空间稳定性,它的物理规律的合理性又经常会出现各种问题,所以腾讯采用了3D、2D相结合的路线。”
这样的好处在于所生成的3D世界交互性更高。混元3D世界模型先把三维的场景搭建出来,在生成世界中漫游场景是通过3D渲染引擎的方式来实现。“目前交互性我觉得可能还处于初级阶段,后面会把交互模型给做起来。”郭春超表示。
混元3D世界模型1.0还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真,无缝衔接AIGC技术与传统CG工作流。这极大的提高了用户的使用率。目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界。
在行业应用方面,不仅仅是游戏线上股票配资门户,其他行业也在申请腾讯3D世界模型的的开源商业许可申请。郭春超透露:“在开源之后,光是发来的开源商业许可申请超过了50家,不仅有游戏公司,还有电商企业、自动驾驶、具身智能、影视动漫等,甚至教育公司也在尝试更多可能性。”
泰禾优配提示:文章来自网络,不代表本站观点。