谷歌和马斯克携手进军AI游戏引擎,开辟交互式3D世界的新纪元
科技巨头谷歌和亿万富翁企业家埃隆·马斯克宣布了一项令人振奋的合作,旨在打造一个革命性的AI游戏引擎,能够生成无限多样的交互式3D世界。
谷歌的研究部门DeepMind开发的新型世界模型Genie 2是这项合作的核心。它是一个大型自回归潜空间扩散模型,接受过海量视频数据集的训练,包括来自YouTube的游戏视频。Genie 2的能力非同小可,它可以根据文本描述生成逼真的3D世界,并对玩家的键鼠操作做出实时响应。
Genie 2的一个关键特性是其长期记忆,即使玩家将视角移开,再回来时,世界中的现有部分也能保持稳定。这使玩家能够探索庞大而复杂的世界,而不必担心丢失进度。此外,Genie 2可以生成其他AI角色,这些角色可以与玩家控制的角色进行复杂交互,增加游戏的沉浸感和互动性。
马斯克长期以来一直对AI游戏表现出浓厚的兴趣,他的公司xAI计划成立一家AI游戏工作室。此次合作无疑将为马斯克的愿景提供动力,使他对AI游戏的愿景更接近现实。
除了娱乐价值外,Genie 2在训练和评估具身智能体方面具有重要意义。具身智能体是能够在物理环境中感知和行动的AI代理。通过创建丰富多样的环境,Genie 2可以生成AI在训练期间从未见过的评估任务。这将使AI在各种情况下学习和适应,迈向通用人工智能(AGI)。
以前的世界模型研究主要局限于模拟狭窄的领域,但Genie 2实现了向生成丰富3D世界的飞跃。它展示了世界模型强大的能力,包括对象交互、复杂的角色动画、物理模拟,以及建模和预测其他智能体行为的能力。
利用扩散模型和大型语言模型技术,Genie 2能够从单个操作和过去的帧中自回归采样,逐帧执行,并使用分类器自由引导来提高操作可控性。谷歌透露,当前展示的视频示例是由经过蒸馏的模型生成的,旨在展示Genie 2的可能性。蒸馏模型可以实现实时控制,但会牺牲输出质量。
值得注意的是,在打造AI游戏引擎的道路上,谷歌并不是孤军奋战。就在几天前,李飞飞领导的World Labs也推出了从单个图像生成3D世界的新技术。这表明科技巨头们纷纷看好这一领域,并致力于推动其发展。
谷歌和马斯克的合作是一项重大突破,标志着交互式3D世界生成领域的新篇章。Genie 2的强大功能将为游戏玩家和AI研究人员带来无限的可能性。随着AI游戏引擎的成熟,我们有望看到前所未有的交互式和沉浸式游戏体验,以及训练更强大、更聪明的AI的突破。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/07/22939.shtml