谷歌人工智能幻影再临，视频生成逼真难辨

睿鸿在线 • 2024年12月20日上午12:43 • 商业 • 1 views

谷歌人工智能幻影再临，视频生成逼真难辨

12月16日，谷歌旗下的“深层思维”公司宣布推出新一代人工智能视频生成模型Veo 2，人工智能领域再次迎来重大突破。

Veo 2是一款强大的视频生成工具，它利用先进的机器学习算法，根据文本提示或参考图像生成栩栩如生的视频。与谷歌此前发布的类似模型不同，Veo 2在视频分辨率、图像质量和对真实世界物理规律的模拟方面取得了显著进步。

超高分辨率和超长时长

Veo 2可以创建4K分辨率、时长两分钟的视频，这意味着它可以生成令人难以置信的逼真且详细的图像。相比之下，OpenAI最近发布的视频生成模型Sora Turbo只能生成256×256分辨率、时长仅几秒钟的视频。

逼真的物理模拟

Veo 2能够真实地模拟运动、流体力学和光的特性。它可以创建流畅的动作、逼真的液体流动和逼真的光影效果。这使它能够生成令人信服的视频，其中物体以自然的方式移动和相互作用。

多镜头和电影效果

Veo 2还具备实现不同镜头和电影效果的能力。它可以创建平移、变焦甚至动态模糊等效果。这使得用户能够使用Veo 2创作具有专业品质的视频。

细致入微的人类表情

Veo 2在生成人类表情方面取得了重大进步。它能够捕捉到微妙的面部表情和情绪，使生成的视频人物栩栩如生。

用户反馈和改进

“深层思维”公司表示，Veo 2将继续根据用户的反馈进行迭代。该公司承认模型目前仍有不足，例如视频的连贯性和一致性尚需改进。它还计划解决生成复杂细节、快速复杂动作和突破现实限制等方面的挑战。

水印标记以防深度伪造

为了应对深度伪造的风险，谷歌表示将利用水印技术把隐形标记嵌入Veo 2生成的视频帧中。这将帮助用户识别和防止虚假视频的传播。

潜在应用

Veo 2具有广泛的潜在应用。它可以用于创建电影和电视节目、制作视频游戏、设计虚拟现实体验，甚至用于培训和教育。随着人工智能视频生成技术的不断发展，Veo 2有望彻底改变我们创作和消费视频的方式。

技术背景

Veo 2基于Transformer架构，这是一种先进的神经网络，被广泛用于生成文本和图像。该模型利用了大量的视频数据集进行训练，使其能够理解视频中对象的运动模式、光照条件和物理交互。

技术挑战

视频生成是一项极具挑战性的任务，涉及到大量的计算和数据处理。Veo 2依赖于强大的计算基础设施和创新的算法，以实现其令人印象深刻的性能。

伦理影响

人工智能视频生成技术引发了关于伦理影响的担忧。假视频的传播可能会造成欺骗、误导和损害声誉。因此，负责任地开发和使用这些技术至关重要。

原创文章，作者：睿鸿在线，如若转载，请注明出处：https://mip.orihonor.com/2024/12/20/33684.shtml