返回AI 模型
AI 模型

9家机构发布音视频大模型综述

新加坡国立大学联合牛津大学、微软研究院等9家机构,发布了首份系统性的音视频智能(AVI)大模型综述。该综述梳理了2016-2026年AVI发展历程,将研究分为理解世界、创造世界、与世界交互三条主线,并提出了六大未来研究方向。文章指出,音视频大模型正从辅助功能进化为多模态基础模型的核心能力,未来竞争点在于长程推理、原生音画同步生成和实时闭环交互。该综述为相关领域研发提供了统一坐标系,并强调了评测体系重塑和安全治理的重要性。

0 阅读来源:必应

点击下方链接阅读完整内容:

阅读原文
音视频大模型,多模态,人工智能,综述,未来趋势

相关推荐