AI 模型

9家机构发布音视频大模型综述

新加坡国立大学联合牛津大学、微软研究院等9家机构，发布了首份系统性的音视频智能（AVI）大模型综述。该综述梳理了2016-2026年AVI发展历程，将研究分为理解世界、创造世界、与世界交互三条主线，并提出了六大未来研究方向。文章指出，音视频大模型正从辅助功能进化为多模态基础模型的核心能力，未来竞争点在于长程推理、原生音画同步生成和实时闭环交互。该综述为相关领域研发提供了统一坐标系，并强调了评测体系重塑和安全治理的重要性。

2026年5月24日13 阅读作者：新品星球编辑部

音视频大模型，多模态，人工智能，综述，未来趋势

9家机构发布音视频大模型综述

相关推荐

Cursor发布1.5万亿参数新模型，规模与Opus和GPT相当

阿里发布三大模型让机器人更智能