本次云栖大会，阿里云视频云团队举办了主题分论坛，并在多个场馆进行了产品方案的展示。在AI视频生产、AI智能体互动等热点方向上呈现最新的产品与技术实践，探讨各个行业正在发生的音视频业务智能化转型案例。

视频云专场论坛回顾

在本次云栖大会视频云分论坛上，视频云团队联合客户展示了AI视频生产、智能体互动等热门技术方向的最新成果，涵盖产品发布与行业应用案例，并共同探讨了智能化浪潮下音视频技术的未来十年发展趋势。

智启视界：AI驱动下的视频云新范式

2025云栖大会视频云分论坛中，阿里云智能集团视频云负责人何亚明从AI时代的视频机会和空间、AI视频生产新范式、AI实时互动智能体、从云原生到智原生，从PaaS到VaaS四个方向展开介绍了AI驱动下的视频云新范式。

“可以看到越来越多的视频在AI的基础上进行了提效，AI生成的视频内容同比增长约达70%，视频创作效率提升约70%，制作成本降低约40%。这些数字都告诉我们一件事情，视频云的AI拐点已经到来。”何亚明表示，在AI驱动的时代，阿里云视频云正在全力投入并拥抱AI。

围绕AI在视频云中的应用，何亚明重点分享了其在视频生产及智能体互动等场景的最新业务实践：

在AI视频生产的方向上，视频云将AI全面应用到媒资管理与剪辑制作的各个环节，推出了对话式剪辑新能力；同时视频云将AI应用于实时流制作，在成功应用「子弹时间」的基础上，全面升级了阿里云赛事活动特效视频解决方案「Mucar+」
在智能体互动的探索上，视频云将实时音视频RTC的低延时能力与云上编排技术相结合推出的AI实时互动方案已经在教育、出行、智能硬件等多个行业实际应用并为客户业务产生价值。

何亚明指出，AI驱动的长期发展潜力是不容忽视的，阿里云视频云正通过全面升级产品研发的架构与模式，构建视频云业务的新范式与新形态。视频云期待与产业伙伴共同推动智能视频云技术的演进，在AI时代实现更深度的产业协同与价值共创。

AI执笔，光影重生：重塑视频生产新范式

阿里云智能集团视频云高级产品专家杨狄分享了AI在视频生产方向的应用与产品实践，他回顾了视频生产的经典流程，指出AI当前正在深化在后期处理中的应用，并表示AI在视频生产中的机会，是围绕效率与品质，提升在品质门槛之上的生产效率，创造创新的视觉体验。

杨狄围绕视频云在视频生产效率与体验上的产品实践，重磅发布了对话式剪辑的全新能力、「Mucar+」阿里云赛事活动特效视频解决方案两大产品方案：

对话式剪辑新范式：与传统剪辑软件不同，视频云全新发布的对话式剪辑能力通过自然语言交互的形态，依靠大模型意图识别与工具调用的能力，极大降低了视频剪辑的门槛，为更高效的视频生产提供了产品新解法；

「Mucar+」阿里云赛事活动特效视频解决方案：视频云以巴黎奥运会的「子弹特效」为基础，全新发布了时间切片、实时数据叠加等一系列特效融合编排的完整解决方案，助力赛事活动特效视频体验的全面升级。

最后，杨狄表示视频云+生成式大模型是下一个视频生产的范式转移，非常期待并且已经全面投入这个方向下的产品创新。从云原生到智原生：MCP、AI工作流、AI Agent与音视频技术的融合创新

阿里云智能集团视频云资深技术专家邹娟首先分享了视频云从云原生到智原生的技术演进路线，重点介绍了将音视频技术与MCP、AI工作流、AI Agent融合的架构升级过程，包括：完善支持AI推理与媒体处理帧级融合的统一智能引擎；将现有的转码、媒资、剪辑、导播等视频服务进行MCP化，实现统一可编排的服务控制平面；基于传统工作流、支持大模型节点的AI工作流、叠加支持流式实时处理与视频文件异步处理的音视频特性节点，建设统一的智能媒体工作流；设计支持多模态决策与自定义编排流程两种模式的AI Agent架构。通过以上四层架构的迭代更新，构建了视频云智原生的技术底座。

随后，邹娟分享探讨了视频云技术在转码、实时翻译及视频制作领域的最新应用实践，强调了从复杂参数配置、多API逻辑内置或手动编写，转向由用户原始需求驱动的全链路自动化处理。比如通过自然语言描述生成转码模板与智能转码流程，自动支持不同场景；通过工作流引擎的灵活集成模式与音视频流式实时处理的性能优化，快速搭建实时翻译Agent；通过一键成片白盒化的细粒度拆解与创意策略自定义等，实现视频制作成片规模化、高质量与个性化的平衡。

展望未来，以视频为核心元素驱动的VaaS、全面Agent化的视频服务将成为趋势，创意一键生成视频成片模式将加速到来。

AI实时互动再进化：开启「千体千面」新纪元

阿里云智能集团视频云产品专家陈杰军表示，AI通话领域基本完成从技术探索到商业落地的转变，在AI老师、AI陪练等场景涌现了大批优秀的应用。目前处于全行业规模迸发的早期，我们相信未来会有更多的企业陆续的参与其中。视频云的AI实时互动为这些企业提供了便捷、功能强大的AI通话云底座。

陈杰军在本次云栖大会发布了3项AI实时互动的重磅能力，涵盖了：

AI声学引擎2.0，实现超拟人自然通话；
"一体多线"的体系，通过RTC、电话、WebSocket全面触达用户；
更佳性能的端云一体架构。

接着分享了51Talk、高德、满帮等客户的最佳实践，其中高德通过AI陪练实现了本地生活场景销售KP转化率提升153.3%的喜人收益。

在最后，陈杰军宣布了更灵活、开放、智能的AI实时智能体，不再局限于AI通话场景，使得所有的诸如直播流、RTC流、摄像头流都能够通过自定义编排的方式，和AI进行实时结合，创造更多的可能性。

AI外教：用大模型技术重构教育普惠新范式

51Talk AI外教产品负责人罗旸，分享了在AI老师的场景的独到思考，51Talk考拉外教基于海量的真人外教课程数据、独创的学伴记忆体系等，构建了高水平、更懂孩子的AI老师，打破了教育领域“高质量内容、深度个性化教学、大规模规模”的不可能三角。

视频云AI实时互动和51Talk在AI老师场景深度共创，共同构建了低延时、超拟人的1V1在线课堂：

圆桌对话：音视频智能化体专题：AI Agent引领行业智能化升级

本次圆桌对话，视频云邀请到了北京点众科技股份有限公司智能投放业务负责人陈封羽、猿编程（北京）科技有限公司 CTO 塔拉、杭州灵伴科技有限公司 Rokid Glasses产品经理杨天翼和江苏运满满信息科技有限公司运营总监张跃等嘉宾，由阿里云智能集团视频云高级产品运营专家谢灵杰主持。对话围绕多个音视频AI Agent话题展开讨论，嘉宾各自发表了行业见解。

作为短剧行业的标杆企业，陈封羽介绍了点众在AI Agent应用的实践。她重点阐述了AI Agent在视频分析、智能剪辑及内容出海三大场景中的具体落地，展示了AI在提升生产效率、降低创作门槛以及推动文化输出等方面的价值。

随后，塔拉聚焦于AI技术对教育行业的效率提升与赋能作用，结合猿编程的AI教育实践指出，通过引入大模型能力，AI在优化课程研发与教学服务等流程上成效显著；同时，他也强调了AI Agent在规模化落地过程中仍面临关键瓶颈。

随着AI眼镜等可穿戴设备的发布，杨天翼期待AI在端侧运行能力以及融合多模态数据方面的突破。AI在全天候佩戴设备中对环境的持续感知能力具有广阔前景，他强调端侧小模型的研发对于改善国际用户的网络体验具有关键意义。

最后，张跃结合自身丰富的行业实践经验，深入分享了AI技术在物流领域的创新应用，特别是在满帮集团的落地成果。通过AI智能调度系统的深度应用，有效解决了货主与司机之间的沟通难题，显著提升了作业效率。

视频云展区高光分享

本届云栖大会期间，视频云团队在计算馆（2号馆）及前沿应用馆（3号馆）设置了多个产品体验展区，包含产品架构、行业解决方案、互动体验等，通过沉浸式场景让用户直观感受AI与视频云技术的融合创新。

2号馆-计算馆视频云展区

3号馆-前沿应用馆体验展区