央视听媒体大模型

案例概述：2023 年 7 月 20 日，中央广播电视总台联合上海人工智能实验室打造 “央视听媒体大模型”，以海量视听数据和深度专业知识为驱动，利用原创先进算法和超大规模算力进行训练，赋能视听节目创作、智能剪辑等多方面。
实现方式：作为首个专注于视听媒体内容生产的 AI 大模型，集合中央广播电视总台的海量视听数据与上海人工智能实验室的原创先进算法、大模型训练基础设施优势。具备强大的视频理解能力和视听媒体问答能力，可根据提供的视频创作文字（从主持词到新闻稿件，甚至诗歌），生成内容已覆盖美食、文化和科技等多个领域。能通过逐步呈现的视觉元素理解并分析视频，用户可通过聊天对话形式深挖视频信息以完善输出内容，还拥有交互式图像与视频编辑能力，支持 “指哪改哪，画随口出”。同时具备通用生成能力，可通过文本直接生成视频，也能快速生成 “数字人主播”，仅需较短真人采集视频即可生成对应数字人，且能自动学习真人语言及动作习惯，使形象更逼真、表情更自然。
主要成效：提供更加高效的智能创作工具，提升视听媒体制作的质量和效率。
社会价值：拓展视听媒体的创意空间、提高创作效率并带来交互方式的变革，为视听媒体行业发展注入新动力。

典型案例