新闻中心
AI视频生成技术迈向高可控时代商业化进程加速
随着人工智能技术的飞速发展,AI视频生成技术正逐步迈向“高可控”时代,商业化进程也在不断加速。2025年3月29日,在2025中关村论坛年会期间举办的“未来人工智能先锋论坛”上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军宣布,生数科技正式发布业内首个高可控视频大模型Vidu Q1,并计划于4月全球上线。这一重大突破标志着AI视频生成技术进入了一个新的发展阶段。
Vidu Q1的发布是AI视频生成技术迈向高可控时代的重要里程碑。相较于生数科技在1月推出的Vidu 2.0,Vidu Q1在技术层面实现了重大突破,能够接受空间布局信息作为输入,极大提升了视频生成的可控性。具体而言,Vidu Q1在多主体细节可控、音效同步可控、画质增强等方面均取得显著成效。例如,在语义指令的基础上,通过融入参考图的视觉指令,乐鱼体育平台Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的控制,对所有动作行为进行精准调整。音效同步可控功能则确保了随着视频环境与画面转场,Vidu Q1能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点。
随着AI视频技术的商业价值不断提升,资本市场对生数科技的关注重点也在发生变化。朱军表示,在公司早期阶段,投资人更关注团队实力,而如今,乐鱼体育平台除了技术壁垒,商业化进展已成为核心考量因素。视频的价值密度更高,商业化进程也更快。2025年将是AI视频模型商业化快速发展的一年。目前,生数科技的SaaS(软件即服务)产品已覆盖全球200多个国家和地区,上线天内用户突破千万,增速位居全球第一。同时,在MaaS(模型即服务)端,AI视频技术正在深入应用于动漫影视、文旅、广告、游戏等多个行业,重塑内容生产模式。
与语言模型市场不同,视频大模型的商业化路径更加多元,行业竞争格局也呈现出更多元化的态势。朱军认为,未来视频大模型不会出现类似语言模型市场那样的“一超多强”格局,而是依赖持续创新能力,向更高质量、更长时长、更强叙事性的方向发展。目前,行业内领先的公司在视频大模型领域各具特色,并形成了不同的商业化布局。例如,快手可灵、字节即梦、MiniMax海螺AI等不断迭代,OpenAI Sora正式上线,HeyGen、Pika、爱诗科技等完成融资。这些公司通过技术的快速迭代和与产业的深度融合,逐渐形成多样化的应用场景,以进一步提升其商业价值和竞争力。
随着基础模型能力的提升,行业将逐步向更长时长、更具叙事性的场景拓展。从短视频向更长时长、叙事性更强的方向发展,将成为未来的一个重要趋势。朱军强调,目前阶段最重要的仍然是通用基础模型的提升,它决定了后端在控制和一致性方面的能力,所有后端的实现都依赖于基础模型的进展。基于基础模型,生数科技也在不断探索,以实现更高的模型一致性和可控性。
总之,AI视频生成技术正迈向高可控时代,商业化进程也在不断加速。乐鱼体育平台随着技术的不断进步和应用的不断拓展,AI视频生成技术将在更多领域发挥重要作用,推动内容生产模式的革新和商业价值的提升。