半岛·体育(综合)官方APP下载·IOS/安卓/手机APP下载

咨询热线:

+86-0222-22366





半岛综合体育

国产视频生成大模型与Sora“正面刚” 国内外差距正缩小

发布时间:2024/10/04    浏览次数:

  国产视频生成大模型与Sora“正面刚” 国内外差距正缩小今年以来国产大模型快速更新迭代,文生视频赛道迎来强有力的中国选手。9月24日,豆包大模型发布两款视频生成大模型,加速丰富大模型商业应用场景,而5天前的2024云栖大会上,阿里通义率先发布的全新AI视频生成大模型,更率先面向公众免费开放使用。记者留意到,此前快手、Vidu等国内厂商也推出相关视频生成模型内测。

  业内研报指出,自今年2月OpenAI发布Sora后,国产大模型仅用半年时间实现赶超,国内外视频生成模型之间的差距已明显缩小,视频大模型因具备广阔商用潜力,下游应用正积极储能。

  只需简单的文字或图片描绘,一条达到影视级的声画并茂的视频就能自动生成……这在半年前只有国外OpenAI可以做到,如今国内AI视频生成领域正迎来一系列令人瞩目的突破。字节演示的豆包生成视频大模型显示,其根据提示词生成的视频不仅细节丰满,而且镜头电影质感十足;阿里云则一次性放出了文生视频和图生视频两个创作入口,通义万相AI能够一键生成最长5秒、每秒30帧、720P分辨率的音画同步视频。

  业内指出,相对于大语言模型、视觉大模型等,视频生成大模型是相对最难的。火山引擎总裁谭待表示,“(AI视频生成)需要大模型能理解复杂指令,包括对多镜头语言的运用半岛综合体育官方网站,实现多个主体的交互视频,保持风格的一致性等。”

  今年2月,OpenAI发布全新的文生视频模型Sora,率先开启了AI视频生成的ChatGPT时刻;3月26日,字节跳动旗下剪映Dreamina开放内测;4月27日,首个自研视频大模型Vidu发布;6月6日,快手可灵AI正式开放内测……9月,阿里通义、豆包大模型相继发布影视级的视频生成大模型。仅过了半年,国内涌现出多款对标Sora的AI视频大模型。

  德邦证券发表研报称,Sora视频大模型发布至今,加速引爆视频赛道,国内外已有十多家公司发布或更新视频生成模型,抢占用户或为未来主线。

  相比热门的国外视频生成模型,国产视频生成模型正快速拉近差距,而且具有明显特点。浙商证券计算机首席分析师刘雯蜀指出,在中文语境下,国内模型文生视频表现优于国外。阿里云CTO周靖人表示:比起国外的Sora、Gen-3 Alpha,通义万相的AI视频模型对中式元素针对性优化了概念理解和生成能力,“更懂中国话,更懂中国风”。

  如今诸多大模型技术已经应用到自动驾驶、游戏、金融、内容营销等各行各业,但视频生成大模型则处于刚起步阶段。

  在业内人士看来,抖音、阿里、快手等“大厂”率先出手布局视频生成大模型的动作表明,视频生成技术在人工智能领域正日益受到重视,并且正在快速进步,未来可能会对影视制作、广告设计等多个领域产生深远影响。“尤其是在微短剧市场率先开启商业化应用。”

  阿里通义方面的模型研发负责人告诉记者,视频模型的训练使用了多种风格的视频数据,因此可生成科技感、电影色、风格和素描等类型丰富的视频,“未来将进一步实现2K超清效果,可应用于短视频、电影制作等场景。”

  事实上,如今已有越来越多的影视制作公司和平台开启探索“AI+微短剧”的融合路径。今年7月,国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》正式上线,全剧实现了画面完全由快手的AI视频大模型制作生成。同月,抖音联合博纳影业也推出了全国首部AIGC连续性科幻短剧集《三星堆:未来启示录》。集团影视制作副总经理曲吉小江认为,在中国网络短剧市场爆发式增长时期,AIGC(生成式)技术的应用为行业发展打开了新的增长空间。

  德邦研报亦指出,未来随着用户习惯的培育以及算力基础设施的完善,视频大模型或在办公、广告、电影、等多领域具有广阔的前景。

  国家数据局局长刘烈宏此前公开介绍,中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。视频生成大模型的前景更值得期待。据东吴证券研报测算,若以AI渗透率为15%计算,中国AI视频生成的潜在行业空间达3178亿元。

  不过,国内多个投资机构依然对文生视频、图生视频等大模型持保守和谨慎态度。业内人士提示,视频生成技术虽然在加速迭代,但产业规模待进一步深挖,包括技术和成本等多个现实问题不容忽视。

  技术上,视频生成大模型需要依赖于先进的算法和强大的计算能力,还必须解决包括一致性、连贯性、物理合理性以及逻辑合理性在内的多种复杂问题;在商业落地上,需要更为成熟的应用场景,目前仍然局限在影视制作、社交平台上。

  最后则是成本问题,目前文生图和图生视频功能只能生成分镜头,再由后期剪辑团队人工剪辑而成。带来的价值也不如外界预期的那么大。业内认为,只有解决了成本,才能更好实现技术创新与普及。“只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。”中国电子商务专家服务中心副主任、互联网专家和观察家郭涛表示。


Copyright © 2018-2028 半岛·体育(综合)官方APP下载·IOS/安卓/手机APP下载 版权所有      黔ICP备18003557号-1
电 话:+86-0222-22366 手 机:08663022900
地 址:广东省半岛·体育(综合)官方APP下载
扫一扫关注微信