专注于数字技术的商业观察者
登录×
观察
2025-02-18

参数爆炸!全球首个300亿开源视频模型支持540P 204帧生成

时间: 2025-02-18 编辑:

AI的创新步伐正在以前所未有的速度改变着各行各业。随着大模型技术的崛起,AI的能力达到了一个全新的高...

AI的创新步伐正在以前所未有的速度改变着各行各业。随着大模型技术的崛起,AI的能力达到了一个全新的高度。尤其是在自然语言处理、计算机视觉和语音交互等多模态领域,强大的生成模型正逐渐展示出它们的潜力。如何通过创新技术推动AI的实际落地,不仅是企业竞争的关键,也决定了未来技术的生态格局。

2025年2月18日,阶跃星辰和吉利汽车集团联合宣布将开源两款重磅大模型——阶跃Step-Video-T2V和阶跃Step-Audio。这一决定不仅在业内引起了广泛关注,也为全球开发者提供了一个宝贵的技术平台。这两款大模型不仅具备全球领先的性能,还标志着中国企业在大模型开源领域的崭新起步。

在AI技术飞速发展的今天,大型跨领域合作成为推动科技突破的关键。阶跃星辰与吉利的深度合作,不仅是一项技术创新,更是两家公司在智能化、数字化生态建设中的战略布局。从智能座舱到语音交互,从视频生成到AGI的实现,阶跃星辰与吉利的合作代表了未来AI技术发展的一个重要方向——多模态大模型的融合与应用。这样的合作,打破了传统技术边界,也为未来的AI技术普惠提供了新机遇。

全球视频生成的“破局者”:阶跃Step-Video-T2V

作为全球首个开源视频生成大模型,阶跃Step-Video-T2V模型的亮相,无疑是在视频生成领域掀起了波澜。它不仅拥有300亿的参数量,更具备能生成204帧、540P分辨率高质量视频的能力,这在业内是前所未有的。对于那些从事视频创作的开发者来说,这款模型无疑是一个神器。无论是复杂运动的再现,还是人物的美感呈现,阶跃Step-Video-T2V都展现了令人惊叹的生成能力。

通过这一模型,创作者不仅能够轻松实现创意视频的生成,更能在其中融入如镜头语言、双语输入等先进的功能。对于需要高质量视频内容的领域,例如广告制作、电影制作、游戏开发等,这款模型无疑提供了极大的便利。更重要的是,阶跃星辰还发布了Step-Video-T2V-Eval这一全新评测集,让视频质量的评测有了更为严格和标准化的依据。评测结果也显示,这款模型在指令遵循、运动平滑性、物理合理性等方面的表现超越了目前市面上的所有开源视频生成模型。

语音交互新突破:阶跃Step-Audio的诞生

在语音交互领域,阶跃星辰的另一款重磅大模型——阶跃Step-Audio,也正在引领一场变革。作为“行业首款产品级开源语音交互大模型”,它不仅能够生成情绪丰富、方言多样的语音,还能够实现高质量的音色复刻和角色扮演。对于电影配音、虚拟助手、在线教育等行业,阶跃Step-Audio的应用前景非常广阔。

这一模型的亮点,不仅在于语音的自然度和情感表达的细腻,更在于它的多场景适应能力。无论是影视娱乐中的角色扮演,还是社交平台上的个性化对话,阶跃Step-Audio都能根据不同的需求做出精确的调整。更令人惊讶的是,它在多个公开测试集中的表现均超过了同类开源语音模型,特别是在HSK-6(汉语水平考试六级)测试中的优秀表现,使得它成为了“最懂中国话”的开源语音交互模型。

值得一提的是,阶跃星辰还专门开发了StepEval-Audio-360基准测试,对模型进行了全面的性能评估。从角色扮演到逻辑推理,再到创作能力,这一全方位的测试体系为开发者提供了客观、标准化的评测标准,也进一步提升了阶跃Step-Audio在行业中的竞争力。

开源合作:拥抱全球开发者,推动AI普惠

此次开源,不仅是阶跃星辰的一次技术分享,更是一次AI技术普惠的倡议。在AGI(通用人工智能)成为未来发展趋势的背景下,阶跃星辰创始人、CEO 姜大昕博士表示,“开源是其推动技术创新和合作的核心战略。通过将Step-Video-T2V和Step-Audio这两款领先的大模型开源,阶跃星辰希望能够汇聚全球开发者的力量,共同探索多模态AI的未来。”

此外,阶跃星辰与吉利的合作也给整个行业带来了深远的影响。吉利集团作为智能汽车行业的领跑者,通过自研的星睿AI大模型与阶跃系列模型的深度融合,不仅提升了智能座舱与智能驾驶的用户体验,也为未来的汽车科技生态提供了全新的可能性。与此同时,Hugging Face等全球开发者平台也对这两款开源大模型表示了认可,进一步证明了阶跃星辰在大模型领域的技术领先地位。

结语

从视频生成到语音交互,再到多模态AI的前沿探索,阶跃星辰和吉利的合作不仅代表了科技发展的趋势,也展示了中国企业在全球AI领域的崭新风采。随着开源大模型的逐步落地,我们可以期待未来AI技术能够真正实现普惠,帮助更多开发者与企业解锁创新的潜力。正如姜大昕博士所说:“我们相信,AGI的实现离不开全球开发者的共同努力。”这一切的努力,正是为了让技术更加贴近我们每个人的生活,推动智能时代的到来。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。