搜索
当前所在位置:首页 >> 风趣新

豆包影片生成大模型正式发布,首次突破多主体互动难关

发布时间:2025-09-10 13:07:52 作者:q 点击:3 【 字体:

字节跳动正式宣告进军AI影片生成。豆包大模9月24日,影片字节跳动旗下火山引擎在深圳举办AI创新巡展,生成式一举发布了豆包影片生成-PixelDance、型正豆包影片生成-Seaweed两款大模型,布首面向企业市场开启邀测。次突天津大学曝光全集

活动现场展示的破多影片生成效果令人惊叹。无论是主体语义理解能力,多个主体运动的互动复杂交互画面,还是难关多镜头切换的内容一致性,豆包影片生成大模型均达到业界先进水平。豆包大模火山引擎总裁谭待表示,影片“影片生成有很多难关亟待突破。生成式苏州大学内幕最新豆包两款模型会持续演进,型正在解决关键问题上探索更多可能性,布首加速拓展AI影片的创作空间和应用落地。”

豆包影片生成大模型正式发布,首次突破多主体互动难关

图:火山引擎总裁谭待发布豆包影片生成模型

创新工艺,破解多主体互动和一致性难题

此前影片生成模型大多只能完成简单指令,豆包影片生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包影片生成模型时发现,其生成的影片不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

据火山引擎介绍,豆包影片生成模型基于 DiT 架构,通过高效的DiT融合计算单元,让影片在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包影片生成模型独树一帜的工艺创新。

经过剪映、即梦AI等业务场景打磨和持续迭代,豆包影片生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包影片生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

目前,新款豆包影片生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有客户。剪映和即梦AI市场负责人陈欣然认为,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦AI希望成为客户最亲密和有智慧的创作伙伴。

豆包大模型推出业界最高并发流量标准

此次活动中,豆包大模型不仅新增影片生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、影片等全模态,全方位满足不同行业和领域的业务场景需求。

在产物能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态信息处理量也分别达到每天5000万张图片和85万小时语音。

此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业增长的关键因素。

据谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。

“在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和支持。”谭待表示。雷峰网雷峰网(公众号:雷峰网)雷峰网



雷峰网版权文章,未经授权禁止转载。详情见转载须知。

豆包影片生成大模型正式发布,首次突破多主体互动难关

阅读全文
相关推荐

62岁李连杰突发,已交代身后事

62岁李连杰突发,已交代身后事
不过大梦一场空封面 I 李连杰抖音作者 I 李东阳报道 I 李东阳朋友圈有关李连杰,近些年舆论场散落的大多是针对其衰老以及“被死亡”的猜测。在那个崇尚英雄的年代,李连杰塑造的武侠世界是几代人共同的宝贵 ...

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT
今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一,双方合作推出 ...

前小马智行孙又晗创立 Trans

前小马智行孙又晗创立 Trans
2023 年 7 月,孙又晗和潘震皓联合创立的自动驾驶卡车公司「擎天智卡」面临经营困局,几近停摆。大约 19 个月之前,两位从小马智行离职的高管决定创业,仅两个月时间就完成近千万美元的天使轮融资。成立 ...

启明创投发布2024生成式AI十大展望

启明创投发布2024生成式AI十大展望
7月6日,由启明创投主办的2024世界人工智能大会WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。大语言模型、多模态模型、具身智能和生成式AI应用领域 ...

超500台军参加美方演习?国台办回应

超500台军参加美方演习?国台办回应
8月27日上午,国台办举行例行新闻发布会。记者:据美媒报道称,有超过500名台军士兵参加美军今年度“北方打击”演习,并首度将模拟作战场景自欧洲转为“印太”区域。请问对此有何评论?国台办发言人朱凤莲:我 ...

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践
以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景 ...

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资 ...

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
下周苹果即将召开发布会了!但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。其实早在今年年初,国内就有 ...

网友热议:9月3日,放假吗?

网友热议:9月3日,放假吗?
随着中国人民抗日战争暨世界反法西斯战争胜利80周年纪念日临近,纪念活动的整体安排备受关注,其中的阅兵环节更是关注焦点。8月20日上午,国新办举行新闻发布会,介绍了九三阅兵准备工作有关情况。相关负责人介 ...

李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局

李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局
今日融资快报李飞飞旗下AI初创企业World Labs估值已超10亿美元英国《金融时报》报道,著名华裔计算机科学家李飞飞创办的World Labs估值已经赶超10亿美元。该创企主要利用类似人类的视觉数 ...

2024WAIC热议大模型助力产业新趋势,可信应用成焦点

2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外 ...

考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局

考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
今日融资快报多模态大模型行业解决方案提供商,考拉悠然完成亿元B轮融资成都考拉悠然由欧洲科学院外籍院士、ACM/IEEE/OSA Fellow 申恒涛教授领衔20余位海外名校归国博士创立。自主研发了世界 ...
返回顶部