大模型向越来越细分的领域进化,并且越来越 " 轻量化 "。在 FORCE LINK AI 创新巡展 · 上海站,火山引擎日前发布豆包 · 视频生成模型 Seedance 1.0 lite、豆包 1.5 · 视觉深度思考模型,帮助企业打通从业务到智能体的应用链路。
此次全新发布的豆包视频生成模型 Seedance 1.0 lite,支持文生视频、图生视频,视频生成时长支持 5s、10s,分辨率提供 480P、720P。
记者获悉,作为豆包视频生成模型系列的小参数量版本,Seedance 1.0 lite 模型实现了两大突破:影视级的视频生成质量、视频生成速度大幅提升,兼顾效果、速度、性价比。比如,它有更丰富的影视级运镜,支持 360 度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言;它也有更合理的运动交互,可分析动作时序与空间关系,提升人物、物体间自然流畅的交互动作,运动轨迹、受力反馈更加契合现实规律。
工作,新发布的豆包 1.5 · 视觉深度思考模型,激活参数仅 20B,但具备强大的多模态理解和推理能力,在 60 个公开评测基准中,有 38 个取得 SOTA 表现,在视频理解、视觉推理、GUI Agent 能力等方面均处于第一梯队。目前,该模型已在火山方舟上线。
在视频理解方面,这一思考模型支持动态帧率采样,视频时序定位能力显著增强,结合向量搜索,可精准定位视频中与文本描述相对应的片段。同时,模型新增视频深度思考能力,学习了数万亿多模态标记数据,使视觉推理能力大幅提升。例如,在复杂的图形推理题中,模型提出假设,进行推理检验,当发现和假设不一样时,还能进行不断反思,提出新的猜测,直到得出正确答案。
此外,该模型新增 GUI Agent 能力。基于强大的 GUI 定位性能,可在 PC 端、手机端等不同环境中完成复杂交互任务。例如,可对新开发的 APP 功能进行自动化检测,目前该功能已经应用于字节跳动多款 APP 产品的开发测试中。
目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖 4 亿终端设备、八成主流车企、70% 系统重要性银行和数十家证券基金公司、近七成的 C9 顶级高校和 100 多家科研院所。
在游戏行业,巨人网络正在借助大模型能力重塑游戏体验和玩法创新。通过火山方舟接入豆包大模型及 DeepSeek,巨人网络已在旗下《太空杀》中推出 Al 原生游戏玩法 " 内鬼挑战 ",基于大模型深度思考等能力打造 Al 玩家,与真实玩家进行实时策略对抗,重新定义了社交推理游戏的智能边界。同时,《原始征途》也接入大模型能力打造 AI 智能 NPC" 小师妹 ",在游戏策略指导、情感陪伴等方面提供更智能、更人性化的交互体验,显著提升了玩家粘性。
在医疗行业,礼来制药搭建了专属 AI 应用开发平台,支撑从药物研发到疾病诊疗的全场景创新。通过可视化工作流编排,礼来制药搭建了 HCP Chatbot, 地区经理辅导报告等智能体,在学术沟通、销售培训、疾病教育等多个场景中形成应用,实现了企业 AI 资产的沉淀与持续化运营。
登录后才可以发布评论哦
打开小程序可以发布评论哦