文汇 05-15
大模型越来越轻量化,兼具效果、速度与性价比的“三角平衡”可能吗
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

大模型向越来越细分的领域进化,并且越来越 " 轻量化 "。在 FORCE LINK AI 创新巡展 · 上海站,火山引擎日前发布豆包 · 视频生成模型 Seedance 1.0 lite、豆包 1.5 · 视觉深度思考模型,帮助企业打通从业务到智能体的应用链路。

此次全新发布的豆包视频生成模型 Seedance 1.0 lite,支持文生视频、图生视频,视频生成时长支持 5s、10s,分辨率提供 480P、720P。

记者获悉,作为豆包视频生成模型系列的小参数量版本,Seedance 1.0 lite 模型实现了两大突破:影视级的视频生成质量、视频生成速度大幅提升,兼顾效果、速度、性价比。比如,它有更丰富的影视级运镜,支持 360 度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言;它也有更合理的运动交互,可分析动作时序与空间关系,提升人物、物体间自然流畅的交互动作,运动轨迹、受力反馈更加契合现实规律。

工作,新发布的豆包 1.5 · 视觉深度思考模型,激活参数仅 20B,但具备强大的多模态理解和推理能力,在 60 个公开评测基准中,有 38 个取得 SOTA 表现,在视频理解、视觉推理、GUI Agent 能力等方面均处于第一梯队。目前,该模型已在火山方舟上线。

在视频理解方面,这一思考模型支持动态帧率采样,视频时序定位能力显著增强,结合向量搜索,可精准定位视频中与文本描述相对应的片段。同时,模型新增视频深度思考能力,学习了数万亿多模态标记数据,使视觉推理能力大幅提升。例如,在复杂的图形推理题中,模型提出假设,进行推理检验,当发现和假设不一样时,还能进行不断反思,提出新的猜测,直到得出正确答案。

此外,该模型新增 GUI Agent 能力。基于强大的 GUI 定位性能,可在 PC 端、手机端等不同环境中完成复杂交互任务。例如,可对新开发的 APP 功能进行自动化检测,目前该功能已经应用于字节跳动多款 APP 产品的开发测试中。

目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖 4 亿终端设备、八成主流车企、70% 系统重要性银行和数十家证券基金公司、近七成的 C9 顶级高校和 100 多家科研院所。

在游戏行业,巨人网络正在借助大模型能力重塑游戏体验和玩法创新。通过火山方舟接入豆包大模型及 DeepSeek,巨人网络已在旗下《太空杀》中推出 Al 原生游戏玩法 " 内鬼挑战 ",基于大模型深度思考等能力打造 Al 玩家,与真实玩家进行实时策略对抗,重新定义了社交推理游戏的智能边界。同时,《原始征途》也接入大模型能力打造 AI 智能 NPC" 小师妹 ",在游戏策略指导、情感陪伴等方面提供更智能、更人性化的交互体验,显著提升了玩家粘性。

在医疗行业,礼来制药搭建了专属 AI 应用开发平台,支撑从药物研发到疾病诊疗的全场景创新。通过可视化工作流编排,礼来制药搭建了 HCP Chatbot, 地区经理辅导报告等智能体,在学术沟通、销售培训、疾病教育等多个场景中形成应用,实现了企业 AI 资产的沉淀与持续化运营。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

效果 轻量化 巨人网络 分辨率 字节跳动
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论