
Google 正式发布 Gemma 4 12B,这是一款专为笔记本电脑本地运行优化的全新开源 AI 模型。该模型拥有近 120 亿参数,仅需 16GB 内存即可启动,支持完全离线的文本、图像及音频分析,旨在通过本地化处理有效保护敏感数据。
重构架构,提升本地推理效率
Gemma 4 12B 采用了摒弃传统编码器的新型架构设计。系统不再依赖占用大量存储的独立模块转换媒体数据,而是将素材直接输入核心大语言模型。结合令牌预测技术,该模型能够利用计算机闲置算力显著提升处理速度,缩短复杂请求的响应时间。
由于所有数据处理均在终端设备完成,无任何信息上传至云端,开发者可通过命令行工具将模型集成至自有应用,或利用 Google 听写软件实现完全离线的文本听写、整理与修改。
长上下文优势与多媒体限制
尽管主打轻量化部署,Gemma 4 12B 仍提供了高达 256,000 个令牌的上下文窗口,足以在本地深入分析长篇财务报告、大型文档或复杂代码。不过,其在多媒体处理上存在明确上限:音频输入限制为 30 秒,视频处理最长 60 秒且帧率仅为每秒一帧。
目前,该模型数据包大小约为 18GB,已登陆 Hugging Face 和 Kaggle 等主流开发者平台。基于开放的 Apache 许可证,企业在商业使用时无需支付许可费用,这使其成为兼顾隐私安全与成本控制的本地逻辑处理工具。
【来源:星途科讯】


登录后才可以发布评论哦
打开小程序可以发布评论哦