三易生活 03-25
AI NPC、一键语音修图,这些事情你需要知道!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

近日,AI 又整新活了!语音修图、AI NPC、文档播客……这些黑科技正在让 " 不可能 " 变成 " 基本操作 ",接下来请小伙伴们跟随本期的 AI 快报,一同速览近期的 AI" 大事件 "。

1、谷歌 Gemini 语音修图上线

谷歌 AI 黑科技再升级!最新发布的 Gemini 2.0 Flash 实验性功能,让 " 语音修图 " 成为现实。无需 PS 技能,只需一句话,AI 就能完成复杂图像编辑,甚至是去除水印和生成连贯故事板。

这项功能支持多模态交互,通过语音或文字输入提示词,AI 将理解提示词内容并立即响应修改,例如 " 给 Q 版星曜娘换成女仆装 "、" 给 Q 版星曜娘一套菠萝装 ",仅需十几秒的时间,就帮 Q 版星曜娘成功换装,且重绘的整体风格与原版几乎没有区别,生成的图片分辨率也与原版一致。目前这款功能允许开发者免费使用,甚至无需登录即可在 Google AI Studio 中使用。

2、《InZOI》将搭载 NVIDIA ACE

由 Krafton 打造的人生模拟游戏《InZOI》将于 3 月 28 日正式上线,这款采用虚幻 5 引擎构建的开放世界作品,首次深度集成 NVIDIA ACE(Avatar Cloud Engine)技术,通过生成式 AI 赋予 NPC 颠覆性的交互能力,重新定义 " 沉浸式体验 " 的边界。

ACE 是英伟达推出的革命性数字人技术套件,其核心在于利用生成式 AI 模型,使 NPC 突破预设脚本限制,具备感知、决策、行动与进化的类人能力。

ACE 在游戏中将被用来构建 Smart Zoi 功能,将游戏中的 NPC 转化为拥有自主意识的 AI NPC。这些 NPC 能与玩家进行深度互动,玩家可以通过打字或语音指令与 NPC 交流,它们能够理解上下文并作出相应的回应。例如,玩家可以要求 NPC 协助装修房屋,玩家将不需再遵循固定剧情线,而是与 NPC 共同改变世界,触发一系列无法预测的 " 蝴蝶效应 "。 

3、Deepseek-V3 小版本升级,编程与数学能力大幅提升

今日,DeepSeek-V3 模型低调完成了小版本的升级,实测性能引发业内广泛讨论,甚至被开发者们称为 "DeepSeek-V3.5"。该模型在编写代码和数学推理方面展现了惊人的效果,可在 2 分钟生成 400 行代码,并实现赛博朋克风格的个人网站,且集成了粒子动画等细节。而面对 "7 米甘蔗过 2 米门 " 难题,模型先碰壁后自主优化解题路径,展现了类人思维跳跃。

目前该模型已开源上线 HuggingFace,小伙伴们也可直接在 Deepseek 官网通过关闭深度思考功能试用。 

4、NVIDIA PDF TO PODCAST

NVIDIA PDF to Podcast(后简称 NPTP)是一款基于 AI 技术的工具,能够将 PDF 文档自动转换为音频播客,通过整合多个 PDF 文档的信息,让用户通过听觉高效获取信息。这项工具提供单人播客与双人对话的模式,生成的音频支持调整语速和语调,并添加背景音效,提升沉浸感。

NPTP 属于 NVIDIA 中的 AI Blueprints 项目,支持本地部署,可利用 NVIDIA GPU 中的 CUDA 进行加速 AI 推理,目前小伙伴们可通过 NVIDIA Build 门户或 GitHub 等平台下载部署并自定义功能。

想体验 AI 本地部署的极速快感,却苦于显卡性能不足?影驰 RTX 5080 系列显卡,你的 AI 算力引擎来了!其配备 16GB GDDR7 大显存,轻松告别爆显存烦恼,模型加载丝滑流畅。AI 算力高达 1801TOPS,可轻松应对各类本地部署的 AI 模型,让你的 AI 使用体验告别卡顿!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 黑科技 谷歌 数学 nvidia
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论