10 月 10 日,2024 vivo 开发者大会在深圳国际会展中心举办,大会主题为 " 同心 · 同行 "。会上,vivo 正式发布全新 AI 战略—— " 蓝心智能 ",同时带来全面升级的自研蓝心大模型矩阵、原系统 5(OriginOS 5)、蓝河操作系统 2(BlueOS 2)以及 vivo 在安全、人文、生态合作等方面的最新成果。
vivo 高级副总裁、首席技术官施玉坚首先登台,重点回顾了 vivo 在过去一段时间内取得的成绩。他提到,在过去三年和今年前三季度,vivo 始终稳居国产手机销量第一。不久前,vivo 还空降凯度 BrandZ 最具价值中国品牌百强榜单,因在消费电子赛道的稳健表现,vivo 同时荣获凯度 BrandZ 创新明星品牌奖。
去年,vivo 推出了自己的技术品牌—— " 蓝科技 "。蓝科技是从应用创新扎根到底层技术创新,从硬件驱动到形成软硬件一体化能力,这是 vivo 基于用户需求,所构建的技术研发体系。其包含了 " 蓝图影像 "、" 蓝海续航系统 "、" 蓝晶芯片技术栈 " 以及全新升级的 " 蓝心大模型 " 和 " 蓝河操作系统 "。
施玉坚表示,AI 时代已经到来,vivo 将始终保持开放的心态,无论是在手机硬件、AI 大模型、操作系统,还是在互联网与 IoT 领域,vivo 都将坚持用户导向的科技创新,不断探索科技的边界,与用户和开发者同心同行,共享合作发展成果,共建互信共赢生态,共创科技美好未来。
在去年开发者大会上,vivo 发布了自研十亿、百亿、千亿三个参数量级,由 5 款语言大模型组成的蓝心大模型矩阵。并在行业中率先跑通了 1B、7B、13B 的端侧大模型,同时基于蓝心大模型推出了蓝心小 V 和蓝心千询 APP。去年 11 月,蓝心大模型在 SuperCLUE、CMMLU、C-EVAL 等多个大模型榜单上,综合能力排名第一。vivo 对于蓝心大模型的定位是,通过丰富中文数据与知识的供给,把蓝心大模型做成最懂中国人的大模型。截至今天,vivo 的 AI 能力已覆盖全球 60 多个国家和地区,服务超过 5 亿手机用户,大模型 token 输出量超过了 3 万亿个。
而在此次大会上,vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围正式发布了 vivo 的全新 AI 战略——蓝心智能。
蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务 ; 同时,蓝心智能将全方位守护用户的隐私安全 ; 通过系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。
为了达成这一点,vivo 从三个方面用 AI 重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。在蓝心大模型的加持下,手机将具备更强大的分析能力,无论是按压屏幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。而依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,让蓝心小 V 在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。
第二个方面是重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,从而让手机成为智能温暖的个人助理。vivo 依托蓝心大模型对手机的基础功能进行了全面升级。同时,vivo 为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo 还构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。
会上,vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围展示了 vivo 基于蓝心大模型技术做出的一次全新探索,即 "PhoneGPT" 也就是手机智能体。在演示中,蓝心小 V 不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。这是手机自动化的一小步,却是解放用户双手的一大步。随着 AI 发展,未来 PhoneGPT 一定会带来更多的应用场景,更好的智能体验,让小 V 成为更懂你的私人助理。
第三个方面是重构人与物理世界的连接体验,让沟通更顺畅和温暖。去年,vivo 读谱功能的发布,让喜爱音乐的视障人士可以利用手机学习乐谱和乐器。而今,vivo 利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。vivo 希望通过 AI 技术跨越沟通的鸿沟,帮助障碍人群去追逐梦想,去探索世界的美好。
为进一步夯实 AI 能力底座,vivo 在今年的开发者大会上发布了全新自研蓝心大模型矩阵。全面升级语言大模型和端侧大模型能力,并带来 vivo 自研的语音大模型、图像大模型以及多模态大模型。这预示蓝心智能,向着个人化和多元化发展迈出重要的一步。
在语言大模型上,千亿级蓝心云端大模型,重点优化了意图理解与分发和任务规划能力。相比去年,整体能力提升 30%,在 SuperCLUE 和 C-EVAL 榜单上继续领跑国内第一梯队。
用户的隐私安全始终是 vivo 打造蓝心智能的首要原则,继去年带来了三款端侧大模型之后,vivo 正式发布全新 30 亿参数量级的蓝心端侧大模型 3B。在对话写作、摘要总结、信息抽取等能力上,蓝心 3B 可以越级比肩行业 7B-9B 模型。相比蓝心 7B,蓝心 3B 极致性能提升 300%,平衡模式下功耗优化达 46%,极致出词速度可以达到 80 字 /s,系统功耗仅 450mA,内存占用仅 1.4GB。在 SuperCLUE 和 Equal Eval 的小模型综合能力评测中,蓝心 3B 均排名第一,同时获得了泰尔实验室端侧大模型综合能力认证以及 AIIA 安全防范能力认证。
除此之外,vivo 还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型、强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型。
未来,蓝心智能将以蓝心大模型矩阵为技术底座,继续探索 AI 与 OS 的深度融合,持续打造开放共赢的智能体生态。
原系统 5(OriginOS 5)正式亮相:自然流畅超有 AI。
操作系统作为用户与手机接触的首要界面,直接决定了用户的使用体验。本次 vivo 延续 " 自然舒适、符合直觉 " 的设计理念,将自身在 AI、续航、通信等领域的技术成果,以及对手机基础体验、设计、人文等层面的思考集中落地,推出新一代操作系统——原系统 5(OriginOS 5)。
在原系统 5 中,作为 AI 重构系统体验的基础,蓝心小 V 与 Jovi 语音正式合并,带来了更加自然的语音交互体验。新增了长按屏幕底部,呼出 " 小 V 搜索 " 等一些列全新的交互方式。基于蓝心多模态大模型技术,vivo 全新推出小 V 圈搜功能,在既有的文本搜索基础上,通过图像识别与圈选交互的结合,精准搜索对象,为用户带来更加便捷的 " 一圈即搜 "。
原系统 5 还全新升级了 " 原子岛 " 功能,除通知功能外,其拥有蓝心小 V 强大的意图识别能力,不断分析和判断用户当前的需求,主动为用户提供后项服务。并且以更灵活的设计,一按一复制,或者一按一拖拽,满足用户的多任务需求。
除此之外,原系统 5 升级了以桌面组件的形式为你全天提供智慧服务的 " 小 V 建议 "、支持同声传译的 " 小 V 帮记 "、内置 " 小 V 写作 " 能力的 "vivo 输入法 "、支持一键剪辑以及 AI 定制词曲的 " 小 V 时光剪影 "。全新推出了能够记住和用户相处点滴的 " 小 V 记忆 " 功能,同时 " 小 V 跨端生态 " 也首次让用户可以在电脑端以及车机端与小 V 进行直接交互。vivo 在原系统 5 的电话、相册等数十个模块中通过蓝心智能为用户带来了触手可及的智慧体验。
流畅方面,原系统 5 构建了包括光影、交互、形态切换以及场景过渡在内的全方流畅体验,进行了超过 1000 项流畅体验优化,旨在将 " 自然舒适,符合直觉 " 的使用感受贯穿于系统的每一个场景。
在系统底层层面,原系统 5 的不公平调度机制再一次迎来了 3.0 版本的重大升级,首次引入 GPU 不公平调度机制,通过智能分配 GPU 资源,显著提升前台应用的流畅度。在内存层面,原系统 5 创新性地引入了安卓领域内首创的 Ledger 内存账本机制,实现了系统级的内存资源精准调度,对内存资源进行统一分配和管理,有效减轻了应用的负担,同时,它还能智能构建内存账本,根据实际应用场景动态优化内存分配,确保手机中的每一份内存都能得到高效的利用。显示层面,原系统 5 的虚拟显卡升级到了性能更加强劲的 2.0 版本,作为 vivo 独家首发的显示增强技术,其集成了极速响应动效架构、合成渲染加速器、图形链路协同引擎三大核心技术,全面优化从触控到反馈界面的全链路体验。
原系统 5 专注于解决用户痛点并持续优化使用体验。在网络通信方面,原系统 5 在用户场景驱动下实现了全新技术突破和全面体验升级。基于蓝牙,实现了行业首创的公里级无网通信技术,在无网空旷环境下,支持最远超过 1.5 公里的点对点语音对讲和文字聊天。针对 Wi-Fi 穿墙的居家场景、网络拥塞的万人演唱会场景以及弱信号的电梯、高铁、地铁等通勤场景,原系统 5 同样进行了深入的网络性能调优,确保全场景流畅网络体验。在续航方面,原系统 5 推出全新升级的蓝海续航系统,包括引入全新的场景能效引擎,带来异构计算空间 2.0 等技术,实现了电量高效精准管理,全天候续航无忧。
除了 " 理性工程 ", 原系统 5 亦演绎感性美学,在设计上基于原子设计体系进行了两大维度升级,首先引入了空间化感知理念,借助丰富的光影和材质表达、分类卡片式列表等,让界面内容一目了然,并推出还原人日常感受自然方式的全景天气,带来现实与虚拟世界自然融合的奇妙体验。另一维度,原系统 5 诠释优雅美学,升级个性锁屏、情境壁纸等功能,屏幕熄灭、点亮之间尽显自然舒适,让数字世界更加温暖。
在过去的一年,通过实施用户顾问计划,每个月组织团队认真倾听用户建议,邀请用户顾问参与到创新的每个环节。无论是体验的反馈,还是对美学的不懈追求,都为系统团队提供了丰富灵感。这也成就了今天原系统 5 的升级之旅。
继去年 11 月 vivo 首次发布自研蓝河操作系统(BlueOS)之后,今年的开发者大会上,能力全新升级的蓝河操作系统 2 同步亮相,其搭载着基于 Rust 语言编写的实时操作系统内核——蓝河内核,其具备安全、通用、高性能的特性,能够兼容不同的嵌入式平台,具备完整的系统调度、内存管理、文件系统、网络和设备管理能力。而蓝河操作系统 2 也将成为行业首个全栈由 Rust 语言编写的操作系统。
蓝河操作系统 2 构建了更加智慧的系统架构,首先最底层是由 vivo 自研的蓝心大模型,和 VCAP 推理计算加速平台共同构成的底座。蓝河从设计之初就整合了蓝心大模型矩阵,支持不同参数蓝心大模型的灵活端云部署,并且支持视觉、语音等多种 AI 算法。另外,VCAP 保障了各种 AI 算法在端侧的高效运行。 在这个底座之上,我们带来了全新的服务引擎,它包含数据服务、意图的感知和决策服务等,为意图框架提供了能力支撑。 意图框架能够基于用户的行为和使用习惯,充分感知用户的使用场景,准确理解用户意图,最后自动规划和执行任务。通过这个系统架构,蓝河操作系统 2 从底层构建 AI 能力,进一步实现天生更智慧。
蓝河操作系统 2 深度融合了蓝心智能强大的 AI 能力,其中蓝心大模型为技术底座,蓝心小 V 为专属助理,智能体平台提供专业服务。在生态方面,蓝河兼容了开放原子开源基金会孵化的 hapjs 快应用标准,随着快应用升级到 2.0,也将为用户带来更加智慧的服务生态。同时,vivo 为开发者带来了全新的蓝河 UI 框架。基于自适应 UI 布局,只需要一次开发,就能在不同尺寸的屏幕上带来一致的体验。
在 AGI 时代,除了更加智慧的操作系统,智能硬件也迎来了新一轮的变革。蓝河操作系统 2 适配不同大小的设备,也能为不同设备赋予强大的 AI 能力。vivo 愿意与行业开放合作,共同探索蓝河操作系统 2 以及蓝心大模型,搭载在智能眼镜、机器人乃至更多 AI 设备上的解决方案,共同打造真正面向未来的智能终端。
近年来,vivo 围绕智慧出行、智能家居、智慧办公、运动健康、影音娱乐等五大生活场景持续深耕,致力于打破不同品牌之间的壁垒,以用户为中心,实现真正的开放智联。对此,vivo 一方面做到生态开放,积极打造自有能力,并赋能给外部生态设备。同时牵头创建联盟、广泛兼容行业标准,让用户突破生态壁垒,自由连接心仪的智能设备。 另一方面 vivo 希望让连接更智能。vivo 将强大的 AI 能力跨端流转到生态设备,让用户能够通过自然语言与设备高效沟通。
现阶段,vivo 智能车载已实现覆盖规模行业领先,连接超过 170 个汽车品牌,覆盖超过 8500 款车型。vivo 以开放共赢的态度积极推动行业技术发展。 为实现智能车载、数字车钥匙技术升级,vivo 牵头发起 ICCOA 联盟,推出的协议覆盖了市场上超过 350W 辆汽车。
在家居智能设备互联的场景中,vivo 深度参与 matter 生态建设,适配可连接的品类在联盟中有超过 1200 多个 SKU。同时,vivo 还支持 CCSA 等权威协会,帮助制定了 20 余项 IoT 行业标准。
此外,vivo 通过 " 小 V 跨端 " 实现了 AIGC 能力上车、上电脑,还将推出 " 家居智能体 " 和 " 车载智能体 ",让用户能通过自然语言控制智能设备,让连接更便捷。值得一提的是,vivo 还成为国内首家能兼容苹果生态的厂商。为了给用户带来更丝滑的跨设备体验,我们通过深度适配苹果 M 系列芯片,实现了与苹果电脑的跨端协同,用户可以通过 vivo 办公套件对苹果电脑进行全端搜索、远程操控。
新兴技术发展带来生活和生产效率的巨大飞跃,但开展技术时必须考虑到安全、人文和产业的协同发展,才能让技术更好地落地应用、造福人类。
会上,vivo 首席安全官鲁京辉分享了 vivo AI 在安全领域的最新进展。他表示,在隐私权限守护上,vivo 倡导并实践 " 透明化 " 的隐私政策,将权限主导权交给用户。在提供 AI 服务时,vivo 采取 " 端侧优先、端云协同 " 的技术策略,能在端侧处理的数据绝不上云。在面对复杂的 AI 任务处理时,在保障用户隐私和数据安全的前提下调用云侧大模型能力,以此实现高效、安全的端云协同,确保 AI 服务既智能又安全。面对敏感的隐私信息,vivo 通过匿名化处理和差分隐私技术,在收集与分析数据前移除或模糊个人身份信息,在保障隐私前提下来提供个性化服务。鲁京辉强调,打造个人化智能,用户隐私安全始终是首要原则,vivo 会继续在个性化服务与隐私保护之间寻找最佳平衡。让蓝心智能的 " 私人定制 " 便捷贴心,安全可靠。
此外,vivo 通过蓝心智能将端侧 AI 能力赋能 " 千镜可信引擎 ",构建了全链路诈骗防护。同时升级了手机丢失防护体系,推出全新的 " 查找网络 " 功能。除离线查找外,利用数以亿计的 vivo 设备和先进网络定位技术,在安卓阵营率先实现关机定位,提升手机找回概率。若无法找回,可远程物理级安全删除数据,同时还有芯片级刷机激活锁防盗用。三重防线,层层守护你的设备及数据安全。
科技的成果可以普惠于每一个人,包括我国近 3000 万的听障人群,1730 万的视障人群和超过 2 亿的老年人。vivo 持续以 AI 技术赋能无障碍应用体验。去年,vivo 推出了首款集手语识别与合成于一体的软件 " 手语翻译官 ",并在 CCL2024 手语数字人翻译质量评测中,获得了第一名的成绩。今年,为了协助国家通用手语的普及与推广,我们在 " 手语翻译官 " 中升级了 " 手语学习 " 功能,希望可以帮到更多的人学习手语。
同时,基于蓝心语音大模型,"vivo 听说 " 新增了方言自由说功能,目前支持 6 种方言,以解决各地区间的沟通障碍问题,也让用户可以以自己最熟悉的乡音与手机进行交互。而为了让更多人的乡音能被语音大模型识别,接下来,我们会把越来越多的语种适配进手机的各种功能中,让手机的语言交互更自然,更符合人的直觉,让人与人之间的的沟通更流畅,更温暖。
除 "vivo 听说 " 外,"vivo 看见 " 同样得到了语音大模型加持,新增了实时问答功能,成为行业首款多模态大模型视觉辅助产品。基于多年的技术积累与行业实践,vivo 为 8 月 28 日正式开馆的国家无障碍环境展示馆制作了行业首款视障用户导览软件。通过 vivo 手机产品和 "vivo 看见 " 的视觉辅助功能,为展馆提供助力。
同时,《vivo 无障碍解决方案》入选联合国 ITU《人工智能向善案例集》、世界互联网大会《公益行动计划书》,获得了《可及信息无障碍优秀案例》等 10 余个权威奖项及荣誉。vivo 成为中国残联战略合作伙伴,面向 10 所高校的 1000 多名残障学子公益捐赠无障碍设备,并招募了 100 位梦想导师,助力残障青年就业,帮助他们勇敢逐梦。
vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围表示,一花不是春,独木不成林。vivo 始终秉持 " 协同发展,互信共赢 " 的合作理念,不断深化并整合底层核心技术,涵盖提升应用体验的度量系统能力、引领创新的 AI 和蓝河操作系统技术、开放智联的 IoT 技术等。
AI 作为新一轮科技革命的核心力量,为产业提高运营效率、优化用户体验、增强市场竞争力创造了新契机。vivo 希望凝聚全球合作伙伴及开发者持续开展深入合作,加速产品服务创新和产业生态构建,共同开启 AI 时代的无限可能。
登录后才可以发布评论哦
打开小程序可以发布评论哦