输入法正借助 AI 大模型,成为大厂竞争 AI 流量入口的新赛道。
6 月 28 日消息,智能纪元 AGI 独家获悉,近期,阿里全面上线了两款 AI 输入法产品——千问输入法独立桌面版、CosyVoice 桌面和 iOS 版。
尽管这两款输入法都是阿里巴巴研发,但分属两个业务部门。
其中,千问输入法是由阿里集团副总裁、C 端千问总裁吴嘉团队研发,27 日上线了 mac 桌面版,iOS版也已进入内测阶段。
而 CosyVoice 则是 To B 端阿里云团队研发的,基于阿里开源语音合成模型的输入法产品,该模型最早是由前阿里通义实验室语音团队负责人、达摩院创始 " 十三位扫地僧 " 之一鄢志杰领导团队研发,目前已上线 mac 版,27 日上线了 iOS 版本。
两款产品的功能、交互和产品体验,都与豆包输入法几乎一致,甚至可以说,千问和 CosyVoice 直接瞄准 " 豆包输入法 " 进行竞争。
不仅如此,智能纪元 AGI 独家获悉,阿里云昨天正式上线了Vibe Coding 产品Qoder 的移动 App 版本,直接对标字节的TRAE App,主要定位于在移动端同步进行 AI Coding 任务。
很显然,无论是聊天机器人豆包和千问,还是输入法、AI 编程、云计算等,阿里和字节在 AI 领域的竞争加剧,几乎处于 " 肉搏 " 状态。
当然,不仅是豆包和千问,大厂已扎堆布局 AI 输入法赛道。
阿里云的 AI 语音输入法 "CosyVoice"、千问的 " 千问输入法 "、腾讯的 " 微信输入法 " 和字节的 " 豆包输入法 "、科大讯飞的 " 讯飞输入法 " 等产品都拥有 AI 大模型能力。
如今,很多大厂和创业公司都在加速抢夺 AI 办公场景的核心用户流量,而 Mac 顶部菜单栏,已然成为各家 AI 语音输入工具必争的前沿阵地。
语音输入法并非阿里或字节先创,早在二十多年前就已经出现了。
从最早的笨重机械打字机和电传打字机,到开创个人电脑时代的 Apple II,键盘上的每个字符键和功能键都经历了重大变化,并且零星地分布在 QWERTY 键盘区域的角落里。
科大讯飞(讯飞输入法)是全球首款原生主打语音输入的手机输入法,早在 2010 年 10 月就已经落地在手机设备,成为行业第一个把语音识别作为输入法核心能力的产品,并且拥有了第一批 AI 语音输入法的种子用户。
后来,微软、谷歌、苹果都开发了各自的系统输入法,将语音成为输入法当中的一个功能性选项。
相对于键盘输入,语音输入法拥有三个核心优势:
1. 输入效率大幅提升。普通人打字每分钟 40 – 80 字,口语可达每分钟 150 – 300 字,速度是打字 2 – 3 倍;长文本、会议记录、随笔创作效率提升最明显。
2. 降低身体负担,解放双手。不用持续敲击屏幕或键盘,缓解腱鞘炎;走路、开车、做家务时可同步输入,不用低头盯屏幕;老人手指僵硬、视力差也更容易使用。
3. 适配中文痛点,识别更友好。中文同音字多、拼音选字繁琐,语音输入依托上下文自动区分同音词,支持方言、中英混说,不用纠结拼音拼写。
当然,过去十年,智能手机主导了数字生态系统,但智能手机从一开始就被设计成 " 供人盯着看 " ——它们所有的逻辑都止步于屏幕。
而且,语音输入法需要大量的语音和文字数据,很多人担忧隐私信息泄露,不敢使用语音输入法功能,仍依赖于从键盘到触控屏的输入。
因此,早期手机和系统自带仅有简单语音转文字工具,并非独立语音输入法产品,甚至很多人认为语音输入法效果不如预期,主要因为在 GPT 大模型热潮之前,NLP 只能做特定的任务,无法做通用任务。
过去,输入法是依附于手机、电脑系统的基础工具,比拼的是词库储备、按键准确率、皮肤生态与输入流畅度,赛道格局常年固化,讯飞、搜狗稳居行业头部,几乎无新玩家突围空间。
但 2023 年 ChatGPT 掀起的通用人工智能浪潮,彻底改写了这一局面。
庞大的云端数据模型 +CoT 思维链技术,以及 Whisper 模型开源,让语音输入法产品有了更精准识别的技术底座。
而且,AI 大模型与语音技术的深度融合,让输入法从 " 文字录入工具 " 进化为实时语义理解、内容创作、文本优化的人机交互入口。
2023 年 8 月,讯飞宣布首个在输入法内上线生成式 AI 创作助手,内置润色、扩写、智能回复,绑定自研星火大模型,语音输入同步联动大模型纠错、规整口语等。
与此同时,美国斯坦福创业团队研发基于 Whisper+ 通用大模型开发桌面全局语音听写工具 Typeless,成为海外最早主打「语音 + 大模型实时润色」的独立输入工具之一,下载量超千万,一度登上Product Hunt 前排,好评如潮。
这个消息回到了国内。
2024 年 7 月,微信正式入局,上线 AI 语音输入法,实现完整 AI 对话、AI 润色、语音大模型功能。
字节豆包则在 2025 年 1 月 20 日上线 " 豆包输入法 ",初期仅在豆包聊天界面使用,非全局输入法,随后发布独立的输入法产品,使用豆包同款语音识别模型,错误率最多可降低约 40%。
2025 年初,Typeless 竞品 Wispr Flow 在硅谷上线垂直 AI 语音输入法,公司累计融资 8100 万美元。
到了今年,随着千问成为阿里核心的 AI 助手产品,4 月全面开始在千问里面内测输入法功能。
这样一来,千问、豆包、讯飞、搜狗、微信、智谱这些大厂,还有秘塔等初创公司,都加入了 AI 语音输入法赛道,相当热闹。
无论是以讯飞、搜狗、微信输入法为核心代表的传统存量升级派,还是国内豆包输入法、智谱 AutoGLM、秘塔回响、通义千问输入法为代表的原生 AI 重构派,很显然,一场横跨海内外、新旧势力的输入法大战全面打响。
老牌厂商迭代革新,互联网大厂跨界入局,海外初创团队开辟新赛道,沉寂多年的输入法江湖,迎来史上最彻底的重构洗牌。
从手动打字到语音输入,从文字录入到 AI 创作,输入法的百年迭代,本质是人机交互方式的持续进化。
这场始于语音、终于智能的输入法革命,最终将实现 " 所思即所得、开口即成文 " 的终极交互形态,而小小的键盘输入窗口,也将成为人工智能落地大众、渗透全场景的核心入口。
艾媒咨询 2026 年数据显示,国内手机输入法用户规模已突破 8.2 亿,AI 语音输入日常使用率从 2023 年的 32% 飙升至 67%,越来越多用户放弃手动打字,选择 " 开口成文 "。
AI 语音输入正式从小众辅助功能,成为主流交互方式。
但问题在于,国内这一轮 AI 语音输入法基本处于 " 免费普惠、生态绑定 " 的核心特征,主要还是用入口换用户和流量,当然也有引导账号登录实现大模型功能。
当然,国内也有付费的输入法产品,如闪电说,需要用模型 API 调用或会员服务,实现更快速的反馈和技术功能。
然而,海外的 Typeless、Wispr Flow 却依然坚持限额免费 + 订阅付费体系,最低每月 12 美元。
其中,免费版仅提供基础小额听写额度;其他无限量语音输入、高级 AI 润色、自定义指令等功能,需要付费,从而实现产品商业化闭环,无需依赖生态引流,商业模式更纯粹、可持续。
因此,未来国内输入法赛道依然会面临两极分化格局:头部大厂依托生态与大模型能力,抢占大众通用市场,以免费、全能、轻量化为核心优势,垄断 C 端用户;初创厂商与垂直玩家深耕细分赛道,凭借定制化能力、付费服务或其他能力收割 B 端与高价值 C 端用户。
最后谈谈阿里与字节的竞争。
最近几个月,从简单的输入法功能,到 AI 电商、Agent 服务等,甚至还有投流、舆情等,两家大厂竞争异常激烈。
QuestMobile 数据显示,一季度豆包活跃用户增加 1 亿,千问增加 1.26 亿,排名从 2025 年 11 月的 TOP6 提升至 TOP2。
数据还显示,截止到 2026 年 3 月,AI 原生 APP 月活用户规模已达到 4.4 亿,其中,豆包、千问、DeepSeek 位居前三位,月活用户规模分别为 3.45 亿、1.66 亿和 1.27 亿,行业单季度新增超 1.3 亿用户。同时,三者在整个一季度的平均活跃率分别达到 33.5%、17.1%、21%,显示出用户粘性在快速提升。
QuestMobile 直接评价称:阿里巴巴旗下的通义千问与字节跳动的豆包,是目前中国本土 AI 应用与大模型市场的两大头部竞争者。双方经历了从 " 拼流量入口 " 到 " 拼商业化与实际效能 " 的激烈角逐。
如今,连 Vibe Coding 赛道,两家公司也是竞争激烈,TRAE 和 Qoder 功能迭代都十分相似。
近期火山引擎 Force 原动力大会主论坛上,字节跳动技术副总裁洪定坤用了接近 40 分钟讲 TRAE 这款产品,可以看出字节内部对于 TRAE 的关注和支持程度。
而阿里云的 Qoder 几乎每月都对外宣讲。
近期,TRAE 和 Qoder 都加上了 Design 设计功能,直接对标 Claude Design,引发了一波投流推广。
而国内Vibe Coding竞争加剧,背后的核心原因在于 Claude Code 和 Codex 拿到了用户的 " 心智 ",使得全球开发者对于Vibe Coding 的需求在增长。
OpenAI 近期公布的一份报告显示,高达97.9% 的活跃 OpenAI 员工使用 Codex,Codex 成为了工作相关 AI 使用的主要界面。
截至 2026 年 6 月 1 日,它占 Codex 和 ChatGPT 每周生成输出 token 的 99.8%;到 2026 年 5 月,80.6% 的抽样个人用户已经至少发出了一个 Codex 请求,该请求估计相当于超过 30 分钟的人工工作量。四分之一的用户发出了一个估计相当于超过八小时的请求。
洪定坤也指出,TRAE 上的 Token 日均消耗量高达5.6 万亿,Token 日均消耗量同比去年增长 50 倍。
这说明,市场对于 Vibe Coding 需求在增加,但是否能替代 Claude Code 和 Codex,还很难说。毕竟,Workbuddy 和 Qclaw 也是这些产品的潜在对手。
从 AI 大模型、原生 AI Agent 应用、云与基础设施,到硬件、具身智能、投资生态等,大厂在不断在 AI 领域进行竞争。
除了阿里和字节,蚂蚁、京东等诸多互联网大厂都希望从 AI 身上寻找 " 第二重叙事 ",因此,我认为,今年,这些大厂之间的 AI 竞争会更加激烈。


登录后才可以发布评论哦
打开小程序可以发布评论哦