阑夕 09-20
搜狗:大时代中的潜行者
index_new4.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文丨阑夕

2007 年 11 月 5 日,被 Google 收购注资两年多的 Android 发布了第一个可运行的 Beta 测试版,适逢智能手机的开智时代,不仅塞班、黑莓等老牌强敌依然牢牢占据着市场,在年初的 MacWorld 大会上,初代 iPhone 的发布也犹如一记惊雷预示着即将到来的浪潮。

在这样的背景下,Android 悄无声息的面世确实很难让人想象它日后会为世界带来怎样的变化。

2013 年,Android 创始人 Andy Rubin 在日本东京的一场新经济峰会上坦言,Android 系统的最初开发计划是应用在数码相机而非智能手机上的,随着后者在数码产品中的地位愈发凸显,Android 内部逐步修正了原本的商业计划,转而将其定位成「开源手机解决方案」。

在 Andy Rubin 忙着分享这则趣事的同一时间,诞生了仅 5 年的 Android 已经坐拥 10 亿用户,一举成为了史上用户增速最快的操作系统,无心插柳的举措,成为了母公司 Google 战略布局上最为重要的一环,同时这也让业界意识到了生态的力量,它为企业带来了上限阈值前所未有的提升,从 PC 时代到移动互联网爆发,能够缔造生态的企业始终处在领跑位置。

Android 的成功,离不开它在被 Google 收购前后几年里在技术层面的沉淀,趋势往往会青睐于这部分人,近来国内互联网的一起现象正在上演着与前文颇为相似的戏码,根据 QuestMobile 的数据显示,国内 APP 单月启动次数排行榜中,搜狗输入法赫然出现在了榜首位置。

这必然会冲击到许多人的既有观念,相比微信这样的国民级应用,搜狗输入法一直是隐性生态中的一员,作为搜狗的开山之作,它在深度渗透进人们使用习惯的同时制造了足够的用户粘性,但却因为产品商业化前景有限的形态下出现了许多不看好的声音,甚至在占据了输入法板块的主导权后,屡被评价为不再有「新故事」。

但实际上,输入法为搜狗带来的不仅是数据上的优异表现,更是拓展出了直接应用场景之外的更多可能,在这种背景下,用传统方式去评断一款产品究竟能在商业化上走多远显然是武断的,搜狗通过开放「听写能力」布局语音交互领域便是一起有力的佐证。

随着 AI 技术的普及,语音交互领域正在逐渐适用于生活中每一个细枝末节的场景,一个直观的例子是,智能音箱在家居中扮演的终端角色使其迎来了一波创业热潮,巨头们纷纷入局背后的逻辑,在于终端与硬、软件产品互动层面的联动效应极有可能产生 1+1 大于 2 的结果。

截止目前,搜狗输入法语音请求峰值已经超过 7 亿次,这起亮眼的数据得益于搜狗在技术研发领域的多年沉淀,从搜索引擎到输入法,搜狗的主要业务板块自始至终都秉持着技术导向的战略,作为技术出身的领导者,王小川在搜狗成立的十数年中,每新踏入与技术直接挂钩的领域时都格外谨慎踏实。

所以当搜狗发现最初应用在输入法中的语音交互领域还可以有另一番作为时,剩下的篇幅似乎就显得顺理成章了起来。今年 3 月,搜狗首度推出了 AI 录音笔 C1,不仅转写准确率高达 95% 以上,实时互译、云端分享、中英同传等多个建立在 AI 技术基础上的功能也备受好评。

而更重要的是,这只是搜狗布局 AI 战略的一次试水,想要解读 C1 录音笔的成功不能仅从单一产品的表现入手,听写服务与输入法打通后,后者手中所牢牢掌控的市场份额,使搜狗进军市面上任何一款涵盖语音交互的硬件产品都会变得得心应手。

换句话说,眼下录音笔行业的变革不是搜狗的终点站,它会延展至未来智能硬件产品的每一个边角,渗透进人们生活的每一个场景中。

而之所以选择录音笔这个并不能称得上多数人生活刚需的产品形式作为出发点,一方面是它与搜狗一直以来探索的语音交互领域息息相关,另一方面,录音笔直接面向的用户群体是媒体从业者,他们从产品中获取的用户体验能够更为直观且高效地传递给外界,而不是靠常规宣传。

依靠产品真正助益用户工作效率的本事,从另一个层面上彰显自身在技术领域所取得的进步,搜狗的这番做法既聪明,又很值得期待。

8 月 28 日,在全新「声」态,AI 未来的主题发布会中,搜狗向外高调宣布了两个消息,其一是它与爱国者、Newmine 纽曼、索尼录音笔、万城集团四家录音笔行业头部企业成立 AI 创新联盟,在 9 月 19 日 sony 录音笔的新品发布会上,搜狗 CTO 杨洪涛以及搜狗 AI 交互事业部负责人王砚峰对搜狗听写服务赋能 AI 录音笔行业做了进一步的分享,这也表明了搜狗正在与合作伙伴一同进一步深耕录音笔产业,并以自身的 AI 技术引领行业走向下一个阶段。

其二则是搜狗自身核心技术能力「搜狗听写」的服务开放,与前者相比,开放一项听写服务或许少了一些新闻性,但它背后反映出的却是搜狗在语音交互领域中多维度布局的战略,或者说,是搜狗在向「语音交互领域 Android」目标进发的野心。

在这背后,是搜狗转写相关术已经处于行业领先地位,例如其实时语音转写运用了搜狗自研的延迟可控的 Adaptive Attention-based 端到端建模技术,非实时语音转写功能则采用了深层 Transformer-based 端到端语音识别技术,语音转写准确率可达 95% 以上。

与此同时,搜狗听写服务的生态开放成果也显而易见,通过与搜狗输入法打通,依托后者在 PC 端和移动端的海量活跃用户,搜狗听写服务完成了个性化识别网络构建,使用户常用语错误率下降 40%。

而在搜狗开放听写服务后,可以为市场上 90% 以上的录音笔产品提供接入服务,让所有有需求的用户享受「录音 1 小时,出稿 5 分钟」的极致体验。

产品上的成功容易被下一个风口所取代,但缔造出的生态却不会轻易消失。

搜狗如今手握的生态,很大程度上诞生于时代趋势的影子里,从输入法到搜索与浏览器,搜狗自始至终都在秉持着克制的心态,人人都清楚缔造一项生态会为行业带来怎样的变革,但这并非能一蹴而就,鲜少有企业在汲取经验的路上能够做到不浮躁。

从这一点上看,过去的搜狗在各领域更像是一名「潜行者」,这些生活在影子中的经历,使其有底气在今天主动站出来扛起大旗,从而能在语音 AI 的下一个风口到来前将自己定位成一切「能听能说」的硬件产品底层技术支持方案。

眼下厚积薄发的革新意味着搜狗正在阔步走向舞台中央,无论对于王小川还是搜狗本身而言,他们的经验都势必会为疾驰中的语音 AI 列车带来一些不同的风景。

相关标签

搜狗 ai 搜狗输入法
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论