不知道你们有没有过这样的经历,发现一部宝藏片子,迫不及待打开后发现——没!有!字!幕!
那种感觉,就像是饿了三天三夜,终于看到一桌满汉全席,却发现自己没带筷子。
无奈只能听着半懂半不懂的 " 鸟语 ",靠着丰富的想象力脑补剧情。等野生字幕组大神 " 烤出熟肉 ",黄花菜都凉了。
这样想看却看不懂的痛,对于天天高强度冲浪的老司机来说,我们都懂!
不过最近,QQ 浏览器悄悄更新了一个新功能——实时字幕。号称能把所有视频、直播甚至是线上会议,都能实时翻译,相当于做了一个同声传译。
你说,一个做浏览器的,竟然想着竟然抢字幕组的饭碗,这不是没活硬整吗?
为了搞清楚这到底是噱头还是黑科技,老狐第一时间更新了 QQ 浏览器,给大家来试试水!
这功能到底有多骚?
首先,QQ 浏览器这功能怎么用?
我安装了最新版本,然后特意上去 YouTube 打开了一个视频,没想到在视频的右上角,就能看到一个 " 实时字幕 " 的按钮,
点击一下,字幕竟然就这样水灵灵地自己生成出来了!
整个操作行云流水,一点都不复杂,更不需要额外装插件,这样傻瓜式操作对于绝大部分电脑小白来说极其友好!
它和我们常见的字幕有些许不同,而是在视频上直接弹出一个可以随意设置的字幕框。
字幕显示支持双语,并且只要把字幕框放大,甚至能查看过去的字幕。
根据官方的介绍,这个字幕,是语音识别技术 + 腾讯混元模型的结果,也就是说,它识别的是视频本身的语音,
这也是为什么它能做到实时翻译,而不是我们常见的提前布置字幕。
而且只要是腾讯的混元 AI 会的语言,它都能全部翻译出来,
现在它提供了 16 种语言识别,像英语、日语、韩语、泰语这些主流语言基本不在话下,它的语言栏目都有显示
最后,它还有一个 " 其他语言 ",具体包括什么语言,暂时就没有明说了。
在功能上,我还测试了一下 " 实时直播 "。
因为直播对延迟和同步性要求极高,而且也是我们日常生活中面对 " 生肉 " 最常见的情况,
毕竟日常中,绝大部分视频都是有字幕的,只有直播作为最新资讯,还未来得及给字幕。
所以能否实时翻译直播,字幕能否跟得上,将会至关重要。
由于苹果最新的发布会刚过去,所以我找了个 TED 的直播。
在直播现场,演讲者话音刚落,大概 AI 辨识 + 翻译的时间需要 1-2 秒左右,翻译好的字幕就能出现在屏幕上。
虽然有延迟,但完全在可接受的范围内,整体字幕的滞后感并不强,观看体验非常流畅,就像在看国内有同声传译的发布会一样。
它的翻译水平到底行不行?
看我吹了这么多功能,是骡子是马,还得拉出来遛遛。
作为一个字幕,它最关键的功能肯定还是帮我们把 " 生肉 " 烤熟,翻译功能最关键。
普通使用,目测识别率至少在 90% 以上。大部分对话都能被准确识别出来。即使是夹杂在特效音效中的人声,它也尽力去捕捉了。
但假如遇上特殊情况呢?所以,说干就干,我准备了典型的 " 硬骨头 " 来考验考验它。
第一关,我们首先看看,它在专业领域的英语内容,能不能 hold 住?
我找了一个 MIT(麻省理工大学),关于 " 量子计算 " 的视频,这里面有着大量的专业术语和复杂长难句,
我相信,对于这个涉世未深的 " 字幕组 " 来说,这将会是一个 " 地狱级 " 难度的翻译。
但没想到的是,对于一些专业的词汇,它丝毫感觉不到难度,例如说 "Quantum Superposition"(量子叠加)这种专业词汇,字幕都能准确无误地翻译了出来。
还有很多复杂的长句子,虽然翻译出来还是少了点 " 人味 ",但慢一点的话还是能抓住关键的核心信息点。
目测来看,整体的准确率预估可以达到 80% 以上,对于想通过视频学习的人来说,这绝对已经够用了。
第二关,我们来再看看,遇上魔性口音,AI 会不会懵圈?
那么这关的难度,肯定就是许多人的英语恶梦:口音!
无论是魔性的印度英语,还是烫嘴的日式英语,即使是英语专业的本科生,只要是不适应,都同样辣耳朵。
我先找了印度大名鼎鼎的 " 甲亢姐 ",她的英文在印式英语中算是比较标准。
果然,在 AI 看来,这难度并不算高,除了有点 AI 味以外,整体翻译丝滑无错误。
接着,我又找了一个印度小妹的的时事视频。
这口音,懂的都懂,虽然少了点摇头晃脑,但同样咖喱味十足,绝对是听力考试的噩梦 。
在辨识口音单词时,会出现明显的辨识错误,有一些刚辨识时,单词是错误的。
但神奇的是,凭借 AI 对于上下文的理解,竟然还是能使整体的意思大差不差,结合画面,完全没有问题。
没想到,它竟然在这里通过了考验,这结果确实让我非常惊喜。
说实话,测试到这里我其实已经有点惊讶了,因为测试前,我完全没想到它竟然能这么强,能做到这个程度!
所以出于对它的尊重,我决定给它一个 " 终极测试 "!
专业内容 + 魔性口音!
假如它能顺利通过这个测试,那我觉得,人类距离打破 " 语言壁垒 " 就真的不远了!
我特意找了一个非常火的印度小姐姐讲解 Python 编程的教程。
口音魔性之余,还夹杂着各种编程相关的词汇,这绝对是语言上难以跨越的鸿沟。
果然,QQ 浏览器还是被我摸到了的天花板,在翻译过程中,它有明显出现错误。
每一句都有不懂的内容,它会直接用英文拼写来替代,整体内容看上去也不连贯,假如依赖这个翻译来学习,相信没人能学好。
最后总结来看,QQ 浏览器的这个实时字幕是否能配得上 " 神器 " 这个称号呢?
老狐认为已经足够了。
要不是我最后故意刁难它,那基本日常中 95% 以上的场景都能用得上它,
无论是日常刷视频,还是线上学习,甚至现场直播,它都能 hold,而且在多人对话、口音混杂、背景嘈杂的情况下,它依然能给出能完全理解的字幕。
最关键的是,它还是免费的!我只能说,这确实香!
其实在 AI 出来之后,很多浏览器覆盖 AI 的超级入口,不仅仅是 QQ 浏览器,夸克之前也出了 AI 浏览器,
参考 20 年前的搜索引擎进化史,我相信浏览器在 AI 时代依然深不可测。
参考资料:
1、你的字幕,QQ 浏览器包了,QQ 浏览器;
2、QQ 浏览器官网;
3、YouTube。
编辑:志坚
登录后才可以发布评论哦
打开小程序可以发布评论哦