科技狐 6小时前
QQ 浏览器要成老司机“看片神器”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

不知道你们有没有过这样的经历,发现一部宝藏片子,迫不及待打开后发现——没!有!字!幕!

那种感觉,就像是饿了三天三夜,终于看到一桌满汉全席,却发现自己没带筷子。

无奈只能听着半懂半不懂的 " 鸟语 ",靠着丰富的想象力脑补剧情。等野生字幕组大神 " 烤出熟肉 ",黄花菜都凉了。

这样想看却看不懂的痛,对于天天高强度冲浪的老司机来说,我们都懂!

不过最近,QQ 浏览器悄悄更新了一个新功能——实时字幕。号称能把所有视频、直播甚至是线上会议,都能实时翻译,相当于做了一个同声传译。

你说,一个做浏览器的,竟然想着竟然抢字幕组的饭碗,这不是没活硬整吗?

为了搞清楚这到底是噱头还是黑科技,老狐第一时间更新了 QQ 浏览器,给大家来试试水!

这功能到底有多骚?

首先,QQ 浏览器这功能怎么用?

我安装了最新版本,然后特意上去 YouTube 打开了一个视频,没想到在视频的右上角,就能看到一个 " 实时字幕 " 的按钮,

点击一下,字幕竟然就这样水灵灵地自己生成出来了!

整个操作行云流水,一点都不复杂,更不需要额外装插件,这样傻瓜式操作对于绝大部分电脑小白来说极其友好!

它和我们常见的字幕有些许不同,而是在视频上直接弹出一个可以随意设置的字幕框。

字幕显示支持双语,并且只要把字幕框放大,甚至能查看过去的字幕。

根据官方的介绍,这个字幕,是语音识别技术 + 腾讯混元模型的结果,也就是说,它识别的是视频本身的语音,

这也是为什么它能做到实时翻译,而不是我们常见的提前布置字幕。

而且只要是腾讯的混元 AI 会的语言,它都能全部翻译出来,

现在它提供了 16 种语言识别,像英语、日语、韩语、泰语这些主流语言基本不在话下,它的语言栏目都有显示

最后,它还有一个 " 其他语言 ",具体包括什么语言,暂时就没有明说了。

在功能上,我还测试了一下 " 实时直播 "。

因为直播对延迟和同步性要求极高,而且也是我们日常生活中面对 " 生肉 " 最常见的情况,

毕竟日常中,绝大部分视频都是有字幕的,只有直播作为最新资讯,还未来得及给字幕。

所以能否实时翻译直播,字幕能否跟得上,将会至关重要。

由于苹果最新的发布会刚过去,所以我找了个 TED 的直播。

在直播现场,演讲者话音刚落,大概 AI 辨识 + 翻译的时间需要 1-2 秒左右,翻译好的字幕就能出现在屏幕上。

虽然有延迟,但完全在可接受的范围内,整体字幕的滞后感并不强,观看体验非常流畅,就像在看国内有同声传译的发布会一样。

它的翻译水平到底行不行?

看我吹了这么多功能,是骡子是马,还得拉出来遛遛。

作为一个字幕,它最关键的功能肯定还是帮我们把 " 生肉 " 烤熟,翻译功能最关键。

普通使用,目测识别率至少在 90% 以上。大部分对话都能被准确识别出来。即使是夹杂在特效音效中的人声,它也尽力去捕捉了。

但假如遇上特殊情况呢?所以,说干就干,我准备了典型的 " 硬骨头 " 来考验考验它。

第一关,我们首先看看,它在专业领域的英语内容,能不能 hold 住?

我找了一个 MIT(麻省理工大学),关于 " 量子计算 " 的视频,这里面有着大量的专业术语和复杂长难句,

我相信,对于这个涉世未深的 " 字幕组 " 来说,这将会是一个 " 地狱级 " 难度的翻译。

但没想到的是,对于一些专业的词汇,它丝毫感觉不到难度,例如说 "Quantum Superposition"(量子叠加)这种专业词汇,字幕都能准确无误地翻译了出来。

还有很多复杂的长句子,虽然翻译出来还是少了点 " 人味 ",但慢一点的话还是能抓住关键的核心信息点。

目测来看,整体的准确率预估可以达到 80% 以上,对于想通过视频学习的人来说,这绝对已经够用了。

第二关,我们来再看看,遇上魔性口音,AI 会不会懵圈?

那么这关的难度,肯定就是许多人的英语恶梦:口音!

无论是魔性的印度英语,还是烫嘴的日式英语,即使是英语专业的本科生,只要是不适应,都同样辣耳朵。

我先找了印度大名鼎鼎的 " 甲亢姐 ",她的英文在印式英语中算是比较标准。

果然,在 AI 看来,这难度并不算高,除了有点 AI 味以外,整体翻译丝滑无错误。

接着,我又找了一个印度小妹的的时事视频。

这口音,懂的都懂,虽然少了点摇头晃脑,但同样咖喱味十足,绝对是听力考试的噩梦 。

在辨识口音单词时,会出现明显的辨识错误,有一些刚辨识时,单词是错误的。

但神奇的是,凭借 AI 对于上下文的理解,竟然还是能使整体的意思大差不差,结合画面,完全没有问题。

没想到,它竟然在这里通过了考验,这结果确实让我非常惊喜。

说实话,测试到这里我其实已经有点惊讶了,因为测试前,我完全没想到它竟然能这么强,能做到这个程度!

所以出于对它的尊重,我决定给它一个 " 终极测试 "!

专业内容 + 魔性口音!

假如它能顺利通过这个测试,那我觉得,人类距离打破 " 语言壁垒 " 就真的不远了!

我特意找了一个非常火的印度小姐姐讲解 Python 编程的教程。

口音魔性之余,还夹杂着各种编程相关的词汇,这绝对是语言上难以跨越的鸿沟。

果然,QQ 浏览器还是被我摸到了的天花板,在翻译过程中,它有明显出现错误。

每一句都有不懂的内容,它会直接用英文拼写来替代,整体内容看上去也不连贯,假如依赖这个翻译来学习,相信没人能学好。

最后总结来看,QQ 浏览器的这个实时字幕是否能配得上 " 神器 " 这个称号呢?

老狐认为已经足够了。

要不是我最后故意刁难它,那基本日常中 95% 以上的场景都能用得上它,

无论是日常刷视频,还是线上学习,甚至现场直播,它都能 hold,而且在多人对话、口音混杂、背景嘈杂的情况下,它依然能给出能完全理解的字幕。

最关键的是,它还是免费的!我只能说,这确实香!

其实在 AI 出来之后,很多浏览器覆盖 AI 的超级入口,不仅仅是 QQ 浏览器,夸克之前也出了 AI 浏览器,

参考 20 年前的搜索引擎进化史,我相信浏览器在 AI 时代依然深不可测。

参考资料:

1、你的字幕,QQ 浏览器包了,QQ 浏览器;

2、QQ 浏览器官网;

3、YouTube。

编辑:志坚

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

qq浏览器 qq 腾讯 翻译 老司机
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论