中科院物理所 02-15
为什么JPEG仍然是网络图像的主导格式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

大约 30 年来,JPEG 一直是万维网的主要图像格式。不过,网络诞生之初所采用的图像格式并不是 JPEG。事实上,第一个主流图像浏览器 NCSA Mosaic 最初并不支持嵌入式 JPEG 文件,只支持嵌入式 GIF 以及其他一些已经被遗忘的格式。无论如何,相比被其取代的格式,JPEG 有许多优点。

尽管 JPEG 没有随着网络浏览器一起出现(JPEG 正式发布两年后的 1994 年,使用 JPEG 标准的图像才首次出现在了网景浏览器中),但 JPEG 和网络浏览器还是自然而然地结合了起来。JPEG 文件的图像退化过程比 GIF 文件更优雅,能够保留图片的更多原始形态。这种特性使其实现了更广泛的成功应用。虽然 JPEG 不能制作动画,但它从使用调制解调器上网时代缓慢加载的格式起步,逐步发展成为足以用于高端专业摄影的图像格式。

就互联网的目的而言,虽然图片退化很重要,但它并非 JPEG 在数字世界中实现巨大价值的唯一因素。还有一个重要的原因是,它是由众多贡献者共同构建的文档化标准。

想知道 JPEG 作为标准有多重要?可以先听一个故事。

在史蒂夫 · 威尔海特(Steve Wilhite)因创造 GIF 格式而获奖之前,2013 年他接受了《纽约时报》的采访,随后无意中卷入了一场辩论。

简单地说,就是没有人知道他所倡导的图像格式(Graphics Interchange Format)的首字母缩略词怎么发音。他尝试利用这个机会做出解释:它的发音就像花生酱品牌," 是一个柔和的‘ G ’,读作‘ jif ’,就是这样。" 他说。

当时,我把威尔海特的这句话发布在了我很受欢迎的 Tumblr 页面上,当时这家社交媒体网站是应用 GIF 的热门网站。不久之后,我的帖子被转发了数千次,几乎所有的人都不同意威尔海特的观点。很快,威尔海特的这句话成为了一个表情包。

这一插曲凸显了一个事实,那就是,2022 年去世的威尔海特并没有通过正式的委员会机制发展他所创造的格式。1987 年,他作为 CompuServe 的员工接手了这个项目,然后他创造了这种格式,仅此而已。他可以说它应该读作 "jif",因为这是他创造的。介绍其工作原理的初始文档也非常简单。38 年过去了,我们还在使用 GIF,但它从来没有像 JPEG 那样出名过。

大约 5 年后,JPEG 正式出现,该格式在很大程度上并不是由某一个人开发的。实际上,这是事实标准和实际标准之间的区别。事实证明,这对它最终的普及至关重要。

联合图像专家组(Joint Photographic Experts Group)与数十个利益相关者一起合作,目标是创造一种符合每个人需求的格式。确切地说,该格式的名称是设计该格式的委员会的首字母缩写。1992 年,这种格式最终面世时,有一本 600 多页的书以此为主题,这本书令人惊艳的封面展示了同一张 JPEG 图片的一系列版本。

由 IBM 员工与 JPEG 组织利益相关者威廉姆 · B. 彭内贝克(William B. Pennebaker)和琼 · L. 米切尔(Joan L. Mitchell)撰写的《JPEG:静态图像数据压缩标准》(JPEG: Still Image Data Compression Standard,施普林格出版社,1992 年)一书介绍了由于缺乏一种方法来平衡对图像逼真度和即时性的需求,因此造成的多媒体图像发展受限制的现象。他们认为,标准化可以解决这个问题。" 问题不在于缺乏图像压缩的算法(因为该领域已经有很悠久的技术工作历史了)," 作者写道," 而是缺乏一个标准算法,一个允许在不同的应用程序之间交换图像的算法。"

他们的想法是正确的。30 多年来,JPEG 实现了高质量、高分辨率图片在操作系统中的广泛应用。尽管我们不再需要对 JPEG 进行极限压缩,但这种能力正是现代互联网发展不可或缺的推动力。

正如书中所述,米切尔和彭内贝克得到了 IBM 的支持,得以跟踪这项研究并与 JPEG 委员会合作。凭借这种支持,他们开发了许多 JPEG 格式的基础专利。米切尔、彭内贝克和两位同事在 1988 年提交的专利文件中介绍了 IBM 以及美国电话电报公司(AT&T)和佳能等 JPEG 标准委员会的其他成员开发的方法,这些方法使用了压缩技术,从而使得高质量图像在受限环境下更易于传输。

委员会的每个成员都有自己的需求。显然,佳能更注重打印机和摄影,而美国电话电报公司主要对数据传输感兴趣。这些公司共同努力,形成了一个经得起时间考验的标准。

有趣的是,这一切意味着,能够使用 JPEG 压缩的程序最早并没有出现在 mac OS 或 Windows 中,而是出现在了米切尔和彭内贝克所属的 IBM 公司所创建的 OS/2 这个优秀但最终失败的图形操作系统中。早在 1990 年,OS/2 就可以通过 OS/2 图像支持应用程序支持这种格式。

JPEG 文件与 PNG 文件或 GIF 文件的区别在于数据压缩的退化程度。JPEG 图像的目标是在完成所有压缩处理后仍能保持照片般的视觉效果,即便需要压缩至合理尺寸才能正常运行,这种格式也能让你用更少的字节数尽量还原原始图像。

或者,正如彭内贝克和米切尔所说的那样:" 最有效的压缩是通过近似原始图像(而不是完全复制原始图像)来实现的。"

其核心是一种名为离散余弦变换(DCT)的压缩过程,这是一种有损的压缩编码形式,广泛用于各种压缩格式中,尤其是在数字音频和信号处理中。(有损压缩会永久性地删除一些原始数据,以便实现更小的文件;无损压缩则会发现数据中的冗余以缩小文件大小,同时保留原始质量。)从本质上来说,DCT 通过去除细节来提供低质量的产品,同时通过近似来保留原始产品的核心。DTC 越强,最终结果的压缩程度越高。

20 世纪 70 年代,研究人员开发的该算法采用了数据网格,并将其视为可通过旋钮调节频率的系统。控制数据的速率就像水龙头控制水流一样,需要的数据越多,设置的数据速率就越高。即便在高度压缩的情况下,DCT 仍然能维持少量数据流,尽管这意味着画质会略有降低。换言之,虽然压缩过程中无法保留全部数据,但 DCT 能确保数据的核心部分得以留存。

DCT 无处不在。例如,观看流媒体视频或收听在线广播流时,由于带宽突然下降而导致观看或收听质量下降,这时 DCT 就大显神通了。

正如《JPEG:静态图像数据压缩标准》一书所解释的那样,JPEG 文件并非只能通过一种方法来运用 DCT:

JPEG 标准描述了一系列图像压缩技术,而不是单一的压缩技术。它提供了压缩技术的 " 工具包 ",应用程序可以从中选择能够满足其特定需求的元素。

该工具包有 4 种模式:

顺序 DCT(Sequential DCT),这种模式会按顺序显示压缩图像,就像慢慢地放下窗帘一样。

渐进式 DCT(Progressive DCT),这种模式会以最低的分辨率显示完整的图像,然后随着信息的增加而添加细节。

无损顺序式(Sequential Lossless),这种模式使用了窗帘格式,但不会压缩图像。

分层式模式(Hierarchical Mode),这种模式结合了前 3 种模式,因此该模式可能会从渐进式模式开始,然后缓慢加载顺序无损压缩,之后达到无损的最终效果。

JPEG 标准创建时,峰值速度为 14.4 千比特 / 秒的拨号调制解调器非常普遍。这意味着图像加载缓慢,因此渐进式 DCT 成为了最适合早期互联网的格式。随着时间的推移,渐进式 DCT 越来越不常见,因为许多计算机可以轻松实现一次加载顺序 DCT。

使用 DCT 压缩图像时,在图像中比较杂乱、纹理较多的区域(例如头发或枝叶),变化往往不明显。这些区域更难压缩,因此这些区域能更长时间地保持完整性。在纯色图像中或从一种颜色急剧变化为另一种颜色的区域,压缩造成的变化往往更明显。截取社交媒体帖子的屏幕截图后,图像可能会布满噪点,这就是一个制作 JPEG 文件的过程。

PNG 等其他格式则在文本处理方面表现很好,因为其压缩算法是无损的。PNG 的压缩格式 Deflate 是由菲尔 · 卡茨(Phil Katz)设计的,他还创建了 ZIP 格式。PNG 使用 Deflate 的部分原因是,它是一种免许可的压缩格式。事实证明,这位杰出的程序员虽然一直在与酗酒做斗争,但他在不幸去世以前以多种方式改善了互联网。

尽管 JPEG 历史悠久且已经成熟,但它仍然是我们在互联网上分享照片的最佳选择之一。虽然它并不是适用于任何环境的最佳工具,但就像我们有时会把扳手当锤子用一样,我们也经常这样利用 JPEG。

20 世纪 90 年代,JPEG 之所以流行起来,不仅仅是因为这种格式有质量优势。专利也发挥了作用,从 1994 年开始,科技公司 Unisys 就试图对依赖 GIF 文件的个别网站收费,因为这些网站使用了该公司拥有的专利。这使得免费使用的 JPEG 更受欢迎了。(这种情况也促使了无专利的 PNG 格式的诞生。)

虽然 JPEG 以标准为基础,但由于专利系统的原因,它仍然可能面临与 GIF 相同的命运。在 JPEG 格式出现的几年前,Compression Labs 的两名员工提交了一份关于动态图像压缩的专利申请。不过,直到 JPEG 无处不在时,人们才发现它与 JPEG 压缩很相似。

1997 年,一家名为 Forgent Networks 的公司收购了 Compression Labs。Forgent Networks 公司最终发现了这项专利,并开始就此提起诉讼,这场意外收获被该公司视为了天赐良机。

" 从某些方面来说,这项专利就像是一张彩票,"Forgent 的首席财务官杰伊 · 彼得森(Jay Peterson)在 2005 年向科技资讯网(CNET)表示," 如果 5 年前你告诉我‘你拥有 JPEG 专利’,我是不会相信的。"

虽然 Forgent 对 JPEG 压缩算法的所有权主张站不住脚,但该公司最终在法律诉讼中取得了比 Unisys 更大的成功,并向数码相机制造商和其他公司收取了超过 1 亿美元的费用。此外,Forgent 还试图向个人电脑行业收取许可费;最终,该公司同意与大约 30 家电脑制造商达成 800 万美元的和解协议。

随着对其获取的专利采取越来越激进的维权方式,该公司开始在舆论场和实际诉讼中接连受挫。批评者纷纷援引有关先前技术水平的例子,而法庭则将该专利的适用范围限定在了视频等动态用途。

2006 年,Forgent Networks 公司的压缩专利过期,其商业诉讼模式随之终结。同年,该公司更名为 Asure Software,专注于薪酬与人力资源解决方案,由此彻底地转型了。

JPEG 为我们提供了很好的服务。要打破这种模式的地位很难。例如,JPEG 2000 格式旨在通过提供无损选项和更好的性能来取代原始 JPEG。虽然这种较新的格式在美国国会图书馆和美国互联网档案馆等专业网站得到了广泛的应用,但作为终端用户格式却不太受欢迎。

其他图像技术在突破 JPEG 格式的限制方面略有成效。谷歌支持的 WebP 受到了网站开发者的欢迎(但在终端用户中存在争议)。与此同时,与 JPEG 和 JPEG 2000 相比,同样由标准机构开发的格式 AVIF 和 HEIC 在技术上更先进。

目前,JPEG 仍然很难被淘汰。从某种意义上说,这种格式的处境类似 MP3 音频与 ZIP 压缩,这两种传统格式都非常受欢迎,而且得到了广泛的应用,因此很难被淘汰。虽然其他格式能够更好地压缩文件,更高效地完成同样的任务,但要推翻一种领先 30 年的格式非常困难。

来源:悦智网

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

互联网 纽约时报
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论