驱动之家 03-31
百度击败谷歌!PaddleOCR成GitHub最受欢迎OCR项目:中国开源首度登顶
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 3 月 31 日消息,近日,百度文心衍生模型 PaddleOCR 在 GitHub 上的 Star 数突破 73.3K,首次超越谷歌旗下开源 OCR 标杆产品 Tesseract OCR(73.2K),成为全球 Star 数最高的 OCR 项目。

Tesseract OCR 诞生于 1985 年,最初由惠普实验室研发,2005 年开源后由 Google 接手维护并持续迭代,是 OCR 领域延续近四十年的技术标杆,长期位居 GitHub OCR 项目 Star 数榜首。

此次被 PaddleOCR 超越,标志着这一标杆正在被新一代技术体系改写,也是大模型驱动下中国开源项目首次在 OCR 领域超越谷歌主导的标杆产品。

PaddleOCR 基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超 100 种语言识别,用户覆盖 160 个国家和地区。1 月 29 日,新一代文档解析模型 PaddleOCR-VL-1.5 在 OmniDocBench V1.5 榜单中取得了全球 SOTA 成绩。

近年来,大模型成为 OCR 赛道增长的重要动力。Star History 数据显示,PaddleOCR 在 GitHub 上的 Star 自 2024 年起呈现爆发式增长。2025 年以来,OCR 更成为大模型厂商布局的重点方向,DeepseekOCR、HunyuanOCR、GLM OCR 等产品相继发布。

此外,PaddleOCR 同步升级服务能力:官网免费每日解析页数由 1 万提升至 2 万,用户还可通过 OpenClaw 直接调用 PaddleOCR Skill,免费获取高精度 PDF 解析能力。

与此同时,PaddleOCR OCEAN 生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括 Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus 等全球平台伙伴,将共同推动 OCR 技术在更广泛场景中的应用落地。

ps.OCR(Optical Character Recognition,光学字符识别)是指通过光学设备(如扫描仪、摄像头)获取图像中的文本信息,再通过计算机算法将其转化为可编辑、可检索、可分析的数字文本的技术。简单来说,就是让计算机看见并读懂图像中的文字,实现 " 图像文本→数字文本 " 的精准转化。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 谷歌 百度 计算机
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论