国家知识产权局信息显示,中国电建集团北京勘测设计研究院有限公司申请一项名为 " 一种基于置信度加权的视觉 token 鲁棒性训练方法 " 的专利,公开号 CN122336780A,申请日期为 2026 年 5 月。
专利摘要显示,本发明名称为一种基于置信度加权的视觉 token 鲁棒性训练方法,属于计算机视觉与多模态大模型技术领域。所要解决的技术问题为现有技术将 OCR 识别结果作为视觉 token 训练的硬标签,OCR 错误易污染视觉码本;且 OCR 置信度仅用于低质量图像过滤,未嵌入损失函数实现监督强度动态调整,导致在水电工程图纸等复杂工业场景下鲁棒性差、下游多模态任务处理精度不足。技术方案要点为获取输入图像的 OCR 识别文本及字符级置信度,通过置信度加权函数计算监督权重;构建置信度加权的 KL 散度知识蒸馏损失,与重建损失加权联合得到总损失,对视觉离散编码器端到端训练;可结合水电工程术语语义图谱与三元组对比损失,强化行业专业语义表达。
天眼查资料显示,中国电建集团北京勘测设计研究院有限公司,成立于 1989 年,位于北京市,是一家以从事专业技术服务业为主的企业。企业注册资本 80000 万人民币。通过天眼查大数据分析,中国电建集团北京勘测设计研究院有限公司共对外投资了 45 家企业,参与招投标项目 36438 次,财产线索方面有商标信息 13 条,专利信息 1275 条,此外企业还拥有行政许可 149 个。
声明:市场有风险,投资需谨慎。本文为 AI 基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员


登录后才可以发布评论哦
打开小程序可以发布评论哦