据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。
作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。
本站部分信息来源于网络,如有侵权请与我们联系。本站原创内容转载请注明出处。
Copyright @2022- All Rights Reserved 口碑家电 版权所有
邮箱:jokerdeyouxiang@sina.com
备案号:皖ICP备2023005497号