支持多种OCR相关前沿算法,包括但不限于文本检测、文本识别、表格识别等。在此基础上打造了行业级特色模型PP-OCR、PP-Structure和PP-ChatOCR,并打通数据生产、模型训练、压缩、预测部署全流程,为开发者提供一站式解决方案。
学习文档:https://paddlepaddle.github.io/PaddleOCR/latest/quick_start.html
行业领先的人脸处理平台
技术架构:基于Vue3+Fabric.js,支持插件化开发与国际化。核心功能:支持自定义字[…]
mmocr是一个开源的多模态OCR工具包,用于处理多模态(如图像、文本、语音等)的光学字符识别任务。它基于深度[…]
EasyOCR是一个基于PyTorch的开源OCR库,可以进行多语言文本识别。它支持超过80种语言,不单单针对[…]
发布了AnyInsertion数据集,这是一个包含120K提示-图像对的大规模数据集,涵盖了广泛的插入任务,例[…]
我们提出了MAGI-1,这是一个世界模型,它通过自回归预测一系列视频块(定义为固定长度的连续帧片段)来生成视[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
行业领先的人脸处理平台