EasyOCR是一个基于PyTorch的开源OCR库,可以进行多语言文本识别。它支持超过80种语言,不单单针对中文,并具有较高的准确性和鲁棒性,官方文档也都是英文的,因此对于英文不熟悉的同学可能相对而言没那么方便。
采用React+TypeScript+React-Konva开发的开源图片编辑器。它支持文字编辑、[…]
mmocr是一个开源的多模态OCR工具包,用于处理多模态(如图像、文本、语音等)的光学字符识别任务。它基于深度[…]
我们提出了MAGI-1,这是一个世界模型,它通过自回归预测一系列视频块(定义为固定长度的连续帧片段)来生成视[…]
发布了AnyInsertion数据集,这是一个包含120K提示-图像对的大规模数据集,涵盖了广泛的插入任务,例[…]
该项目有多个入口点。您需要:收集照片和/或视频从原始照片中提取人脸利用从照片/视频中提取的面部数据来训练[…]
技术架构:基于Vue3+Fabric.js,支持插件化开发与国际化。核心功能:支持自定义字[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
采用React+TypeScript+React-Konva开发的开源图片编辑器。它支持文字编辑、[…]