软件特色介绍
umi-ocr是一款开源、免费、支持离线使用的光学字符识别工具,完全开源,代码透明可查,支持自由修改与优化。本地化运行无需联网,避免数据上传云端,确保隐私安全,适合处理敏感信息。
开源与可扩展性
代码完全开源(基于 gpl-3.0 协议),开发者可基于项目进行二次开发(如集成到其他工具或添加新功能)。
社区活跃,定期更新模型和功能,用户可通过 github 提交反馈或贡献代码。
轻量化与高效
安装包体积小(通常几十 mb),启动速度快,适合低配置设备。
识别速度较快,单张图片平均耗时约 1-3 秒(取决于硬件性能)。
隐私保护
完全离线运行,避免将敏感数据上传至云端,适合处理隐私内容(如合同、证件等)。
软件功能
离线识别
基于 paddleocr 等深度学习模型,所有识别过程在本地完成,无需联网或依赖云服务,保障数据隐私和安全性。
支持 windows、macos 和 linux 多平台,用户可跨设备使用。
多场景适配
截图识别:支持截取屏幕任意区域,直接识别其中的文字(如网页、pdf、视频字幕等)。
批量处理:可导入本地图片文件(支持 png、jpg、bmp 等格式),批量提取文字并导出为文本文件(txt)或可编辑文档(如 docx)。
竖排文字与混合排版:针对古籍、漫画等特殊排版场景优化,识别准确率较高。
高精度与灵活性
提供多种 ocr 模型(如通用、手写体、表格等),用户可根据需求切换。
支持自定义识别区域、多语言混合识别(如中英文混排),并允许调整识别参数(如去噪、二值化)。
安装步骤