图片OCR本地批量识别

文字识别一直以来就是刚需,如今的OCR体积小巧,速度极快,依托最新前沿AI算法识别率既快又准。

背景原理

文本识别主要分为三个步骤:文字边框识别,文字角度识别和文字内容识别。边框与角度可以确定识别对象的具体位置和姿态,内容识别则是识别文字内容。

场景展示

适用于任意图片转文字需求,当前做的比较简单,可以批量识别图片,未来还将使用该技术拓展视频字幕提取、漫画文字翻译等功能。

软件截图

图片OCR本地批量识别-小白兔AI

使用说明

点击软件打开文件,可选择单张或多张图片进行批量识别。预览模式下直接展示结果,保存模式下会生成识别后的txt文件。文件会保存在源文件目录里。

配置要求

该模块GPU消耗小,配置无要求。