文字识别一直以来就是刚需,如今的OCR体积小巧,速度极快,依托最新前沿AI算法识别率既快又准。
背景原理
文本识别主要分为三个步骤:文字边框识别,文字角度识别和文字内容识别。边框与角度可以确定识别对象的具体位置和姿态,内容识别则是识别文字内容。
场景展示
适用于任意图片转文字需求,当前做的比较简单,可以批量识别图片,未来还将使用该技术拓展视频字幕提取、漫画文字翻译等功能。
软件截图

使用说明
点击软件打开文件,可选择单张或多张图片进行批量识别。预览模式下直接展示结果,保存模式下会生成识别后的txt文件。文件会保存在源文件目录里。
配置要求
该模块GPU消耗小,配置无要求。