今天小编给大家分享一下Python如何实现批量识别图片文字并存为Excel的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分免费云主机域名享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。批量文字识别(OCR)是Python
办公自动化的基本操作,应用在我们工作生活中的方方面面,比如车牌识别、证件识别、银行卡识别、票据识别等等。Python
中OCR
第三方库非常多,比如easyocr
、PaddleOCR
、cnocr
等等。本文以证件识别为例,我网上找了3张虚拟身份证来实验:运用easyocr
进行识别并保存为Excel
,效果如下:在Python
中使用easyocr
非常简单,只要使用pip
命令安装easyocr
即可(建议使用清华源,否则安装会比较慢)。不过easyocr
的深度学习算法依赖于另一个著名的第三方模块pytorch
,图形处理部分则会用到opencv
、Pillow
等,所以还需要确保自己电脑上已经安装这些基础模块。1.easyocr
识别图片代码非常简洁,只需要创建一个easyocr.Reader
类对象,指定以下两个常用参数:需要识别的文字属于哪几种语言是否启用GPU显卡加速2.调用Reader
对象的readtext
方法,将图片中所有文字读入一个列表并返回。识别结果如下:[([[39,31],[207,31],[207,67],[39,67]],’姓名韦小宝’,0.8973890994570185),([[40,82],[159,82],[159,119],[40,119]],’性别男’,0.9799311480828728),([[178,86],[272,86],[272,116],[178,116]],’民族汉’,0.5456928014755249),([[40,131],[100,131],[100,161],[40,161]],’出生’,0.5362269878387451),([[114,134],[240,134],[240,162],[114,162]],’1654年12′,0.6952526392609933),([[266,134],[322,134],[322,162],[266,162]],’20日’,0.31329770168285426),([[42,181],[395,181],[395,213],[42,213]],’住址北京市东城区景山前街4号’,0.48138251996753667),([[112,222],[256,222],[256,254],[112,254]],’紫禁城敬事房’,0.9732440311960702),([[44,307],[195,307],[195,337],[44,337]],’公民身份证号码’,0.612808391503521),([[212,308],[526,308],[526,334],[212,334]],’112044165412202438′,0.7003081027071493)]readtext
返回的列表中,每个元素都是一个元组,内含三个信息:位置、文字、置信度。我们可以在调用readtext
时指定一个参数detail=0
,从而只返回文字内容。于是修改后代码和效果如下:[‘姓名韦小宝’,’性别男’,’民族汉’,’出生’,’1654年12′,’20日’,’住址北京市东城区景山前街4号’,’紫禁城敬事房’,’公民身份证号码’,’112044165412202438′]批量识别图片无非就是遍历图片文件夹,这里用到了os.listdir()
方法以返回文件列表。然后用ocr.readtext()
去识别每一张图片文字内容,接着通过字符串切片来获取姓名、性别、民族、出生、住址和身份证号等关键信息,最后统一将这些信息存入列表data
中。图片文字识别之后,建议通过pandas
输出为Excel
,方便简洁。以上就是“Python如何实现批量识别图片文字并存为Excel”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注百云主机行业资讯频道。
本篇内容主要讲解“如何使用C语言代码实现模式匹配”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用C语言代码实现模式匹配”吧!C语言免费云主机域名数据结构中串的模式匹配串的模式匹配问题:朴素算法与KMP算法到此…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。