Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!
Posted q1613161916
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!相关的知识,希望对你有一定的参考价值。
![技术分享图片](https://image.cha138.com/20210705/949ab31074ed42298d827eb350f83d87.jpg)
用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字。非常方便实用,那么很难实现吗?
利用Python提取图片中的文字信息,只需要一行代码就能搞定!
![技术分享图片](https://image.cha138.com/20210705/63dfde584ffc46838bf28ed552c3730d.jpg)
当然,这是吹牛皮的,但是真正的Python代码也就第4行,说是一行代码搞定也没错。
示例:
![技术分享图片](https://image.cha138.com/20210705/1ded7e028a9748f39aa0405d0d2c747e.jpg)
效果
![技术分享图片](https://image.cha138.com/20210705/a26e3ff1e0164d28a0f2fdfa074185ca.jpg)
尽管运行Python代码后也有几个错误的地方,但是大部分是识别正确的。
![技术分享图片](https://image.cha138.com/20210705/d8efc45a61eb448193f862f665c24404.jpg)
你以为就这样结束了吗?那这么简单,我都不用出教程了。一行代码实现这个功能当然也是要有前戏的。
![技术分享图片](https://image.cha138.com/20210705/0074dfde2a7947b2aafd1c920f7c728b.jpg)
一,pytesseract和PIL的安装
pip安装
![技术分享图片](https://image.cha138.com/20210705/c2df966127c34f0d823f190de4a256a8.jpg)
2,pycharm编辑器能够快速安装,这就看你是否用pycharm了。
pycharm的Settings设置页按照下面步骤操作
![技术分享图片](https://image.cha138.com/20210705/d0f36d9faea2444ea67c7258ffb93fc8.jpg)
安装好了pytesseract,安装PIL在上面第三步里搜索PIL并点击安装就可以了。
![技术分享图片](https://image.cha138.com/20210705/776884fa85ee4f48951b28bd30bd7095.jpg)
安装好了所有库,运行下面Python代码
![技术分享图片](https://image.cha138.com/20210705/62e30a88b0ab4575b4b9f9e8bd2db98d.jpg)
出现报错
![技术分享图片](https://image.cha138.com/20210705/83856358f761406fa60ce59ace8b8b05.jpg)
可以看到提示:未安装识别引擎tesseract-ocr
二,安装识别引擎tesseract-ocr
1.网上下载安装包,然后直接点击安装即可
因为tesseract-ocr默认不支持中文识别,所以解压安装tesseract-ocr后还需做如下操作
![技术分享图片](https://image.cha138.com/20210705/ebdbd55a8c904b729f797c016eaf7463.jpg)
2,安装完成tesseract-ocr后,我们还需配置好
![技术分享图片](https://image.cha138.com/20210705/244736c0a08b4dcab2a99c1648a4606f.jpg)
打开后做如下操作
![技术分享图片](https://image.cha138.com/20210705/ae2c95b726864b46963fd0b004266e55.jpg)
当然也能由pycharm快速打开pytesseract.py
第一步:
![技术分享图片](https://image.cha138.com/20210705/9eff70fb2a4b4072b1b307c5bb6ad9b4.jpg)
第二步:
![技术分享图片](https://image.cha138.com/20210705/d2731625b62f4e8588d5b450586933c2.jpg)
第三步:
![技术分享图片](https://image.cha138.com/20210705/eca34e2af36d4cebbd440573ed775351.jpg)
现在已经完成了所有配置,运行下面Python代码即可实现图片里的文字提取
![技术分享图片](https://image.cha138.com/20210705/3b529bdd15704f81941ed01c3920616f.jpg)
本文到此就结束了,希望各位Python越学越好,早日达成梦想。
以上是关于Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!的主要内容,如果未能解决你的问题,请参考以下文章