Java调用百度OCR接口实现文字识别
Posted 彭祥.
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java调用百度OCR接口实现文字识别相关的知识,希望对你有一定的参考价值。
博主在项目开发中需要完成一个文字识别功能,由于之前有过使用百度云平台接口进行身份证识别的经历,因此这次也是自然而然的再次选择了百度AI平台,首先需要开通百度通用文字识别功能。
然后我们需要创建一个应用:
然后我们就可以进行我们的接口调用了,博主选择的开发语言是JAVA,首先我们进行该接口的调用:
package util;
import util.Base64Util;
import util.FileUtil;
import util.HttpUtil;
import java.net.URLEncoder;
public class Ocr
public static String generalBasic()
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
try
// 本地文件路径
String filePath = "D:/Desk/1.png";
byte[] imgData = FileUtil.readFileByBytes(filePath);
String imgStr = Base64Util.encode(imgData);
String imgParam = URLEncoder.encode(imgStr, "UTF-8");
String param = "image=" + imgParam;
// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
String accessToken = GetToken.getAuth();
String result = HttpUtil.post(url, accessToken, param);
System.out.println(result);
return result;
catch (Exception e)
e.printStackTrace();
return null;
public static void main(String[] args)
Ocr.generalBasic();
然后注意我们需要获取accessToken,这里我们动态获取
import org.json.JSONObject;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
public class GetToken
public static String getAuth()
// 官网获取的 API Key 更新为你注册的
String clientId = "";
// 官网获取的 Secret Key 更新为你注册的
String clientSecret = "";
return getAuth(clientId, clientSecret);
public static String getAuth(String ak, String sk)
// 获取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type为固定参数
+ "grant_type=client_credentials"
// 2. 官网获取的 API Key
+ "&client_id=" + ak
// 3. 官网获取的 Secret Key
+ "&client_secret=" + sk;
try
URL realUrl = new URL(getAccessTokenUrl);
// 打开和URL之间的连接
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 获取所有响应头字段
Map<String, List<String>> map = connection.getHeaderFields();
// 遍历所有的响应头字段
for (String key : map.keySet())
System.err.println(key + "--->" + map.get(key));
// 定义 BufferedReader输入流来读取URL的响应
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String result = "";
String line;
while ((line = in.readLine()) != null)
result += line;
/**
* 返回结果示例
*/
System.err.println("result:" + result);
JSONObject jsonObject = new JSONObject(result);
String access_token = jsonObject.getString("access_token");
return access_token;
catch (Exception e)
System.err.printf("获取token失败!");
e.printStackTrace(System.err);
return null;
此外其余的几个包文件:Base64Util.java等,这几个文件官方提供了下载地址:
- FileUtil,Base64Util,HttpUtil,GsonUtils请从
- https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
- https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
- https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
- https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
- 下载
至此便完成了,我们简单测试一下:
识别成功,接下来便是转换数据格式,提取出我们所需要的信息。
以上是关于Java调用百度OCR接口实现文字识别的主要内容,如果未能解决你的问题,请参考以下文章