Java调用百度OCR接口实现文字识别

Posted 彭祥.

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java调用百度OCR接口实现文字识别相关的知识,希望对你有一定的参考价值。

博主在项目开发中需要完成一个文字识别功能,由于之前有过使用百度云平台接口进行身份证识别的经历,因此这次也是自然而然的再次选择了百度AI平台,首先需要开通百度通用文字识别功能。

然后我们需要创建一个应用:

然后我们就可以进行我们的接口调用了,博主选择的开发语言是JAVA,首先我们进行该接口的调用:

package util;
import util.Base64Util;
import util.FileUtil;
import util.HttpUtil;
import java.net.URLEncoder;
public class Ocr 
public static String generalBasic() 
     // 请求url
     String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
     try 
         // 本地文件路径
         String filePath = "D:/Desk/1.png";
         byte[] imgData = FileUtil.readFileByBytes(filePath);
         String imgStr = Base64Util.encode(imgData);
         String imgParam = URLEncoder.encode(imgStr, "UTF-8");

         String param = "image=" + imgParam;
         
         // 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
         String accessToken = GetToken.getAuth();

         String result = HttpUtil.post(url, accessToken, param);
         System.out.println(result);
         return result;
      catch (Exception e) 
         e.printStackTrace();
     
     return null;
 

 public static void main(String[] args) 
	 Ocr.generalBasic();
 

然后注意我们需要获取accessToken,这里我们动态获取

import org.json.JSONObject;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
public class GetToken 
	
    public static String getAuth() 
        // 官网获取的 API Key 更新为你注册的
        String clientId = "";
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "";
        return getAuth(clientId, clientSecret);
    


    public static String getAuth(String ak, String sk) 
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try 
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) 
                System.err.println(key + "--->" + map.get(key));
            
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) 
                result += line;
            
            /**
             * 返回结果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
         catch (Exception e) 
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        
        return null;
    

此外其余的几个包文件:Base64Util.java等,这几个文件官方提供了下载地址:

  • FileUtil,Base64Util,HttpUtil,GsonUtils请从
  • https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
  • https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
  • https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
  • https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
  • 下载
    至此便完成了,我们简单测试一下:

    识别成功,接下来便是转换数据格式,提取出我们所需要的信息。

以上是关于Java调用百度OCR接口实现文字识别的主要内容,如果未能解决你的问题,请参考以下文章

python调用百度ocr接口,实现图片内文字识别

借助百度OCR,实现一键识别图片中文字,就是这么酷!

百度ocr文字识别接口使用

C#车牌号码识别-基于百度OCR

用百度ocr+微信截图实现文字识别

RPA中房产证的 OCR 识别