tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题

Posted 2020-10-13 愤怒的企鹅

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题相关的知识，希望对你有一定的参考价值。

编译tesseract - ocr时各种不通过也很疑惑，完全按照官方指导来的啊

首先以为是vs的编码问题，随切换选项-切换Unicode或多编码字符集，但仍无效。

定位到乱码的文件，用notepad++ 打开，查看编码，是“”“以UTF-8无BOM格式编码”，切换成utf-8编码，将所有有中文的编码都切换了（还好只有两个），然后编译既然成功了。

然后新建了一个工程，一路默认创建。打开默认创建的cpp文件，是ANSI编码，没有任何文件头信息。可能是vs对于无bom的utf8不认识吧，默认把它当成了ANSI编码，所以造成这个问题。

看到一篇博客说vs2008，创建的C++源文件的缺省编码方式为CP936，即GB2312

以上是关于tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题的主要内容，如果未能解决你的问题，请参考以下文章

tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题