tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题

Posted 愤怒的企鹅

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题相关的知识,希望对你有一定的参考价值。

编译tesseract - ocr时 各种不通过 也很疑惑,完全按照官方指导来的啊

首先以为是vs的编码问题,随切换选项-切换Unicode或多编码字符集,但仍无效。

定位到乱码的文件,用notepad++ 打开,查看编码,是“”“以UTF-8无BOM格式编码”,切换成utf-8编码,将所有有中文的编码都切换了(还好只有两个),然后编译既然成功了。

然后新建了一个工程,一路默认创建。打开默认创建的cpp文件,是ANSI编码,没有任何文件头信息。可能是vs对于无bom的utf8不认识吧,默认把它当成了ANSI编码,所以造成这个问题。

看到一篇博客说vs2008,创建的C++源文件的缺省编码方式为CP936,即GB2312

 

以上是关于tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题的主要内容,如果未能解决你的问题,请参考以下文章

php系统函数socket_connect信息乱码

锟斤拷?UTF-8与GBK互转乱码问题

漫话:如何给女朋友解释什么是"锟斤拷"?

教妹学Java:不可不知的 Unicode 之锟斤拷

gbk字符集共有多少个汉字_商品“锟斤拷"是个什么鬼?

gbk字符集共有多少个汉字_商品“锟斤拷"是个什么鬼?