txt中的Unicode

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了txt中的Unicode相关的知识,希望对你有一定的参考价值。

我用汉王PDF OCR转换了一个txt文档,但我的电子词典不支持编码它的格式。
当我用记事本另存为,编码格式选择了ANSI,可是仍然有错误提示,如附图所示。若点击确定会丢失文本内容吗?

会丢失 因为ansi一共只有127种字符

您可以用保存为utf-8或unicode格式

文件==>另存为==>编码选择 utf-8==>保存
参考技术A 应该是你的OCR识别之后有一些内容本来是正常的文字的,但被识别成了特殊的字符,反正这些字符你也看不懂是什么,转换成哪种编码的效果都差不多。 参考技术B 会,因为unicode范围超过ascii编码范围,会造成丢失。 参考技术C 这个问题我也不知道 我也想知道答案 希望高手指点一下
我在保存文件的时候 尤其是TXT格式的 有时候保存到什么字符之类的就会出现关于Unicode相关的信息
我想知道 什么样的数据是Unicode的呀 希望高手指点一二!!太谢谢了 !!

Python-unicode中的scrittura

  1. import codecs
  2.  
  3. fp = codecs.open('E:\demo.txt', 'w', 'utf_8')
  4. fp.write('cioè')
  5. fp.close()

以上是关于txt中的Unicode的主要内容,如果未能解决你的问题,请参考以下文章

Python开发第xxx篇文件操作----复习

关于字符编码

Qt学习笔记6.Qt中的字符字符串

python 第三天

Unicode

python——字符编码