utf-8带bom 获取到utf-8字符串需要加上bom

Posted 三天泪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了utf-8带bom 获取到utf-8字符串需要加上bom相关的知识,希望对你有一定的参考价值。

        
     # 假设源字符串为 utf8_str #utf8_str
= "中文字符串" # 将 utf-8 编码的字符串转换为 utf-8 带 BOM 编码的字符串 #utf8_bom_str = codecs.BOM_UTF8 + utf8_str.encode(\'utf-8\').decode(\'utf-8-sig\') # 打印带 BOM 的 utf-8 编码的字符串 #print(utf8_bom_str.decode(\'utf-8-sig\')) # 将修改后的 HTML 保存到文件 with open(html1, \'w+\',encoding=\'UTF-8-sig\') as f: f.write(str(soup)) print("4")

其实直接utf-8-sig就可以了

手动操作就是上面的代码了

python3.8.11

记得import codecs

Java中fileoutputstream生成 utf8带 BOM文件

Java中fileoutputstream生成 utf8带 BOM文件怎么写?

参考技术A 自己先输出BOM

再输出内容追问

能不能具体点啊我知道无BOM的直接写成fos.write(str.getBytes("UTF-8"))的,BOM怎么加

追答

先输出
UTF-8的BOM, 0xEF, 0xBB, 0xBF

本回答被提问者采纳

以上是关于utf-8带bom 获取到utf-8字符串需要加上bom的主要内容,如果未能解决你的问题,请参考以下文章

JAVA输出带BOM的UTF-8编码的文件

在 Python 中将带 BOM 的 UTF-8 转换为不带 BOM 的 UTF-8

python 读取带BOM的utf-8格式文件

python 读取带BOM的utf-8格式文件

将 UTF-8 BOM 添加到字符串/Blob

UTF8文件带BOM引起的问题