孟加拉语文本未显示在Unicode CSV文件中
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了孟加拉语文本未显示在Unicode CSV文件中相关的知识,希望对你有一定的参考价值。
我有孟加拉语的Excel文件。要正确显示孟加拉语文本,我需要在PC上安装孟加拉语字体。
我使用Office 2010将Excel文件转换为CSV。但它只显示'?'标记而不是孟加拉语字符。然后我使用Google Docs进行转换,遇到同样的问题,但是字符不可读而不是'?'。我将该文件中的摘录粘贴到html文件中,并试图在我的浏览器中不加思索地查看它。
如何从孟加拉语的.xlsx文件中获取CSV文件,以便将其导入mysql数据库?
编辑:在this SO问题中接受的答案让我转到Google Docs。
根据Excel to CSV with UTF8 encoding问题的答案,Google Docs应该正确保存CSV,与Excel相反,后者会销毁所有在使用的“ANSI”编码中无法表示的字符。但也许他们改变了这个,或者出了什么问题,或者对情况的分析是不正确的。
对于在MS Office程序中处理的正确编码的Bangla(孟加拉语),不需要任何“Bangla字体”,因为Arial Unicode MS字体(Office附带)包含Bangla字符。实际上,某些非标准编码中的数据依赖于特殊编码的字体吗?在这种情况下,它应首先转换为Unicode,但可能使用一致使用该特定字体的程序以某种方式进行管理。
在Excel中,使用“另存为”时,可以选择“Unicode文本(* .txt)”。它以UTF-16编码将数据保存为TSV(制表符分隔值)。然后,您可能需要将其转换为使用逗号作为分隔符而不是制表符,和/或从UTF-16转换为UTF-8。但这仅在原始数据被正确编码时才有效。
当我需要一个带有Bangla Unicode字符的CSV文件时,我也遇到了同样的问题,以下方法适用于我。
- 将您的Excel文件(使用Bangla Unicode字符)上传到Google云端硬盘
- 现在使用Google表格打开上传的文件
- 来自Google表格 - >文件 - >以逗号分隔值下载(CSV,当前表格)
- 下载的CSV是具有Bangla Unicode字符的所需CSV。
注意:虽然我用excel打开的文件显示了垃圾字符,但它在Web应用程序中对我有效,并显示正确的字符。
以上是关于孟加拉语文本未显示在Unicode CSV文件中的主要内容,如果未能解决你的问题,请参考以下文章