比较不同编码的文件

Posted

技术标签:

【中文标题】比较不同编码的文件【英文标题】:Compare files with different encoding 【发布时间】:2013-04-03 12:54:16 【问题描述】:

几个月前,我试图将旧的基于 php4 和 iso8859-2 的系统迁移到 php5 和 utf8 编码上。一切正常,但现在需要最终运行这个新版本,问题是过去几个月在旧系统中进行了一些更改,我需要在这个基于 php5 的系统上拥有实际版本。 我想将这两个系统与 KDiff3 进行比较,但是由于编码差异,他告诉我有 2300 个差异。 最好的解决方案是使用一些工具进行比较,而无需更改此编码。 有没有一个工具可以比较两个不同的编码文件,就像它们的编码一样?

对不起,如果我的帖子令人困惑,但我已尝试尽可能简单地解释。

【问题讨论】:

【参考方案1】:

如果您取消选中“比较文件大小”复选框并在会话设置中使用“基于规则的比较”,则它在 Beyond Compare 4.0 中有效。

【讨论】:

【参考方案2】:

你没有。您将旧编码升级为 UTF-8,然后进行比较。

【讨论】:

确实,任何正确的视觉差异工具都会在内部做到这一点,最多只需在旧文件夹上选择正确的编码(UTF8 很容易检测)【参考方案3】:

我们的产品Beyond Compare 可以比较具有不同字符编码的文件,并且会忽略这些差异。它甚至会自动检测不同的编码,因此它应该可以开箱即用。

【讨论】:

如何设置 BeyondCompare 以使用 Latin1 或 iso-8859-1 @sixtyfootersdude 每个文件的路径编辑正下方是一个面板,其中包含文件的最后修改时间、大小、编码和行尾。如果您单击用于编码的那个(通常会说“ANSI”),则会有一个下拉菜单来选择不同的编码。如果您希望它影响特定类型的所有文件,请单击工具栏上的“格式”按钮,然后在结果对话框的“转换”选项卡中选择“编码”组合框。对于特殊情况还有一些其他方法,但如果您发送电子邮件至 support@scootersoftware.com,这些方法会更容易描述。

以上是关于比较不同编码的文件的主要内容,如果未能解决你的问题,请参考以下文章

比较使用不同编码存储的相同值

文件编码问题

python之路---06 小数据池 编码

python之路---06 小数据池 编码

视频格式与编码问题分析

文件编码问题