校对 STRENGTH 和本地语言关系
Posted
技术标签:
【中文标题】校对 STRENGTH 和本地语言关系【英文标题】:Collation STRENGTH and local language relation 【发布时间】:2011-04-13 23:45:52 【问题描述】:我从 Collator 的 Javadoc 中阅读了以下内容。
“对语言特征的精确分配取决于语言环境。例如,在捷克语中,“e”和“f”被认为是主要差异,而“e”和“ê”是次要差异,“e”和“E”是三级差异,“e”和“e”是相同的。”
这是否意味着我应该根据我使用的语言设置 STRENGTH?如果是这样,有人可以建议语言环境的默认值:us_en、us_es、ca_fr、spain_spanish、chile_spanish、portuguese
【问题讨论】:
【参考方案1】:它真的取决于你想要做什么。对于大多数(所有?)使用拉丁字母的语言来说,以下情况是正确的:
初级 不同:a、á、Á、b 相同:á, Ⅴ 相同:a,A 次要 不同:a、á、Á、b 不同:á, Ⅵ 相同:a,A 三级 不同:a、á、Á、b 不同:á, Ⅵ 不同:a、a 相同 还要考虑您看不到的差异,例如(accented A)
和(A) + (accent)
之间的差异
语言之间会有细微的差异,但本质上是:
如果您需要区分大小写的比较,请使用 Tertiary。 对于不区分大小写的比较,请使用 Primary 或 Secondary,具体取决于您是否希望 á 与 â 分组。 有些排序规则很奇怪。 a 与 á 不同,即使在 Primary 中,á 也与 Á 不同,即使在 Primary/Secondary 中。我不知道为什么;可能是错误? 谁知道非拉丁语言会发生什么。【讨论】:
值得注意的是排序规则如何影响零宽度空间、单词连接器/非连接器、软连字符以上是关于校对 STRENGTH 和本地语言关系的主要内容,如果未能解决你的问题,请参考以下文章