在C#中,ToUpper()和ToUpperInvariant()之间有什么区别?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在C#中,ToUpper()和ToUpperInvariant()之间有什么区别?相关的知识,希望对你有一定的参考价值。

在C#中,ToUpper()ToUpperInvariant()有什么区别?

你能举例说明结果可能有所不同吗?

答案

ToUpper使用当前的文化。 ToUpperInvariant使用不变的文化。

典型的例子是土耳其,其中“i”的大写不是“我”。

显示差异的示例代码:

using System;
using System.Drawing;
using System.Globalization;
using System.Threading;
using System.Windows.Forms;

public class Test
{
    [STAThread]
    static void Main()
    {
        string invariant = "iii".ToUpperInvariant();
        CultureInfo turkey = new CultureInfo("tr-TR");
        Thread.CurrentThread.CurrentCulture = turkey;
        string cultured = "iii".ToUpper();

        Font bigFont = new Font("Arial", 40);
        Form f = new Form {
            Controls = {
                new Label { Text = invariant, Location = new Point(20, 20),
                            Font = bigFont, AutoSize = true},
                new Label { Text = cultured, Location = new Point(20, 100),
                            Font = bigFont, AutoSize = true }
            }
        };        
        Application.Run(f);
    }
}

有关土耳其语的更多信息,请参阅此Turkey Test blog post

我不会感到惊讶的是,除了被忽略的角色之外还有其他各种大写问题等等。这只是我不知道的一个例子...部分原因是因为它在几年前我在Java中占据了一席之地 - 使用字符串并将其与“MAIL”进行比较。这在土耳其没有那么好用......

另一答案

乔恩的回答很完美。我只想补充一点,ToUpperInvariant与调用ToUpper(CultureInfo.InvariantCulture)相同。

这让Jon的例子更简单一些:

using System;
using System.Drawing;
using System.Globalization;
using System.Threading;
using System.Windows.Forms;

public class Test
{
    [STAThread]
    static void Main()
    {
        string invariant = "iii".ToUpper(CultureInfo.InvariantCulture);
        string cultured = "iii".ToUpper(new CultureInfo("tr-TR"));

        Application.Run(new Form {
            Font = new Font("Times New Roman", 40),
            Controls = { 
                new Label { Text = invariant, Location = new Point(20, 20), AutoSize = true }, 
                new Label { Text = cultured, Location = new Point(20, 100), AutoSize = true }, 
            }
        });
    }
}

我也使用New Times Roman,因为它是一种更酷的字体。

我还设置了FormFont属性而不是两个Label控件,因为Font属性是继承的。

我只是因为我喜欢紧凑(例如,不是生产)代码而减少了一些其他行。

我此刻真的没有更好的事情要做。

另一答案

从MSDN开始

http://msdn.microsoft.com/en-us/library/system.string.toupperinvariant.aspx

ToUpperInvariant方法等同于ToUpper(CultureInfo.InvariantCulture)

仅仅因为资本i是英语中的“我”,并不总是如此。

另一答案

String.ToUpperString.ToLower可以根据不同的文化给出不同的结果。最着名的例子是the Turkish example,将小写拉丁语“i”转换为大写,不会导致大写拉丁语“I”,而是土耳其语“I”。

Capitalization of I depending on culture, upper row - lower case letters, lower row - upper case letters

至于我,即使与上面的图片(source)混淆,我写了一个程序(见下面的源代码),看看土耳其例子的确切输出:

# Lowercase letters
Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish
English i - i (u0069) | I (u0049)     | I (u0130)   | i (u0069)     | i (u0069)
Turkish i - ı (u0131) | ı (u0131)     | I (u0049)   | ı (u0131)     | ı (u0131)

# Uppercase letters
Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish
English i - I (u0049) | I (u0049)     | I (u0049)   | i (u0069)     | ı (u0131)
Turkish i - I (u0130) | I (u0130)     | I (u0130)   | I (u0130)     | i (u0069)

如你看到的:

  1. 大写小写字母和小写大写字母对于不变文化和土耳其文化给出不同的结果。
  2. 无论文化是什么,大写字母大写字母和小写字母小写字母都没有效果。
  3. Culture.CultureInvariant保留土耳其字符
  4. ToUpperToLower是可逆的,即在对其进行大写之后小写字符,将其带到原始形式,只要两种操作都使用相同的文化。

根据MSDN的说法,Char.ToUpper和Char.ToLower土耳其语和阿塞拜疆语是唯一受影响的文化,因为它们是唯一具有单字符套管差异的文化。对于字符串,可能会有更多文化受到影响。


用于生成输出的控制台应用程序的源代码:

using System;
using System.Globalization;
using System.Linq;
using System.Text;

namespace TurkishI
{
    class Program
    {
        static void Main(string[] args)
        {
            var englishI = new UnicodeCharacter('u0069', "English i");
            var turkishI = new UnicodeCharacter('u0131', "Turkish i");

            Console.WriteLine("# Lowercase letters");
            Console.WriteLine("Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish");
            WriteUpperToConsole(englishI);
            WriteLowerToConsole(turkishI);

            Console.WriteLine("
# Uppercase letters");
            var uppercaseEnglishI = new UnicodeCharacter('u0049', "English i");
            var uppercaseTurkishI = new UnicodeCharacter('u0130', "Turkish i");
            Console.WriteLine("Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish");
            WriteLowerToConsole(uppercaseEnglishI);
            WriteLowerToConsole(uppercaseTurkishI);

            Console.ReadKey();
        }

        static void WriteUpperToConsole(UnicodeCharacter character)
        {
            Console.WriteLine("{0,-9} - {1,10} | {2,-14} | {3,-12} | {4,-14} | {5,-12}",
                character.Description,
                character,
                character.UpperInvariant,
                character.UpperTurkish,
                character.LowerInvariant,
                character.LowerTurkish
            );
        }

        static void WriteLowerToConsole(UnicodeCharacter character)
        {
            Console.WriteLine("{0,-9} - {1,10} | {2,-14} | {3,-12} | {4,-14} | {5,-12}",
                character.Description,
                character,
                character.UpperInvariant,
                character.UpperTurkish,
                character.LowerInvariant,
                character.LowerTurkish
            );
        }
    }


    class UnicodeCharacter
    {
        public static readonly CultureInfo TurkishCulture = new CultureInfo("tr-TR");

        public char Character { get; }

        public string Description { get; }

        public UnicodeCharacter(char character) : this(character, string.Empty) {  }

        public UnicodeCharacter(char character, string description)
        {
            if (description == null) {
                throw new ArgumentNullException(nameof(description));
            }

            Character = character;
            Description = description;
        }

        public string EscapeSequence => ToUnicodeEscapeSequence(Character);

        public UnicodeCharacter LowerInvariant => new UnicodeCharacter(Char.ToLowerInvariant(Character));

        public UnicodeCharacter UpperInvariant => new UnicodeCharacter(Char.ToUpperInvariant(Character));

        public UnicodeCharacter LowerTurkish => new UnicodeCharacter(Char.ToLower(Character, TurkishCulture));

        public UnicodeCharacter UpperTurkish => new UnicodeCharacter(Char.ToUpper(Character, TurkishCulture));


        private static string ToUnicodeEscapeSequence(char character)
        {
            var bytes = Encoding.Unicode.GetBytes(new[] {character});
            var prefix = bytes.Length == 4 ? @"U" : @"u";
            var hex = BitConverter.ToString(bytes.Reverse().ToArray()).Replace("-", string.Empty);
            return $"{prefix}{hex}";
        }

以上是关于在C#中,ToUpper()和ToUpperInvariant()之间有什么区别?的主要内容,如果未能解决你的问题,请参考以下文章

不确定为啥 toupper() 会切断 C 中的最后一个字母

有人能帮解释一下下面的C语言代码吗?主要是指针

为啥 putchar、toupper、tolow 等采用 int 而不是 char?

C函数tolower,与toupper

toupper字符串转换函数应用实例

请问这个C语言中有参数的函数是怎么传递值的,调用的时候没有参数啊。