isalpha()函数~tolower()函数

Posted 再吃一个橘子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了isalpha()函数~tolower()函数相关的知识,希望对你有一定的参考价值。

isalpha()

判断一个字符是否是字母。

语法int isalpha ( int c );

在默认情况下,字母包括:

a b c d e f g h i j k l m n o p q r s t u v w x y z  A B C D E F G H I J K L M N O P Q R S T U V W X Y 

标准 ASCII 编码共包含了 128 个字符,不同的字符属于不同的分类,我们在 <ctype.h> 头文件中给出了详细的列表。

🍕参数

  • c                                                                                                                                                               

    要检测的字符。它可以是一个有效的字符(被转换为 int 类型),也可以是 EOF(表示无效的字符)。

💨返回值

返回值为非零(真)表示c是字母,返回值为零(假)表示c不是字母。

👁‍🗨实例

判断一个字符串中的字符是否是字母。

#include <stdio.h>
#include <ctype.h>
int main()
{
	int i = 0;
	char str[] = "C++ Java";
	while (str[i])
	{
		if (isalpha(str[i])) printf("character %c is alphabetic\\n", str[i]);
		else printf("character %c is not alphabetic\\n", str[i]);
		i++;
	}
	return 0;
}

运行结果:
character C is alphabetic
character + is not alphabetic
character + is not alphabetic
character   is not alphabetic
character J is alphabetic
character a is alphabetic
character v is alphabetic
character a is alphabetic

🧷关于字母

人们通常认为只有"abc...xyzABC...XYZ"才是字母,其实这是不对的。字母并不是固定的,不同的语言文化可能会包含不同的字母,例如在“简体中文”环境中,西里尔文БГЁ、希腊文ΣΩΔΨΦ(数学物理公式中常用希腊字母)等都将成为字母。

БГЁ - ΣΩΔΨΦ 都是大写字母,它们对应的小写字母是:
бгё - σωδψφ

我们可以通过 setlocale() 函数改变程序的地域设置,让程序使用不同的字符集,从而支持不同的语言文化。

在默认的地域设置(默认为"C")中,C语言通常使用 ASCII 编码,能较好地支持英文,此时字母包括:

a b c d e f g h i j k l m n o p q r s t u v w x y z  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z


在其它地域设置中,可能会使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等更加复杂的编码,它们包含了更多的字母。

也就是说,一个字符是否是字母和程序的地域设置有关,不同的地域设置会包含不同的字母。

🧷字母一定要区分大小写吗?

我们通常认为,一个字母要么是小写字母,要么是大写字母;并且一个小写字母必定对应一个大写字母,反之亦然。这种说法虽然适用于默认的地域设置(默认为"C"),但是并不一定适用于其它的地域设置。

以 Windows 下的“简体中文”环境为例,拼音āōūǖ都将成为小写字母,但是它们没有对应的大写字母。Windows 下的“简体中文”环境使用 GBK 编码,该编码并没有包含ĀŌŪǕ这些大写形式。

罗马数字ⅲⅵⅶⅸⅢⅥⅦⅨ也会被视为字母,并且从视觉上看起来是大小写对应的。其实不然,对于 Windows 来说,ⅲⅵⅶⅸⅢⅥⅦⅨ都仅仅是字母而已,并没有所谓的“大小写”形式;换句话说,它们既不是大写字母,也不是小写字母,仅仅是字母而已。

以上说法仅适用于 Windows,在 Linux 和 Mac OS 下使用“简体中文”情况会有所不同:

  • āōūǖ会有对应的大写字母ĀŌŪǕ,因为 Linux 和 Mac OS 下的“简体中文”使用 Unicode 字符集(严格来说是 UTF-8 编码),该字符集包含了世界上所有的字符。
  • 在 Mac OS 下,ⅲⅵⅶⅸⅢⅥⅦⅨ根本不会被视为字母;在 Linux 下,ⅲⅵⅶⅸ被视为小写字母,ⅢⅥⅦⅨ被视为大写字母。

🧷站在专业角度看问题

C语言标准规定,在默认的"C"地域设置中,只有 islower() 或者 isupper() 返回“真”的字母才会被视为字母;也就是说,一个字母要么是小写字母,要么是大写字母。

但是对于其它的地域设置,C语言并没有这种规定,一个字母可以是 islower() 或者 isupper() 返回“真”的字符,也可以是被当前语言环境显式地(刻意地)指定为字母的字符,例如罗马数字ⅲⅵⅶⅸⅢⅥⅦⅨ。但是有一个原则,被指定为字母的字符一定不能是 iscntrl()、isdigit()、ispunct()、isspace() 返回“真”的字符。

⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

tolower():

将大写字母转换为小写字母。

语法int tolower ( int c );

只有当参数 c 是一个大写字母,并且存在对应的小写字母时,这种转换才会发生。

在默认情况下,大写字母包括:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

小写字母包括:

a b c d e f g h i j k l m n o p q r s t u v w x y z

🍕参数

  • c                                                                                                                                                              

    要转换的字符。它可以是一个有效的字符(被转换为 int 类型),也可以是 EOF(表示无效的字符)。

💨返回值

如果转换成功,那么返回与 c 对应的小写字母;如果转换失败,那么直接返回 c(值未变)。

注意,返回值为 int 类型,你可能需要隐式或者显式地将它转换为 char 类型。

👁‍🗨实例

将一个字符串中的大写字母转换为小写字母。

#include <stdio.h>
#include <ctype.h>
int main ()
{
    int i=0;
    char str[]="Java C++ Python GoLang\\n";
    char c;
    while (str[i])
    {
        c=str[i];
        putchar (tolower(c));
        i++;
    }
    return 0;
}

运行结果:
java c++ python golang

🧷关于大小写字母

人们通常认为只有"acb...xyz"才是小写字母,只有"ABC...XYZ"才是大写字母,其实这是不对的。大小写字母并不是固定的,不同的语言文化可能会包含不同的大小写字母,例如在“简体中文”环境中,西里尔文БГЁ、希腊文ΣΩΔΨΦ(数学物理公式中常用希腊字母)等都将成为大写字母,它们对应的小写字母是бгё - σωδψφ

我们可以通过 setlocale() 函数改变程序的地域设置,让程序使用不同的字符集,从而支持不同的语言文化。

在默认的地域设置(默认为"C")中,C语言通常使用 ASCII 编码,能较好地支持英文,此时的大写字母包括:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

小写字母包括:

a b c d e f g h i j k l m n o p q r s t u v w x y z


在其它地域设置中,可能会使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等更加复杂的编码,它们包含了更多的大小写字母。
也就是说,一个字符是否是大写字母或者小写字母和程序的地域设置有关,不同的地域设置会包含不同的大小写字母。

🧷站在专业角度看问题

C语言标准规定,在默认的"C"地域设置中,只有 islower() 或者 isupper() 返回“真”的字母才会被视为字母;也就是说,一个字母要么是小写字母,要么是大写字母

但是对于其它的地域设置,C语言并没有这种规定,一个字母可以是 islower() 或者 isupper() 返回“真”的字符,也可以是被当前语言环境显式地(刻意地)指定为字母的字符,例如罗马数字ⅲⅵⅶⅸⅢⅥⅦⅨ。但是有一个原则,被指定为字母的字符一定不能是 iscntrl()、isdigit()、ispunct()、isspace() 返回“真”的字符。

对于 tolower(),仅当有且只有一个对应的小写字母时,这种转换才能成功;如果没有对应的小写字母,或者有多个对应的小写字母,那么转换失败。转换成功返回对应的小写字母,转换失败直接返回 c(值未变)。

以上是关于isalpha()函数~tolower()函数的主要内容,如果未能解决你的问题,请参考以下文章

常用函数总结

toupper字符串转换函数应用实例

使用带有字符串指针的 isalpha 函数

UVA 10815

R语言大小写转换函数(tolower, toupper, casefold,chartr)实战

python函数--isalpha()方法