<wctype.h> -- 函数
阅读:0       作者:严长生

iswblank() 判断一个宽字符是否是空白符

int iswblank (wint_t wc);

iswblank() 函数用来检测一个宽字符是否是空白符。

iswblank() 是 C99 标准新增的一个函数,在以前的 C89 标准中还有一个 iswspace() 函数,它也是用来判断一个宽字符是否是空白符,但是这两个函数是有区别的:
  • iswblank() 专指那些用来分割一行文本中的单词或文字的空白符,不能换行换页,或者有其它特殊效果。在默认的情况下,C语言一般使用 ASCII 编码,这样的空白符只有空格L' '和水平制表符L'\t'
  • iswspace() 没有这些要求,它指代所有的空白符,在 ASCII 编码中,包括空格L' '、水平制表符L'\t'、换行符L'\n'、垂直制表符L'\v'、换页L'\f'以及回车L'\r'

也就是说,iswblank() 所指的空白符是 iswspace() 的一个子集。

iswblank() 是 isblank()(位于<ctype.h>中)的宽字符版本:如果参数 wc 能够被 wctob() 转换为单个字节的形式,并且转换后的字符使用 isblank() 检测返回“真”(非零值),那么 iswblank() 也一定会将 wc 判定为空白符。

参数

  • wc

    要检测的宽字符。它可以是一个有效的宽字符(被转换为 wint_t 类型),也可以是 WEOF(表示无效的宽字符)。

返回值

返回值为非零(真)表示wc是空白符,返回值为零(假)表示wc不是空白符。

实例

检测一个宽字符串中是否存在空白字符,如果存在,请替换为换行符。
  1. #include <stdio.h>
  2. #include <wctype.h>
  3. int main ()
  4. {
  5. wchar_t c;
  6. int i=0;
  7. wchar_t str[] = L"C C++ Java Python Golang JavaScript\n";
  8. while (str[i])
  9. {
  10. c=str[i];
  11. if (iswspace(c)) c = L'\n';
  12. putwchar (c);
  13. i++;
  14. }
  15. return 0;
  16. }
运行结果:
C
C++
Java
Python
Golang
JavaScript

关于空白符

一个宽字符是否是空白符和程序的语言环境有关。C语言支持全球的语言系统,可以处理英文、中文、日文、韩文、德语、法语、拉丁文、希腊文等。

我们可以通过 setlocale() 函数进行地域设置,改变程序的语言环境,让程序使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等 ASCII 以外的字符集,它们包含了更多的空白符。

在默认的地域设置(默认为"C")中,程序一般使用 ASCII 编码,此时 isblank() 所指的空白符包括:
字符 ASCII码值 (十六进制) 说明 (缩写)
' ' 0x20 空格 (SPC)
'\t' 0x09 水平制表符 (TAB)

在其它的地域设置中,空白符可能不止这些。例如在“简体中文”环境下,有的空格占用一个中文字符的位置,有的占用四分之三个中文字符的位置,有的占用半个中文字符的位置,最小的占用四分之一个字符的位置,它们都是空白符。

请看下面的字符串:

"a b中 文"

ab之间是一个英文空格,它占用一个英文字符的位置;之间是一个中文空格,它占用一个中文字符的位置,比英文空格要宽一倍。这个“中文空格”只有在中文环境下才被认为是空白符,在英文环境下(严格来说是默认的"C"地域设置)不是空白符。
将输入法切换到全角,按下空格键就可以得到中文空格。
下面我们通过代码来验证一下:
  1. #include <wctype.h>
  2. #include <wchar.h>
  3. #include <locale.h>
  4. int main ()
  5. {
  6. int i = 0;
  7. wchar_t str[] = L"a b中 文";
  8. wchar_t c;
  9. setlocale(LC_ALL, "zh_CN.UTF-8"); //设置为简体中文,使用 UTF-8 编码
  10. //在 Windows 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "chs");
  11. //在 Linux 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "zh_CN.UTF-8");
  12. //在 Mac OS 下可以写作 setlocale(LC_ALL, "zh_CN"); 或者 setlocale(LC_ALL, "zh_CN.UTF-8");
  13. while (str[i])
  14. {
  15. c = str[i];
  16. if (iswblank(c)) wprintf(L"'%lc' is blank\n", c);
  17. else wprintf(L"'%lc' is not blank\n", c);
  18. i++;
  19. }
  20. return 0;
  21. }
运行结果:

'a' is not blank
' ' is blank
'b' is not blank
'中' is not blank
' ' is blank
'文' is not blank