C语言

通用編程語言

C语言(英语:C Language)是一种通用的、过程式编程编程语言,支持结构化编程、词法作用域和递归,使用静态类型系统,并且广泛用于系统软件应用软件的开发。

C语言
在第一部介绍C语言的书籍《C程式设计语言》的初版封面上使用的C标识
编程范型过程式指令式编程过程式)、结构化编程
设计者丹尼斯·里奇(Dennis Ritchie)
实现者丹尼斯·里奇(Dennis Ritchie)和肯·汤普逊(Ken Thompson)
发行时间1972年,​52年前​(1972
当前版本
  • C17(2018年6月;稳定版本)
  • C23(2020年12月11日;预览版本)[1][2]
编辑维基数据链接
类型系统静态, 弱类型, 明示英语Manifest typing, 名称英语Nominal type system
操作系统跨平台
网站www.iso.org/standard/74528.html 编辑维基数据链接
主要实现产品
ClangGCCMSVCTurbo CWatcom C
启发语言
BBCPLCPL)、ALGOL 68[3]汇编语言PL/IFORTRAN
影响语言
大量
如:awkBitC英语BitCcshC++C#
DJavaJavaScriptObjective-CPerlPHPRust

C语言于1969年至1973年间,为了移植与开发UNIX操作系统,由丹尼斯·里奇肯·汤普逊,以B语言为基础,在贝尔实验室设计、开发出来。二十世纪八十年代,C语言应用日渐广泛。为了避免各开发厂商用的C语言的语法产生差异,美国国家标准局为C语言订定了一套完整的国际标准语法,称为ANSI C,作为C语言的标准。与此同时,国际标准化组织也接受该标准为国际标准。因此,ANSI C也同时被称为ISO C。二十世纪八十年代至今的有关程序开发工具,一般都支持符合ANSI C的语法。

C语言具有高效、灵活、功能丰富、表达力强和较高的可移植性等特点,在程式设计中备受青睐,成为最近25年使用最为广泛的编程语言[4]。目前,C语言编译器普遍存在于各种不同的操作系统中,例如Microsoft WindowsmacOSLinuxUnix等。C语言的设计影响了众多后来的编程语言,例如C++Objective-CJavaC#等。现行的许多软件都是由C语言或者其影响和派生的编程语言开发出来的。

概述

ALGOL一族的大多数过程式编程语言类似,C语言是一个有结构化程式设计、具有变量作用域(variable scope)以及递归功能的过程式语言。其采用的静态类型系统可以防止无意的程式设计操作。C语言中所有的可执行代码都被包含在子程序(函数)里。其传递参数均是以值传递(pass by value)[5],另外也可以传递指针(a pointer passed by value)。C语言是自由形式语言,即其原始码的缩进并不影响程序的功能,而是使用分号作为语句的结尾,花括号来表示代码块

由于C语言的语言规模较小,若干高层的机制需要使用定义的函数来提供。比如,C语言并没有直接处理复合对象(例如字符串、集合、列表、数组等)的操作,也没有对于存储器分配工具和内存回收工具的直接定义,同时也本身不具有输入和输出以及文件访问的方法。然而,用户定义的函数和C语言标准库中的函数为这些高层的机制提供了可能性。[6]

C语言也具有以下的特性:[6]

  • 基本数据类型包括字符、整型和浮点数等。另外也有派生的各种数据类型,如指针数组、结构和联合。
  • 部分的变量类型可以转换,例如整数型和字符型变量。
  • 透过指针(pointer),C语言可以容易的对存储器进行低端控制。
  • 不同的变量类型可以用结构体(struct)组合在一起。
  • 具有基本的控制流:语句组、条件判断、多路选择、循环等。
  • 函数可以返回各种数据类型的值,并且都可以递归调用。每次调用函数会重新创建变量。
  • C语言只有32个保留字(reserved keywords),使变量、函数命名有更多弹性。
  • 编译预处理(preprocessor)让C语言的编译更具有弹性。

历史

20世纪70年代,肯·汤姆森为了使其设计的Unix系统更加高效,使用B语言的变种(即C语言)在DEC PDP-7电脑上重写了Unix。C语言中许多重要概念来源于BCPL语言,其对C语言的影响也间接地来源于B语言。在1978年,丹尼斯·里奇布莱恩·柯林汉合作出版了《C程式设计语言》第一版,事实上即为K&R C标准[7]。1983年,为了制定一个独立于具体机器且无歧义的C语言标准,美国国家标准协会成立了一个委员会,并在1988年完成了该标准的制定,即ANSI C。此标准同时被国际标准化组织所采纳,也被称作ISO C。

其后,C语言至今经历了几次标准更新,诞生了C99C11和目前最新的标准C18。C语言标准的下一次更新C2x目前正在起草中。

语法

C语言的语法相对简洁而直接。C语言的形式文法国际标准化组织所制定。[8]简单来说,C语言包括如下文法:

  1. 作为一种指令式编程语言,C语言使用语句执行操作。最常见的语句是表达式语句,由一个表达式后加一个分号组成,可以令系统调用函数和为变量赋值;
  2. 注释: C语言支持单行注释(以//开头)和多行注释(以/*开始,以*/结束);
  3. 数据类型: 基本的数据类型包括整数(int)、浮点数(floatdouble)、字符(char)、枚举enum等;
  4. 数组: 数组是一组相同类型的数据元素的集合。使用以下方法初始化一个五个元素的整数数组:
    int numbers[5] = {1, 2, 3, 4, 5};
    
  5. 封装结构:结构(struct)、联合(union);
  6. 结构化编程和控制结构: C语言包括条件语句(ifelse)、循环语句(forwhiledo-while)等;
  7. 跳转语句:C语言允许使用跳转关键字gotobreakcontinue来实现程序块之间的跳转,这和汇编语言的jmp关键字有一定相似处;
  8. 函数: C语言中的函数是程序的基本模块,可以自定义函数并在程序中调用;
  9. 灵活且靠近底层的内存控制机制:C程序员可以自由选择分配何种内存,以及分配多大的内存,如如下代码所示:
    int *array = (int *)malloc(5 * sizeof(int)); // 分配一個包含五個整數的數組
    free(array); // 釋放使用malloc分配的內存
    

Hello World 程序

 
Brian Kernighan于1978年亲笔书写的“Hello World”程序
"对于所有语言的初学者来说,编写的第一个程序几乎都是相同的,即‘请打印出下列内容 hello, world’"
– 《C程式设计语言》[6]

现在广泛被编程初学者使用的"hello, world"程序实例最初就是出现在《C程式设计语言》第一版中。下面是一个在标准输出装置(stdout)上打印出 "Hello, world!" 字符串的简单程序。类似的程序,通常作为初学编程语言时的第一个程序:

#include <stdio.h>

int main(void) {
    printf("Hello, world!\n");
    return 0;
}

其中只有int,void,return为C语言的关键字,预处理器会将#include <stdio.h>替换为stdio.h文件的内容。

main函数是C语言程序的入口点

"Hello, world!\n"中的\n是一个转义字符,形式为\加上一个字符。所起的作用在ASCII码中规定。

printf是声明于stdio.h的函数,关于printf的更多细节,参见printf

关于格式化字符串的更多资讯,参见格式化字符串

内存管理

C语言的特色之一是:程序员必须亲自处理内存的分配细节。语言不负责内存边界检查,这是因为在运行时进行内存边界检查会造成性能问题,与UNIX哲学不符。此特性容易导致缓冲区溢出问题。然而,部分编译器(如英特尔编译器)会出于安全性的考量,提供方法以进行运行时内存边界检查[9]

大多数C语言实现使用栈(Stack)来保存函数返回地址/栈帧基址、完成函数的参数传递和函数局部变量的存储。然而,在部分极特殊的平台上,使用栈并不能获得最大效率。此时的实现由编译器决定[10]。 如果程序需要在运行的过程中动态分配内存,可以利用(Heap)来实现。

基本上C程序的元素存储在内存的时候有3种分配策略:

  • 静态分配

如果一个变量声明为全局变量或者是函数的静态变量,这个变量的存储将使用静态分配方式。静态分配的内存一般会被编译器放在数据段代码段来存储,具体取决于实现。这样做的前提是,在编译时就必须确定变量的大小。 以IA32的x86平台及gcc编译器为例,全局及静态变量放在数据段的低端;全局及静态常量放在代码段的高端。

  • 自动分配

函数的自动局部变量应该随着函数的返回会自动释放(失效),这个要求在一般的体系中都是利用栈(Stack)来满足的。相比于静态分配,这时候,就不必绝对要求这个变量在编译时就必须确定变量的大小,运行时才决定也不迟,但是C89仍然要求在编译时就要确定,而C99放松了这个限制。但无论是C89还是C99,都不允许一个已经分配的自动变量运行时改变大小。

所以说C函数永远不应该返回一个局部变量的地址

要指出的是,自动分配也属于动态分配,甚至可以用alloca函数来像分配堆(Heap)一样进行分配,而且释放是自动的。

  • 动态分配

还有一种更加特殊的情况,变量的大小在运行时有可能改变,或者虽然单个变量大小不变,变量的数目却有很大弹性,不能静态分配或者自动分配,这时候可以使用堆(Heap)来满足要求。ANSI C定义的堆操作函数是malloc、calloc、realloc和free。

使用堆(Heap)内存将带来额外的开销和风险。

C语言的标准文档要求了一个平台移植C语言的时候至少要实现的一些功能和封装的集合,称为“标准库”,标准库的声明头部通过预处理器命令#include进行引用。

在C89标准中:

文件 简介说明
<assert.h> 断言相关
<ctype.h> 字符类型判断
<errno.h> 标准报错机制
<float.h> 浮点运算
<limits.h> 各种体系结构限制
<locale.h> 本地化接口
<math.h> 数学函数
<setjmp.h> 跨函数跳转
<signal.h> 信号(类似UNIX信号定义,但是差很远)
<stdarg.h> 可变参处理
<stddef.h> 一些标准宏定义
<stdio.h> 标准I/O库
<stdlib.h> 标准工具库函数
<string.h> ASCII字符串及任意内存处理函数
<time.h> 时间相关

在94年的修正版中

  • <iso646.h>
  • <wchar.h>
  • <wctype.h>

在C99中增加了六个函数库

  • <complex.h>
  • <fenv.h>
  • <inttypes.h>
  • <stdbool.h>
  • <stdint.h>
  • <tgmath.h>

以上是C语言的标准。各个系统各自又对C库函数进行的各种扩充,就浩如烟海了。如POSIX CGNU C等。

工具软件

工具软件可以帮助程式设计者避免一些程序中潜藏或容易出现的问题,例如常会造成程序未预期动作或是执行期错误的代码。

许多语言都有自动原始码检查及审计工具,C语言也有类似工具,像是Lint。可以在程序刚写好时用Lint找出可能有问题的程序,通过Lint后再用C编译器进行编译,许多编译器也可以设置是否要针对一些可能有问题的代码提出警告。MISRA C是一套针对嵌入式系统的法则,可主要也是避免一些可能有问题的代码。

也有一些编译器、程序库或操作系统可以处理一些非标准C语言的功能,例如边界值检查、缓存溢出侦测、序列化自动垃圾回收功能。

使用像ValgrindIBM Rational Purify英语Purify等软件工具,或者链接有特别malloc函数的程序库,有助于找出一些运行期存储器使用的问题。

经典错误

void main() 的用法并不是任何标准制定的[11][12]。 C语言标准语法是 int main(),任何实现都必须支持int main(void) { /* ... */ }int main(int argc, char* argv[]) { /* ... */ }[13]。 在 C++ 标准中,main的标准类型应是int,否则类型是由实现定义的。任何实现都必须支持int main() { /* ... */ }int main(int argc, char* argv[]) { /* ... */ }[14]

参见

脚注

注解

参考资料

  1. ^ History of C. 2020年12月13日 [2020年10月24日] (英语). 
  2. ^ Programming languages — C (PDF). 2020年12月11日 [2020年12月17日] (英语). 
  3. ^ Ritchie, Dennis M. The Development of the C Language. January 1993 [2008-01-01]. (原始内容存档于2015-02-03). The scheme of type composition adopted by C owes considerable debt to Algol 68, although it did not, perhaps, emerge in a form that Algol's adherents would approve of. 
  4. ^ TIOBE Programming Community Index [TIOBE编程社区指数]. 2012 [2012-11-03]. (原始内容存档于2018-12-25) (英语). 
  5. ^ Brian W. Kernighan and Dennis M. Ritchie. The C programming Language. Prentice-Hall. 1988. ISBN 0-13-110362-8 (英语). In C, all function arguments are passed ``by value. 
  6. ^ 6.0 6.1 6.2 Dennis M. Ritchie,Brian W. Kernighan. C程序设计语言. 北京: 机械工业出版社. 2004年1月 [2020-06-10]. ISBN 9787111128069 (中文). 
  7. ^ Stephen Prata. C Primer Plus(第5版). 北京: 人民邮电出版社. 2005年2月: 3-4 [2020-07-15]. ISBN 9787115130228 (中文). 
  8. ^ ISO/IEC JTC1/SC22/WG14 - C. [2022-04-02]. (原始内容存档于2018-02-12) (英语). 
  9. ^ check-pointers, Qcheck-pointers. Intel. [2021-06-01]. (原始内容存档于2021-02-15) (英语). 
  10. ^ ISO/IEC 9899:2018 (PDF). [2020-06-10]. (原始内容存档 (PDF)于2020-07-22). 
  11. ^ Can I write "void main()"?页面存档备份,存于互联网档案馆)The definition void main() { /* ... */ } is not and never has been C++, nor has it even been C.
  12. ^ 用 C99 进行开放源代码的开发. [2011-01-21]. (原始内容存档于2011-08-12). 
  13. ^ “The function called at program startup is named main. The implementation declares no prototype for this function. It shall be defined with a return type of int and with no parameters: int main(void) { /* ... */ } or with two parameters (referred to here as argc and argv, though any names may be used, as they are local to the function in which they are declared): int main(int argc, char *argv[]) { /* ... */ } or equivalent; or in some other implementation-defined manner.”,引自ISO/IEC 9899:1999, Section 5.1.2.2.1 Program startup
  14. ^ “An implementation shall not predefine the main function. This function shall not be overloaded. It shall have a return type of type int, but otherwise its type is implementation-defined. All implementations shall allow both of the following definitions of main: int main() { /* ... */ } and int main(int argc, char* argv[]) { /* ... */ }.”,引自 ISO/IEC 14882, 第一版(1998)、第二版(2003)与第三版(2011), section 3.6.1 Main function

参考资料

外部链接