C语言的main函数

大多数脚本语言不需要标明程序的起始位置,因为它们都是从第一行开始往后执行,是比较明确的。

而C属于编译型语言,需要编译、链接、执行3个步骤。编译器会将每一个编译单元(如.c源文件)都独立编译成目标文件(如.o),最后由链接器将这些目标文件链接成可执行程序。

C语言不允许在源文件中写全局域语句,而是以函数作为程序的构成模块。这是因为,如果当初C语言这样设计了,那倘若只有一个编译单元时是没什么问题的,但对于多个编译单元,链接器就无法知道应当从那个编译单元开始执行这些全局语句。这时候我们自然想到了指定链接时全局语句所在的编译单元顺序,但这在工程稍大点的时候,比goto带来的混乱还要可怕,所以明显不合理。有一种可行的解决办法,就是链接时只允许其中一个编译单元含有全局语句,超过时就报错。但更简单的做法是利用不能重复定义函数的机制,限定链接时只能有一个main函数,超过就报错。

使用main函数这种可以设计可以简单解决链接时的入口问题,而且使得语言更加简单。

那么C语言的入口函数是不是只能为main函数呢?当然不是。首先,main函数只是约定好的链接时的默认入口(被写入了C语言的规范当中),实在不喜欢这个名字的话,我们也可以在编译时告诉编译器我们想以哪个函数作为入口,以gcc为例,使用-e或者–entry参数来指定。

所以,C语言是不是可以没有main函数,和平台以及编译器有关吧。

那么,main函数的规范是什么样的呢?

一、main()函数的形式

在 C99 标准中,只有以下两种定义方式是正确的:

其中char *argv[]可以写成char **argv,两者等价。无参数形式的main函数还经常写成这种形式的:

在有些较老的C代码中,会有如下形式:

Brian W. Kernighan 和 Dennis M. Ritchie 的经典巨著 The C programming Language 用的就是 main( )这种形式。对于省略返回类型声明的这种形式,C90标准是允许,但是C99标准不允许。因此即使你当前的编译器允许,也不要这么写。

标准c++11规定

  1. 一个程序应该包含一个叫main的全局函数

  2. main函数不应该被重载,main必须返回int类型。所有的实现应允许以下两种写法:

int main() { /* ... */ }

int main(int argc, char* argv[]) { /* ... */ }

  1. The function main shall not be used within a program.

也就是你不应该在其他函数里调用main或者&main等操作。但是目前很多编译器好像是允许你去调用main的。

  1. 如果main省略了返回语句,那相当于return 0;

你还可能看到过另一种形式。

void main()

有些编译器(如VC6)允许这种形式,但是还没有任何标准考虑接受它。C++ 之父 Bjarne Stroustrup 在他的主页上的 FAQ 中明确地表示:void main( ) 的定义从来就不存在于 C++ 或者 C 。所以,编译器不必接受这种形式,并且很多编译器也不允许这么写。

坚持使用标准的意义在于:当你把程序从一个编译器移到另一个编译器时,照样能正常运行。

二、main()函数的返回值

从前面我们知道main()函数的返回值类型是int型的,而程序最后的 return 0; 正与之遥相呼应,0就是main()函数的返回值。那么这个0返回到那里呢?返回给调用者比如操作系统,表示程序正常退出。因为return语句通常写在程序的最后,不管返回什么值,只要到达这一步,说明程序已经运行完毕。而return的作用不仅在于返回一个值,还在于结束函数。

现在我们来做一个小试验来观察main()函数的返回值。

在linux下,我们可以通过echo $?命令来查看程序的返回值,在linux的console中,$?是一个特殊的环境变量,用于保存上一个程序的返回值。

编写如下代码并编译运行:

可以看到程序返回 一个0 。如果把 return 0; 改为 return 99; ,那么很显然,再次执行上述步骤以后你可以看到程序返回99。要是你这样写 return 99.99; 那还是返回99,因为99.99被传给操作系统之前,被强制类型转换成整数类型了。

现在,我们再另外编写两个程序a.c和b.c:

分别编译为 a 和 b 后,执行 ./a && ./b ,这样就可以看到:

I am a.

I am a.

&& 的含义是:如果 && 前面的程序正常退出,则继续执行 && 后面的程序,否则不执行。所以,要是把a.c里面的 return 0; 删除或者改为 return 99; ,那么你只能看到 I am a. 。也就是说,程序b.c就不执行了。现在,大家该明白 return 0; 的作用了吧。

三、main()函数的参数

C编译器允许main()函数没有参数,或者有两个参数(有些实现允许更多的参数,但这只是对标准的扩展)。这两个参数,一个是int类型,一个是字符串类型。第一个参数是命令行中的字符串数。按照惯例(但不是必须的),这个int参数被称为argc(argument counter)。第二个参数是一个指向字符串的指针数组。命令行中的每个字符串被存储到内存中,并且分配一个指针指向它。按照惯例,这个指针数组被称为argv(argument vector)。系统使用空格把各个字符串格开。一般情况下,把程序本身的名字赋值给argv[0],接着,把后面的第一个字符串赋给argv[1],等等。

我们来看一个例子:

PS: 在C90中无法使用for(int i = 1; i < argc; i++) 这样的初始化声明。
编译,在console中输入./a I am a 回车,将得到如下结果:

从本例可以看出,程序从命令行中接受到4个字符串(包括程序名),并将它们存放在字符串数组中,其对应关系:

argv[0] ——> ./a(程序名)

argv[1] ——> I

argv[2] ——> am

argv[3] ——> a

至于argc的值,也即是参数的个数,程序在运行时会自动统计,不必我们操心。

这个例子中,每个字符串都时一个单词(字母),那既然是字符串,要把一句话当作参数赋给程序该怎么办?你可以在命令行里这样输入 c “I am a.” 。程序运行结果:

The program name is ./a
The command line has 1 arguments:
1: I am a

其对应关系:

argv[0] ——> ./a(程序名)

argv[1] ——> I am a

要注意的是,你在命令行的输入都将作为字符串形式存储于内存中。也就是说,如果你输入一个数字,那么要输出这个数字,你应该用%s格式而非%d或者其他。

发表评论

电子邮件地址不会被公开。