数组和指针
构造数据是指由用户可以定义的、非内置的数据类型。主要有数组、结构体、联合体。
数组
数组属于构造数据类型,是一组相同类型数据的连续内存集合。
数组的特点包括:
- 固定大小(编译时确定)
- 元素类型相同
- 内存连续分配
- 通过下标访问(从0开始)
前面提到的基本的数据类型又可以和数组结合,形成新的构造数据类型。这里不再逐一列举。
定义数组:数据类型 数组名[数组长度];
// int 元素类型
// ages 数组名称
// [10] 数组长度 即 元素个数
int ages[10];
// 数组名为ages, 数组类型为int [10]
int scores[5]; // 5个整数的数组
double temps[30]; // 30个双精度浮点数
char name[20]; // 20个字符的字符数组,也叫字符串
初始化数组
// 完全初始化, 其中在{ }中的各数据值即为各元素的初值,各值之间用逗号间隔
// 定义的同时可以初始化多个值
int ages[3] = {4, 6, 9};
// 完全初始化,不指定元素个数,自动计算长度
int days[] = {31,28,31,30,31}; // 自动确定为5个元素
// 部分初始化(剩余自动补0)
int arr[5] = {1, 2}; // [1, 2, 0, 0, 0]
// 部分初始化,指定位置的元素初始化
int nums[5] = {[0] = 1,[1] = 2}; // [1, 2, 0, 0, 0]
// 先定义后初始化
int nums[3];
nums[0] = 1;
nums[1] = 2;
nums[2] = 3;
int ages[3]; // 定义后只能逐个初始化值
ages = {4, 6, 9}; // 报错
如果定义数组后,没有初始化,数组中是随机的垃圾数,所以如果想要正确使用数组应该要进行初始化。
在定义数组的时候[]里面能写整型常量或者是返回整型常量的表达式
不能写变量。
#include <stdio.h>
int main() {
int ages1['A'] = {19, 22, 33};// 'A' 会被转换为 65
printf("ages1[0] = %d\n", ages1[0]);
int ages2[5 + 5] = {19, 22, 33};
printf("ages2[0] = %d\n", ages2[0]);
int ages3['A' + 5] = {19, 22, 33};// 'A' + 5会被转换为 70
printf("ages3[0] = %d\n", ages3[0]);
printf("sizeof(ages3) = %lu\n", sizeof(ages3));// 大小为 70 * 4 = 280
}
数组元素的访问
使用数组时不能超出数组的索引范围使用,索引从 0 开始,到元素个数-1 结束
通过下标(索引)访问:
int nums[3] = {10, 20, 30};
nums[0] = 15; // 修改第一个元素
int x = nums[2]; // 读取第三个元素
// 越界访问
int arr[3];
arr[5] = 10; // 未定义行为!可能破坏其他内存,导致程序崩溃
数组的遍历
遍历的意思就是有序地查看数组的每一个元素
#include <stdio.h>
int main() {
int ages[4] = {11, 22, 33, 44};
// 正序输出(遍历)数组
for (int i = 0; i < 4; i++) {
printf("ages[%d] = %d\n", i, ages[i]);
}
// 逆序输出(遍历)数组
for (int i = 3; i >=0; i--) {
printf("ages[%d] = %d\n", i, ages[i]);
}
return 0;
}
数组的内存
因为数组在内存中占用的字节数取决于其存储的数据类型和数据的个数
数组所占用存储空间 = 一个元素所占用存储空间 x 元素个数(数组长度)
可以使用 sizeof 函数来计算数组所占用的存储总空间和元素所占用的空间,进一步可以计算出数组的长度
#include <stdio.h>
int main() {
int ages[4] = {19, 22, 33};
int length = sizeof(ages) / sizeof(ages[0]);
printf("length = %d\n", length);
return 0;
}
- 内存寻址从大到小,系统从高地址开辟一块连续没有被使用的(栈)内存给数组
- 从分配的连续存储空间中,地址小的位置开始给每个元素分配空间
- 数组名指向整个存储空间最小的地址
#include <stdio.h>
int main()
{
char cs[] = {'l','n','j'}; // 获得三个高地址。假设为:99、98、97
// 数组名指向整个存储空间最小的地址
printf("cs = %p\n", &cs); // cs = 97
// 数组元素指向每个元素的地址
// 从分配的连续存储空间中, 地址小的位置开始给每个元素分配空间
printf("cs[0] = %p\n", &cs[0]); // cs[0] = 97
printf("cs[1] = %p\n", &cs[1]); // cs[1] = 98
printf("cs[2] = %p\n", &cs[2]); // cs[2] = 99
return 0;
}
系统自动分配的内存空间叫做栈。从高地址开始,依次向下分配。默认 1-8 MB。可调整到几十 MB,但不宜太大,因为每个线程都需要独立堆区(不用也占着),多线程会占用大量内存。
那么我们程序员则可以从下往上使用内存,叫做堆。使用堆时,系统不会自动分配内存,需要我们自己申请。(不超过系统实际可用内存大小)堆是共享的,实际用多少分配多少(不用别人可以用)。
使用堆的情况:需要大量内存/不知道需要多大内存/需要跨函数使用
栈和堆是同一块物理内存的不同逻辑区域,可以调整栈和堆的大小比例。
堆 = 公共仓库
- 所有线程(工人)共享
- 需要登记(加锁)才能拿东西
- 容量大,但可能需要排队
栈 = 个人工具箱
- 每个线程(工人)有自己的
- 不需要跟别人抢
- 空间小,但访问快
| 特性 | 栈(Stack) | 堆(Heap) |
|---|---|---|
| 共享性 | 每线程独立 | 所有线程共享 |
| 空间分配 | 创建线程时预留 | 按需动态增长 |
| 多线程开销 | 线程数 × 栈大小 | 所有线程共用一个 |
| 线程安全 | 天然线程安全 | 需要同步机制 |
| 访问速度 | 快(无竞争) | 较慢(可能竞争) |
| 适用场景 | 临时变量、函数调用 | 共享数据、大对象 |
数组和函数
数组可以作为函数的参数使用,数组用作函数参数有两种形式:
-
一种是把数组元素作为实参使用
-
一种是把数组名作为函数的形参和实参使用
-
数组的元素作为函数实参,与同类型的简单变量作为实参一样,如果是基本数据类型,那么形参的改变不影响实参
void change(int val)// int val = number
{
val = 55;
}
int main(int argc, const char * argv[])
{
int ages[3] = {1, 5, 8};
printf("ages[0] = %d", ages[0]);// 1
change(ages[0]);
printf("ages[0] = %d", ages[0]);// 1
}
- 用数组元素作函数参数不要求形参也必须是数组元素
数组名作为函数参数
- 在 C 语言中,数组名除作为变量的标识符之外,数组名还代表了该数组在内存中的起始地址,因此,当数组名作函数参数时,实参与形参之间不是"值传递",而是"地址传递"
- 实参数组名将该数组的起始地址传递给形参数组,两个数组共享一段内存单元,系统不再为形参数组分配存储单元
- 既然两个数组共享一段内存单元,所以形参数组修改时,实参数组也同时被修改了
void change2(int array[3])// int array = 0ffd1
{
array[0] = 88;
}
int main(int argc, const char * argv[])
{
int ages[3] = {1, 5, 8};
printf("ages[0] = %d", ages[0]);// 1
change(ages);
printf("ages[0] = %d", ages[0]);// 88
}
数组名作函数参数的注意点
- 在函数形参表中,允许不给出形参数组的长度
void change(int array[])
{
array[0] = 88;
}
- 形参数组和实参数组的类型必须一致,否则将引起错误。
void prtArray(double array[3]) // 错误写法
{
for (int i = 0; i < 3; i++) {
printf("array[%d], %f", i, array[i]);
}
}
int main(int argc, const char * argv[])
{
int ages[3] = {1, 5, 8};
prtArray(ages[0]);
}
- 当数组名作为函数参数时,因为自动转换为了指针类型,所以在函数中无法动态计算除数组的元素个数
void printArray(int array[])
{
printf("printArray size = %lu\n", sizeof(array)); // 8
int length = sizeof(array)/ sizeof(int); // 2
printf("length = %d", length);
}
字符串
字符串是数组的一种特殊形态。
// 字符串是个特例,可以如此简化创建
char name[] = "Tom"
strlen
strlen可以获取真正的字符串的长度,不计算末尾的\0,也不计算没有被使用的内存。
/* praise2.c */
// 如果编译器不识别%zd,尝试换成%u或%lu。
#include <stdio.h>
#include <string.h> /* 提供strlen()函数的原型 */
#define PRAISE "You are an extraordinary being."
int main(void)
{
char name[40];
printf("What's your name? ");
scanf("%s", name);
printf("Hello, %s. %s\n", name, PRAISE);
printf("Your name of %zd letters occupies %zd memory cells.\n",
strlen(name), sizeof name);
printf("The phrase of praise has %zd letters ",
strlen(PRAISE));
printf("and occupies %zd memory cells.\n", sizeof PRAISE);
return 0;
}
多维数组
二维数组
- 所谓二维数组就是一个一维数组的每个元素又被声明为一 维数组,从而构成二维数组. 可以说二维数组是特殊的一维数组。
- 示例:
int a[2][3] = { {80,75,92}, {61,65,71}};
- 格式:
- 数据类型 数组名[一维数组的个数][一维数组的元素个数]
- 其中"一维数组的个数"表示当前二维数组中包含多少个一维数组
- 其中"一维数组的元素个数"表示当前前二维数组中每个一维数组元素的个数
二维数组的初始化
- 二维数的初始化可分为两种:
- 定义的同时初始化
- 先定义后初始化
- 定义的同时初始化
int a[2][3]={ {80,75,92}, {61,65,71}};
- 先定义后初始化
int a[2][3];
a[0][0] = 80;
a[0][1] = 75;
a[0][2] = 92;
a[1][0] = 61;
a[1][1] = 65;
a[1][2] = 71;
- 按行分段赋值
int a[2][3]={ {80,75,92}, {61,65,71}};
- 按行连续赋值
int a[2][3]={ 80,75,92,61,65,71};
- 其它写法
- 完全初始化,可以省略第一维的长度
int a[][3]={{1,2,3},{4,5,6}};int a[][3]={1,2,3,4,5,6};
- 部分初始化,可以省略第一维的长度
int a[][3]={{1},{4,5}};int a[][3]={1,2,3,4};
- 注意: 有些人可能想不明白,为什么可以省略行数,但不可以省略列数。也有人可能会问,可不可以只指定行数,但是省略列数?其实这个问题很简单,如果我们这样写:
int a[2][] = {1, 2, 3, 4, 5, 6}; // 错误写法大家都知道,二维数组会先存放第 1 行的元素,由于不确定列数,也就是不确定第 1 行要存放多少个元素,所以这里会产生很多种情况,可能 1、2 是属于第 1 行的,也可能 1、2、3、4 是第一行的,甚至 1、2、3、4、5、6 全部都是属于第 1 行的
- 指定元素的初始化
int a[2][3]={[1][2]=10};int a[2][3]={[1]={1,2,3}}
二维数组的应用场景
象棋、围棋的棋子的表示。网格地图的数据表示。
二维数组的遍历和存储
二维数组的遍历
- 二维数组 a[3][4],可分解为三个一维数组,其数组名分别为:
- 这三个一维数组都有 4 个元素,例如:一维数组 a[0]的 元素为 a[0][0],a[0][1],a[0][2],a[0][3]。
- 所以遍历二维数组无非就是先取出二维数组中得一维数组, 然后再从一维数组中取出每个元素的值
- 示例
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
printf("%c", cs[0][0]);// 第一个[0]取出一维数组, 第二个[0]取出一维数组中对应的元素
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
for (int i = 0; i < 2; i++) { // 外循环取出一维数组
// i
for (int j = 0; j < 3; j++) {// 内循环取出一维数组的每个元素
printf("%c", cs[i][j]);
}
printf("\n");
}
注意: 必须强调的是,a[0],a[1],a[2]不能当作下标变量使用,它们是数组名,不是一个单纯的下标变量
二维数组的存储
- 和一维数组一样
- 给数组分配存储空间从内存地址大开始分配
- 给数组元素分配空间, 从所占用内存地址小的开始分配
- 往每个元素中存储数据从高地址开始存储
#include <stdio.h>
int main()
{
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
// cs == &cs == &cs[0] == &cs[0][0]
printf("cs = %p\n", cs); // 0060FEAA
printf("&cs = %p\n", &cs); // 0060FEAA
printf("&cs[0] = %p\n", &cs[0]); // 0060FEAA
printf("&cs[0][0] = %p\n", &cs[0][0]); // 0060FEAA
return 0;
}
| 二维数组变量名 | 内部一维数组 | 元素 | 地址 | 内容 |
|---|---|---|---|---|
| cs | cs[1] | cs[1][2] | 高 | f |
| cs | cs[1] | cs[1][1] | ... | e |
| cs | cs[1] | cs[1][0] | ... | d |
| cs | cs[0] | cs[0][2] | ... | c |
| cs | cs[0] | cs[0][1] | ... | b |
| cs | cs[0] | cs[0][0] | 低 | a |
二维数组与函数
- 值传递
#include <stdio.h>
// 和一位数组一样, 只看形参是基本类型还是数组类型
// 如果是基本类型在函数中修改形参不会影响实参
void change(char ch){
ch = 'n';
}
int main()
{
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
printf("cs[0][0] = %c\n", cs[0][0]); // a
change(cs[0][0]);
printf("cs[0][0] = %c\n", cs[0][0]); // a
return 0;
}
- 地址传递
#include <stdio.h>
// 和一位数组一样, 只看形参是基本类型还是数组类型
// 如果是数组类型在函数中修改形参会影响实参
void change(char ch[]){
ch[0] = 'n';
}
int main()
{
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
printf("cs[0][0] = %c\n", cs[0][0]); // a
change(cs[0]);
printf("cs[0][0] = %c\n", cs[0][0]); // n
return 0;
}
#include <stdio.h>
// 和一位数组一样, 只看形参是基本类型还是数组类型
// 如果是数组类型在函数中修改形参会影响实参
void change(char ch[][3]){
ch[0][0] = 'n';
}
int main()
{
char cs[2][3] = {
{'a', 'b', 'c'},
{'d', 'e', 'f'}
};
printf("cs[0][0] = %c\n", cs[0][0]); // a
change(cs);
printf("cs[0][0] = %c\n", cs[0][0]); // n
return 0;
}
- 形参错误写法
void test(char cs[2][]) // 错误写法
{
printf("我被执行了\n");
}
void test(char cs[2][3]) // 正确写法
{
printf("我被执行了\n");
}
void test(char cs[][3]) // 正确写法
{
printf("我被执行了\n");
}
- 二维数组作为函数参数,在被调函数中不能获得其有多少行,需要通过参数传入
void test(char cs[2][3])
{
int row = sizeof(cs); // 输出4或8
printf("row = %zu\n", row);
}
- 二维数组作为函数参数,在被调函数中可以计算出二维数组有多少列
void test(char cs[2][3])
{
size_t col = sizeof(cs[0]); // 输出3
printf("col = %zd\n", col);
}
指针基本概念
- 什么是地址
- 生活中的地址:

- 内存地址:

- 地址与内存单元中的数据是两个完全不同的概念
- 地址如同房间编号, 根据这个编号我们可以找到对应的房间
- 内存单元如同房间, 房间是专门用于存储数据的
- 变量地址:
- 系统分配给"变量"的"内存单元"的起始地址
int num = 6; // 占用4个字节
//那么变量num的地址为: 0ff06
char c = 'a'; // 占用1个字节
//那么变量c的地址为:0ff05

什么是指针
-
在计算机中所有数据都存储在内存单元中,而每个内存单元都有一个对应的地址, 只要通过这个地址就能找到对应单元中存储的数据.
-
由于通过地址能找到所需的变量单元,所以我们说该地址指向了该变量单元。将地址形象化的称为“指针”
-
指针的本质是对内存访问的抽象,理解了内存的原理,也就理解了指针。人们往往误以为指针就是内存地址,其实二者是有区别的。指针是一种类型,它的值是内存地址,而不是数据。所以指针变量存放的是内存地址,而不是内存地址对应的数据。内存地址是基于字节的,但由于指针具有类型,所以它指向了一段内存,这段内存的大小取决于其类型,而指针存储的就是这段内存的起始地址。
-
内存单元的指针(地址)和内存单元的内容是两个不同的概念。

什么是指针变量
- 在 C 语言中,允许用一个变量来存放其它变量的地址, 这种专门用于存储其它变量地址的变量, 我们称之为指针变量

- 示例:
int age;// 定义一个普通变量
num = 10;
int *pnAge; // 定义一个指针变量
pnAge = &age;

定义指针变量的格式
- 指针变量的定义包括两个内容:
- 指针类型说明,即定义变量为一个指针变量;
- 指针变量名;

- 示例:
char ch = 'a';
char *p; // 一个用于指向字符型变量的指针
p = &ch;
int num = 666;
int *q; // 一个用于指向整型变量的指针
q = #
- 其中,*表示这是一个指针变量
- 变量名即为定义的指针变量名
- 类型说明符表示本指针变量所指向的变量的数据类型
指针变量的初始化方法
- 指针变量初始化的方法有两种:定义的同时进行初始化和先定义后初始化
- 定义的同时进行初始化
int a = 5;
int *p = &a;
- 先定义后初始化
int a = 5;
int *p;
p=&a;
- 把指针初始化为 NULL
int *p=NULL;
int *q=0;
- 不合法的初始化:
- 指针变量只能存储地址, 不能存储其它类型
int *p;
p = 250; // 错误写法
- 给指针变量赋值时,指针变量前不能再加“*”
int *p;
*p=&a; //错误写法
- 注意点:
- 多个指针变量可以指向同一个地址

- 指针的指向 是可以改变的
int a = 5;
int *p = &a;
int b = 10;
p = &b; // 修改指针指向
- 指针没有初始化里面是一个垃圾值,这时候我们这是一个野指针
- 野指针可能会导致程序崩溃
- 野指针访问你不该访问数据
- 所以指针必须初始化才可以访问其所指向存储区域

访问指针所指向的存储空间
- C 语言中提供了地址运算符&来表示变量的地址。其一般形式为:
- &变量名;
- C 语言中提供了*来定义指针变量和访问指针变量指向的内存存储空间
- 在定义变量的时候 * 是一个类型说明符,说明定义的这个变量是一个指针变量
int *p=NULL; // 定义指针变量
- 在不是定义变量的时候 *是一个操作符,代表访问指针所指向存储空间
int a = 5;
int *p = &a;
printf("a = %d", *p); // 访问指针变量
指针类型
-
在同一种编译器环境下,一个指针变量所占用的内存空间是固定的。

-
虽然在同一种编译器下, 所有指针占用的内存空间是一样的,但不同类型的变量却占不同的字节数
- 一个 int 占用 4 个字节,一个 char 占用 1 个字节,而一个 double 占用 8 字节;
- 现在只有一个地址,我怎么才能知道要从这个地址开始向后访问多少个字节的存储空间呢,是 4 个,是 1 个,还是 8 个。
- 所以指针变量需要它所指向的数据类型告诉它要访问多少个字节存储空间

二级指针
- 如果一个指针变量存放的又是另一个指针变量的地址,则称这个指针变量为指向指针的指针  变量。也称为“二级指针”
char c = 'a';
char *cp;
cp = &c;
char **cp2;
cp2 = &cp;
printf("c = %c", **cp2);

- 多级指针的取值规则
int ***m1; //取值***m1
int *****m2; //取值*****m2
数组指针的概念及定义
- 数组元素指针
- 一个变量有地址,一个数组包含若干元素,每个数组元素也有相应的地址, 指针变量也可以保存数组元素的地址
- 只要一个指针变量保存了数组元素的地址, 我们就称之为数组元素指针

printf(“%p %p”, &(a[0]), a); //输出结果:0x1100, 0x1100
- 注意: 数组名 a 不代表整个数组,只代表数组首元素的地址。
- “p=a;”的作用是“把 a 数组的首元素的地址赋给指针变量 p”,而不是“把数组 a 各元素的值赋给 p”