当前位置：首页 > news >正文

C语言进阶之自定义类型：结构体，枚举，联合

news 来源：原创 2025/4/19 5:16:24

结构体

结构体类型的声明

结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

结构的声明

struct tag{member-list;}variable-list;

例如描述一个学生：

struct Stu{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号
};//分号不能丢

特殊的声明

在声明结构的时候，可以不完全的声明。
比如：

//匿名结构体类型
struct{int a;char b;float c;}x;struct{int a;char b;float c;}a[20], *p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。
那么问题来了？

//在上面代码的基础上，下面的代码合法吗？
p = &x;

警告：编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。

结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？

//代码1struct Node{int data;struct Node next;};//可行否？

如果可以，那sizeof(struct Node)是多少？
每一个Node中又嵌入了一个完整的Node，这就变成了无限递归嵌套，编译器无法确定struct Node的大小

//代码2

 struct Node{int data;struct Node* next;};

注意：

//代码3typedef struct{int data;Node* next;}Node;//这样写代码，可行否？
//解决方案：
typedef struct Node{int data;struct Node* next;}Node;

结构体变量的定义和初始化

struct Point{int x;int y;}p1;                
struct Point p2;    
//声明类型的同时定义变量p1//定义结构体变量p2//初始化：定义变量的同时赋初值。
struct Point p3 = {x, y};struct Stu        
{//类型声明char name[15];//名字int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node{int data;struct Point p;struct Node* next;  
}n1 = {10, {4,5}, NULL};            
//结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

结构体内存对齐

//练习1struct S1{char c1;int i;char c2;};printf("%d\n", sizeof(struct S1));

在这里插入图片描述

 //练习2struct S2{char c1;char c2;int i;};printf("%d\n", sizeof(struct S2));

在这里插入图片描述

 //练习3struct S3{double d;char c;int i;};printf("%d\n", sizeof(struct S3));

在这里插入图片描述

 //练习4-结构体嵌套问题
struct S4{char c1;struct S3 s3;double d;};printf("%d\n", sizeof(struct S4));

在这里插入图片描述

首先得掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
Linux中的默认值为4
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

为什么存在内存对齐?
4. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
5. 性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：
让占用空间小的成员尽量集中在一起。

//例如：
struct S1{char c1;int i;char c2;};struct S2{char c1;char c2;int i;}

修改默认对齐数

之前我们见过了#pragma 这个预处理指令，这里我们再次使用，可以改变我们的默认对齐数。

#include <stdio.h>#pragma pack(8)//设置默认对齐数为8struct S1{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为8struct S2{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数，还原为默认
int main(){//输出的结果是什么？printf("%d\n", sizeof(struct S1));printf("%d\n", sizeof(struct S2));return 0;}

结构体传参

案例：

struct S{int data[1000];int num;};struct S s = {{1,2,3,4}, 1000};//结构体传参
void print1(struct S s){printf("%d\n", s.num);}//结构体地址传参
void print2(struct S* ps){printf("%d\n", ps->num);}int main(){print1(s);  //传结构体print2(&s); //传地址return 0;
}

结构体实现位段（位段的填充&可移植性）

位段的声明和结构是类似的，有两个不同：
1.位段的成员必须是int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
比如：

struct A{int _a:2;int _b:5;int _c:10;int _d:30;};

A就是一个位段类型。
那位段A的大小是多少？

位段的内存分配

位段的成员可以是int unsigned int signed int 或者是char （属于整形家族）类型
位段的空间上是按照需要以4个字节（int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

案例：

//一个例子
struct S{char a:3;char b:4;char c:5;char d:4;};struct S s = {0};s.a = 10;s.b = 12;s.c = 3;s.d = 4;//空间是如何开辟的？

在这里插入图片描述

位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

位段的应用

在这里插入图片描述

枚举

枚举类型的定义

enum Day//星期
{Mon,Tues,Wed,Thur,Fri,Sat,Sun};enum Sex//性别
{MALE,FEMALE,SECRET};
enum Color//颜色
{RED,GREEN,BLUE};

以上定义的enum Day ，enum Sex ，enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常量。
这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。例如：

enum Color//颜色
{RED=1,GREEN=2,BLUE=4};

枚举的优点

为什么使用枚举？
我们可以使用#define 定义常量，为什么非要使用枚举？枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

枚举的使用

enum Color//颜色
{RED=1,GREEN=2,BLUE=4};enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 5;  //ok??

枚举的使用

联合

联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。比如：

//联合类型的声明
union Un{char c;int i;};//联合变量的定义
union Un un;//计算连个变量的大小
printf("%d\n", sizeof(un));

联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。

union Un{int i;char c;};union Un un;// 下面输出的结果是一样的吗？
printf("%d\n", &(un.i));printf("%d\n", &(un.c));//下面输出的结果是什么？
un.i = 0x11223344;un.c = 0x55;printf("%x\n", un.i);

首先，un.i = 0x11223344;：联合体的内存写入了 4 字节。假设 int 是 4 字节，且采用小端字节序（主流 PC 一般是小端，即低字节在低地址）。

这时，内存内容（按地址从低到高）为：44 33 22 11
紧接着，un.c = 0x55;：char 占 1 字节，写入同一地址的最低字节（最低位的 1 字节会变成 0x55）。

所以，内存内容变成（按地址从低到高）：55 33 22 11
printf(“%x\n”, un.i);：读出 un.i 的 4 字节内容，按小端序组装成 int。

联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。
案例：

union Un1{char c[5];int i;};union Un2{short c[7];int i;};//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));printf("%d\n", sizeof(union Un2));

char c[5] 占用 5 字节。int i 通常占用 4 字节（假设是32位系统，int 是 4 字节）。
联合体的大小为最大成员的大小，但要对齐到最大对齐要求的整数倍。假如 int 需要4字节对齐。 5（char c[5]）不足以满足 int
的对齐，编译器会把整个 union 的大小补齐到 8 字节（下一个4的倍数大于等于5的是8）。