当前位置: 首页 > news >正文

python 字符串解析 struct.unpack_from(fmt, buffer, offset=0) ‘<? B I‘

struct.unpack_from() 是 Python 标准库 struct 模块中的一个函数,用于从字节序列中按照指定的格式解析数据。它与 struct.unpack() 类似,但允许你从字节序列的特定偏移量(offset)开始解析,而不是从头开始。


语法

struct.unpack_from(fmt, buffer, offset=0)
  • fmt:格式化字符串,定义了如何解析数据。
  • buffer:包含数据的字节序列(通常是 bytes 或 bytearray)。
  • offset:从字节序列的哪个位置开始解析,默认为 0。
  • 返回值:解析后的值(通常是一个元组)。

参数解释

(1) 格式化字符串 (fmt)

格式化字符串定义了如何解析字节序列中的数据。常见的格式字符包括:

  • <:小端模式(Little-endian)小端模式意味着多字节数据的低位字节存储在内存的低地址处。
  • >:大端模式(Big-endian)。
  • ?:表示布尔值(True 或 False),占用 1 字节。
  • =:根据系统默认的字节序。
  • B:表示无符号字节(unsigned char),占用 1 字节,范围是 [0, 255]
  • I:表示无符号整数(unsigned int),占用 4 字节,范围是 [0, 4294967295]
  • H:无符号短整数(2 字节)。
  • b:有符号字节(1 字节)。
  • i:有符号整数(4 字节)。
  • f:浮点数(4 字节)。
  • d:双精度浮点数(8 字节)。

更多格式字符可以参考 Python 官方文档。

(2) payload

payload 是你要解析的字节序列,通常是通过网络、文件或其他方式获取的二进制数据。

(3) offset

指定从字节序列的哪个字节开始解析。如果未指定,默认从第 0 个字节开始。


示例代码

假设我们有一个字节序列,并希望按照指定格式解析其中的数据:

示例 1:基本用法
import struct# 假设 payload 是一个字节序列
payload = b'\x01\x00\x00\x00\x0A\xFF\x00\x00'# 解析格式:<? B I
# - < 表示小端模式
# - ? 表示布尔
# - B 表示 1 字节无符号整数
# - I 表示 4 字节无符号整数
result = struct.unpack_from('<? B I', payload, offset=0)print(result)  # 输出: (True, 1, 16777215)

解析过程

  1. <:表示小端模式。
  2. ?:表示布尔
  3. B:解析第一个字节 \x01,结果为 1
  4. I:解析接下来的 4 字节 \x00\x00\x00\x0A,结果为 16777215(小端模式下,0x0A0000FF)。

示例 2:带偏移量的解析
import structpayload = b'\xAA\xBB\xCC\xDD\xEE\xFF\x00\x00'# 从第 2 个字节开始解析
result = struct.unpack_from('<B H', payload, offset=2)print(result)  # 输出: (204, 65279)

解析过程

  1. 从第 2 个字节(\xCC)开始解析。
  2. B:解析 1 字节 \xCC,结果为 204
  3. H:解析接下来的 2 字节 \xDD\xEE,结果为 65279(小端模式下,0xEEDD)。

实际应用场景

场景 1:解析网络协议数据

在网络编程中,接收到的数据通常是二进制格式的字节流。可以使用 struct.unpack_from() 来解析这些数据。

import struct# 假设这是接收到的网络数据包
data_packet = b'\x01\x00\x00\x00\x0A\xFF\x00\x00'# 解析头部信息
header = struct.unpack_from('<B I', data_packet, offset=0)
print("Header:", header)  # 输出: Header: (1, 16777215)# 解析后续数据
body = struct.unpack_from('<H', data_packet, offset=5)
print("Body:", body)  # 输出: Body: (255,)
场景 2:处理二进制文件

在读取二进制文件时,可以使用 struct.unpack_from() 提取文件中的特定字段。

import struct# 假设这是一个二进制文件的内容
binary_data = b'\x00\x01\x02\x03\x04\x05\x06\x07'# 从第 3 个字节开始解析两个无符号短整数
result = struct.unpack_from('<HH', binary_data, offset=2)
print(result)  # 输出: (772, 1029)

注意事项

  1. 字节对齐问题

    • 确保提供的字节序列长度足够长,否则会抛出 struct.error 异常。
    struct.unpack_from('<I', b'\x01\x02')  # struct.error: unpack_from requires a buffer of at least 4 bytes
  2. 字节序问题

    • 明确指定字节序(如 < 或 >),以避免不同平台之间的兼容性问题。
  3. 动态偏移量

    • 如果需要解析多个字段,可以动态调整 offset 的值。

总结

struct.unpack_from() 是一个非常强大的工具,特别适合处理二进制数据流(如网络协议、文件格式等)。通过指定格式化字符串和偏移量,它可以灵活地解析复杂的数据结构。

如果你正在开发涉及二进制数据的应用程序(例如网络通信、嵌入式系统或文件解析),struct.unpack_from() 将是你的得力助手!

相关文章:

  • 从零开始详细讲解 Boost.Asio
  • ZYNQ笔记(十):XADC (PS XDAC 接口)
  • 火箭姿态控制系统
  • HTML 如何改变字体颜色?深入解析与实践指南
  • 【题解-Acwing】790. 数的三次方根
  • HeavyKeeper 算法
  • Python类和对象一(十)
  • STM32 HAL 水位传感器驱动程序
  • MySQL -数据类型
  • leetcode0078. 子集-medium
  • (undone) 吴恩达版提示词工程 2. 指南
  • Sentinel源码—6.熔断降级和数据统计的实现一
  • 【kubernetes】pod资源配额
  • 5G网络切片:精准分配资源,提升网络效率的关键技术
  • 基于 LWE 的格密码python实战
  • (done) 吴恩达版提示词工程 1. 引言 (Base LLM 和 Instruction Tuned LLM)
  • visual studio无法跳转到函数定义、变量定义、跳转函数位置不准问题解决
  • Java链表反转方法详解
  • 注意力机制(np计算示例)单头和多头
  • 信息系统项目管理工程师备考计算类真题讲解五
  • 市场监管部门完成全国保健食品生产企业体系检查首轮全覆盖
  • 商务部:消费者已累计购买以旧换新家电产品超1亿台
  • 十大券商看后市|A股下行波动风险有限,震荡中有望逐步抬升
  • 艺术开卷|近现代中国古代书画东渡日本的历史图景
  • 世遗X时尚,七匹狼这场大秀秀出中国文化独特魅力
  • 市民建议公交广播增加“请勿大声喧哗”提示,上海交通委回复