Python--bytearray、bytes、memoryview的区别与联系

tongqing

已于 2025年01月17日 18:14 修改访问次数：15

`bytearray、bytes 和 memoryview 的区别与联系`

这三者都是 Python 中处理字节数据的关键对象，它们之间有很多相似之处，但也存在显著的差异。理解它们的特性以及如何选择适当的对象是非常重要的。下面我们详细介绍这三者的区别和联系。

`1. bytes`

概念：

bytes 是一个不可变的字节序列，表示原始的字节数据。
在 Python 中，bytes 对象通常用于存储二进制数据，如文件内容、网络数据等。

创建：

可以通过 b'' 语法或 bytes() 构造函数来创建。

# 创建一个字节对象
b = b"hello"
print(b)  # 输出: b'hello'

# 使用 bytes 构造函数
b2 = bytes([104, 101, 108, 108, 111])
print(b2)  # 输出: b'hello'

特性：

不可变：bytes 对象一旦创建，就不能修改其中的内容。
支持切片：可以像列表一样使用切片访问 bytes 中的内容，但不能修改。

b = b"hello"
print(b[0])  # 输出: 104 ('h' 的 ASCII 值)

使用场景：

当你需要表示不变的二进制数据（如文件内容、网络传输的数据）时，使用 bytes。
由于它是不可变的，因此它更适用于避免数据被意外修改的情况。

`2. bytearray`

概念：

bytearray 是一个可变的字节序列，类似于 bytes，但是你可以修改其中的内容。
它可以被视为一个“可变版本的 bytes”对象。

创建：

可以通过 bytearray() 构造函数或者 bytearray(b'') 语法创建。

# 创建一个空的 bytearray
b = bytearray()
print(b)  # 输出: bytearray(b'')

# 使用 bytearray() 创建并填充字节
b2 = bytearray(b"hello")
print(b2)  # 输出: bytearray(b'hello')

特性：

可变：bytearray 是可变的，你可以修改其中的内容。

b = bytearray(b"hello")
b[0] = 72  # 修改第一个字节
print(b)  # 输出: bytearray(b'Hello')

支持切片：和 bytes 一样，bytearray 也支持切片和索引，但与 bytes 不同，切片操作返回的也是一个可变的 bytearray。

b = bytearray(b"hello")
b2 = b[0:3]
b2[0] = 74
print(b2)  # 输出: bytearray(b'Jlo')

使用场景：

当你需要在字节序列上进行修改时，使用 bytearray。例如，在处理可变数据（如修改文件内容、构建或修改网络请求体时）时，bytearray 非常有用。
如果你需要高效地修改字节数据而不生成副本，bytearray 是一个合适的选择。

`3. memoryview`

概念：

memoryview 提供了一种高效的方式来访问和操作字节数据，特别是大数据集（如大文件或数组）。它通过“视图”来访问数据，而不需要复制数据。
memoryview 不是存储数据的对象，它只是对某个支持缓冲区协议（如 bytes、bytearray、numpy 数组等）的对象进行视图映射。

创建：

memoryview 可以从 bytes、bytearray 或任何支持缓冲区协议的对象（如 numpy 数组）创建。

# 从 bytearray 创建 memoryview
data = bytearray(b"hello world")
mv = memoryview(data)
print(mv[0])  # 输出: 104 ('h' 的 ASCII 值)

特性：

无数据复制：memoryview 只创建一个对原始数据的引用，而不会创建副本。
支持切片：可以对内存视图进行切片，访问其子集，而不会发生数据复制。

data = bytearray(b"hello world")
mv = memoryview(data)
slice_view = mv[0:5]  # 获取前5个字节
print(slice_view.tobytes())  # 输出: b'hello'

只读/可写：你可以控制 memoryview 是否是只读的。例如，如果原始数据是只读的，memoryview 也会是只读的。

data = bytearray(b"hello")
mv = memoryview(data)
mv[0] = 72  # 'H'
print(data)  # 输出: bytearray(b'Hello')

使用场景：

memoryview 非常适用于需要高效访问和修改大量数据的场景，例如：大文件处理、图像处理、音频处理、与外部系统（如数据库、网络等）交互时。
memoryview 可以避免数据复制，并且通过提供对数据的视图，能够让你更加灵活地处理内存中的数据。

`总结：bytes、bytearray 和 memoryview 的区别与联系`

特性	`bytes`	`bytearray`	`memoryview`
类型	不可变字节序列	可变字节序列	内存视图对象（不存储数据）
创建方式	`b''` 或 `bytes()`	`bytearray()` 或 `bytearray(b'')`	`memoryview()`
可变性	不可变	可变	通过视图引用原始数据，取决于数据本身
支持切片	支持，但切片返回不可变的 `bytes`	支持，切片返回可变的 `bytearray`	支持，切片返回 `memoryview` 对象
内存复制	存储数据，数据不可变	存储数据，数据可变	不复制数据，直接操作原始数据
典型用途	存储不可变的二进制数据	存储和修改可变的二进制数据	高效访问和修改大规模数据（如文件、数组等）

选择哪个对象？

如果你需要不可变的二进制数据，选择 bytes。
如果你需要可变的二进制数据，选择 bytearray。
如果你需要高效地访问和操作大数据（且避免复制数据），选择 memoryview，特别是在处理大文件或和外部系统交互时。

这三者在处理字节数据时有不同的优势，具体使用哪一个取决于你的需求以及性能考虑。

文章标签：

Python--bytearray、bytes、memoryview的区别与联系

bytearray、bytes 和 memoryview 的区别与联系

1. bytes

概念：

创建：

特性：

使用场景：

2. bytearray

概念：

创建：

特性：

使用场景：

3. memoryview

概念：

创建：

特性：

使用场景：

总结：bytes、bytearray 和 memoryview 的区别与联系

选择哪个对象？

评论（0）

`bytearray、bytes 和 memoryview 的区别与联系`

`1. bytes`

`2. bytearray`

`3. memoryview`

`总结：bytes、bytearray 和 memoryview 的区别与联系`