ops/service: basic LVM

ustclug · Feb 11, 2024 · b7ae43b · b7ae43b
1 parent f3bf38e
commit b7ae43b
Showing 1 changed file with 97 additions and 0 deletions.
diff --git a/docs/ops/storage/lvm-raid.md b/docs/ops/storage/lvm-raid.md
@@ -4,3 +4,100 @@
 
 本文将介绍 LVM，以及常见的 RAID 方案的使用与维护。
 
+## LVM
+
+LVM（Logical Volume Manager）是 Linux 下的逻辑卷管理器，相比于直接在创建分区表后使用分区，LVM 提供了更加灵活的存储管理方式：
+
+- LVM 可以管理多个硬盘（物理卷）上的存储空间
+- LVM 中的逻辑卷可以跨越多个物理卷，文件系统不需要关心物理卷的位置
+- LVM 的逻辑卷可以动态调整大小，而不需要移动分区的位置——移动分区的起始位置是一个危险且耗时的操作
+
+一些 Linux 发行版的安装程序默认使用 LVM 来管理磁盘，例如 Fedora、CentOS 等。
+
+### 基础概念
+
+LVM 中有三个基本概念：
+
+- 物理卷（Physical Volume，PV）：通常是一块硬盘（分区）
+- 卷组（Volume Group，VG）：由一个或多个物理卷组成
+- 逻辑卷（Logical Volume，LV）：在卷组里分配的逻辑存储空间。称之为「逻辑」，是因为它可以跨越多个物理卷，也不一定是连续的
+
+这里我们创建三个 1GB 的文件作为物理卷，并且加入到一个卷组中：
+
+!!! warning "避免在物理磁盘上创建无分区表的文件系统/物理卷"
+
+    在实践中，尽管没有什么阻止这么做，但是不创建分区表、直接将整个磁盘格式化为某个文件系统，或者加入 LVM 中是不建议的。
+    这会给其他人带来困惑，并且如果未来有在对应磁盘上启动系统等需要多分区的需求，会带来很多麻烦（可能只能备份数据后从头再来）。
+
+    直接对物理磁盘设备格式化为文件系统也是操作时常见的输入错误：
+
+    ```console
+    $ mkfs.ext4 /dev/sdz  # 错误 ❌
+    $ mkfs.ext4 /dev/sdz1 # 正确 ✅
+    ```
+
+    在下面的例子中，为了简化操作，我们假设 pv[1-3].img 相当于每块硬盘上使用全部空间的分区。
+
+```console
+$ truncate -s 1G pv1.img pv2.img pv3.img
+$ sudo losetup -f --show pv1.img
+/dev/loop0
+$ sudo losetup -f --show pv2.img
+/dev/loop1
+$ sudo losetup -f --show pv3.img
+/dev/loop2
+$ sudo pvcreate /dev/loop0 /dev/loop1 /dev/loop2  # 创建物理卷
+  Physical volume "/dev/loop0" successfully created.
+  Physical volume "/dev/loop1" successfully created.
+  Physical volume "/dev/loop2" successfully created.
+$ sudo vgcreate vg201-test /dev/loop0 /dev/loop1 /dev/loop2  # 创建卷组
+  Volume group "vg201-test" successfully created
+$ sudo pvs  # 查看物理卷信息
+  PV         VG         Fmt  Attr PSize    PFree   
+  /dev/loop0 vg201-test lvm2 a--  1020.00m 1020.00m
+  /dev/loop1 vg201-test lvm2 a--  1020.00m 1020.00m
+  /dev/loop2 vg201-test lvm2 a--  1020.00m 1020.00m
+$ sudo vgs  # 查看卷组信息
+  VG         #PV #LV #SN Attr   VSize  VFree 
+  vg201-test   3   0   0 wz--n- <2.99g <2.99g
+$ sudo lvcreate -L 2.5G vg201-test  # 创建一个 2.5G 的逻辑卷
+  Logical volume "lvol0" created.
+$ sudo lvs  # 查看逻辑卷信息
+  LV    VG         Attr       LSize Pool Origin Data%  Meta%  Move Log Cpy%Sync Convert
+  lvol0 vg201-test -wi-a----- 2.50g
+$ ls -lh /dev/mapper/
+total 0
+crw------- 1 root root 10, 236 Feb 11 13:30 control
+lrwxrwxrwx 1 root root       7 Feb 12 00:09 vg201--test-lvol0 -> ../dm-0
+$ # /dev/mapper/vg201--test-lvol0 就是我们创建的逻辑卷（块设备），可以在上面创建文件系统。
+```
+
+!!! note "等等，怎么每块盘少了几 MB 空间？"
+
+    其实大概可以猜到，这些空间留给了 LVM 的元数据。LVM 的元数据为**纯文本**格式，可以存储相对复杂的信息，但是也带来了下述两个问题：
+
+    - LVM 的元数据格式没有书面的标准，因此其他软件在解析 LVM 元数据时可能会出现问题。[科大镜像站的机器就遇到过 GRUB 解析 LVM 元数据代码的问题](https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=985974)，导致无法正确配置启动器。
+    这个问题直到现在都没有被 GRUB 修复，因此只能自行编译手动修复后的版本，并且固定 GRUB 版本。
+    - LVM 的纯文本格式导致元数据本身较大，如果预分配的元数据空间不足，并且卷组中有大量逻辑卷（默认值 + 上千个 LV 就会出现问题），那么最后会导致无法再创建/扩容逻辑卷，并且只能通过添加新的物理卷，然后由该卷存储元数据来解决问题。[Vlab 项目曾遇到过这样的问题](https://vlab.ibugone.com/records/2022-06-16/)。
+
+!!! note "这里创建的逻辑卷横跨了三块盘，所以 LVM 默认是 RAID 0？"
+
+    这是不正确的。这里逻辑卷的数据布局与 RAID 0 不同。RAID 0 考虑的是性能，因此数据类似于这么存储：
+
+    | Disk 1 | Disk 2 | Disk 3 |
+    | ------ | ------ | ------ |
+    | 0      | 1      | 2      |
+    | 3      | 4      | 5      |
+    | 6      | 7      | 8      |
+    | ...    | ...    | ...    |
+
+    这样的话，应用程序顺序读写时，就可以利用多块盘的并行读写能力。但是 LVM 类似于这样：
+
+    | Disk 1 | Disk 2 | Disk 3 |
+    | ------ | ------ | ------ |
+    | 0      | 100000 | 200000 |
+    | 1      | 100001 | 200001 |
+    | 2      | 100002 | 200002 |
+    | ...    | ...    | ...    |
+
+    每块盘是顺序填充的。这样做可以更加灵活地管理空间，但是性能不如 RAID 0。