文章目录 [TOC]
(1) drbd 高可用解决方案
0x00 Drbd高可用 (1) drbd 介绍 官方网站:Q:什么是Drbd? 答:分布式复制块设备(Drbd,Dirtributed Replicated Block Device)是基于软件的,无共享,复制的存储解决方案以及在块设备在不同高可用服务器对之间同步和镜像数据软件,解决磁盘单点故障(般情况下只支持2个节点),通过它可用实现在网络中两台服务器之间进行块设备级别的实时或异步镜像或者同步复制,类似rsync+inotify架构项目软件:
他们之间的对比:
inotify -> rsync:在文件系统之上的实际物理文件同步(磁盘IO效率低下);
drbd:基于文件系统底层,block层级同步(效率更高),一个用软件实现的、无共享的、服务器之间镜像块设备内容的存储复制解决方案
DRBD需构建在底层设备之上,然后构建出块设备。对用户来说DRBD设备就像是物理磁盘,可在其内创建文件系统; Drbd支持的底层设备块设备分类:
磁盘分区,整块磁盘
LVM 逻辑卷
soft raid设备
EVMS(Enterprise Volume Management System,企业卷管理系统)的卷。
数据镜像:实时、透明、同步(所有服务器都成功后返回)、异步(本地服务器成功后返回)。
1.Drbd工作原理 drbd软件工作在文件系统层级以下,比文件系统更加靠近操作系统内核及IO栈,所以drbd是工作在系统内核之中的;但它不能神奇地添加上层的功能比如检测到EXT3文件系统的崩溃; 原理:基于DRBD的高可用(HA)两台服务器主机中,当我们将数据写入(主)磁盘中时候数据还将被发送到网络上的另外一台主机中(备);以相同的形式记录在磁盘之中,使得本地(Master)与远程主机(slave)的数据实时同步;drbd服务作用类似于磁盘阵列里的RAID1功能,就相当于把网络中两台服务器做成了类似于磁盘阵列里的RAID1一样;
在高可用方案(HA)使用DRBD功能代替了共享盘阵(保存两份-冗余是50%),当Master出现故障时候,远程主机还会保留有一份和主节点相同的数据备份可以继续切换使用(直接接管提供服务,降低岩机修复时间),而不会发与故障前数据不一致的问题;
工作原理图:
weiyigeek.top-drbd工作原理图
一般情况下文件写入磁盘的步骤是: 写操作 –> 文件系统 –> 内存缓存中 –> 磁盘调度器 –> 磁盘驱动器 –> 写入磁盘 ; 而DRBD的工作机制如上图所示数据经过buffer cache后有内核中的DRBD模块(复制写入磁盘的数据)通过tcp/ip协议栈经过网卡和对方服务器DRBD服务建立数据同步。
2.Drbd工作模式与协议 当某一进程对某一文件执行了写操作时,写操作在上图执行到那个过程时就认为文件已经同步完成。
Drbd的三种同步复制协议: 协议的选择将影响流量,从而影响网络延时;
协议A:异步 asynchronous 复制协议(本地写入成功后立即返回,data放在发送的buffer中,可能会丢失) 如上图文件写操作执行到A点是就认为写入磁盘成功(性能好/但是数据可靠性差)
协议B:内存同步(半同步 Semi sync )复制协议(本地写入成功并将数据发送到对方后立即返回,如果双机掉电数据丢失) 如上图文件写操作执行到B点是就认为写入磁盘成功。性能好,数据可靠性介于A和C之间。
协议C:同步复制协议(sync),本地和对端服务器磁盘都写入成功确认后返回成功(如果单机电和单机磁盘损坏则数据不会丢失),drbd默认使用的复制协议; 如上图文件写操作执行到C点是就认为写入磁盘成功。性能差,数据可靠性高。
Drbd支持的两种模式:
实时同步模式 当数据写入到本地磁盘和远端所有服务器磁盘都成功后才会返回成功写入;防止本地与远端的数据丢失不一致,生产环境中常用(DRBD服务协议C级别即该种同步模式)
异步同步模式 当数据写入到本地服务器成功后就返回成功写入,不管远端服务死否写入成功;还可能是数据写入到本地服务器或远端的Buffer成功后返回;(DRBD服务协议a/b级别)
提示:nfs网络系统文件也有类似的参数(sync/async)与功能;实时同步与异步同步;
DRBD的工作模式:
主从模型 master/slave(primary/secondary) | 单主模式 在某一时刻只允许有一个主节点,主节点的作用是可以挂在使用与写入数据等;从节点知识作为主节点的镜像是主节点的备份。
优点:有效的避免磁盘出现单点故障,文件系统不会错乱
缺点: 主节点读取/使用,而备节点只做备份使用(不能同上进行读取/写入)导致资源的浪费
weiyigeek.top-主备模式
双主模型 dula primary(primary/primary)[DRBD8.0之后的新特性] 所谓双主模型是2个节点都可以当做主节点来挂载使用;需要采用共享的cluster文件系统,如GFS和OCFS2用于需要从2个节点并发访问数据的场合,需要特别配置;
weiyigeek.top-主主模式
那么思考当第一个主节点对某一文件正在执行写操作,此时另一个节点也正在对同一文件也要执行写操作,结果会如何呢? 答:一般这种情况会造成文件系统的错乱,导致数据不能正常使用。 原因是:对文件的加速机制是由操作系统内核所管理的,一个节点对文件加速之后,另一个节点并不知道对方的锁信息。 解决办法是:使用集群文件系统,集群文件系统使用分布式文件锁管理器,当一个节点对文件加锁之后会通过某种机制来通知其他节点锁信息,从而实现文件锁共享。
补充知识点: Oracle的dg服务模式分为两种
一种是逻辑上如SQL语句执行方法,8i~10g 备节点不提供服务
另一种就是物理的如block块级模式,Oracle 11g 支持主库写从库读的方式
(2) drbd 应用场景 生产环境中Drbd常用于高可用服务器之间的数据同步解决方案; 如Heartbeat + drbd + nfs/mfs/gfs ; heartbeat + drbd + mysql/Oracle等等,实际上可以结合任意需要数据同步的所有服务的应用场景;
相关数据同步工具介绍: (1) rsync [实时同步工具,但效率不高] (2) scp [实时同步工具,但效率不高] (3) nc / nfs (网络文件系统) (4) union 双机同步 (5) csync2 多机同步 (6) 软自身同步机制 (mysql,oracle,mongdb,ttserver,redis
) 文件放到数据库,同步到从库再把文件拿出来; (7) drbd 高可用
(3) drbd的安装 Drbd软件分类:
Centos5.x 适合drbd 8.3 YUM
Centos6.x 适合drbd 8.4
Centos7.x 适合源码编译安装
配置目标:两台服务器分别配置号drbd服务,实现Master-data1机器上/dev/sdb/分区上写入数据,数据会实时同步到Master-data2j机器上;一旦服务器出现异常,瞬间接替损坏数据或宕机的机器,实现数据异机实时同步,达到数据高可用无业务影响的目的;
配置提示:
配置的是drbd主备模式,及应用时只在主的一端写入数据,备的一端仅处于数据热备状态;
备节点drbd的分区是不可见的,也是处于非活动状态,不能人为写入数据;
多drbd分区主主双向同步模式,在实际生产环境中配置成为主主模式即如上面图所示:
drbd 服务网卡以及资源配置:
文章目录 [TOC]
(1) drbd 高可用解决方案
0x00 Drbd高可用 (1) drbd 介绍 官方网站:Q:什么是Drbd? 答:分布式复制块设备(Drbd,Dirtributed Replicated Block Device)是基于软件的,无共享,复制的存储解决方案以及在块设备在不同高可用服务器对之间同步和镜像数据软件,解决磁盘单点故障(般情况下只支持2个节点),通过它可用实现在网络中两台服务器之间进行块设备级别的实时或异步镜像或者同步复制,类似rsync+inotify架构项目软件:
他们之间的对比:
inotify -> rsync:在文件系统之上的实际物理文件同步(磁盘IO效率低下);
drbd:基于文件系统底层,block层级同步(效率更高),一个用软件实现的、无共享的、服务器之间镜像块设备内容的存储复制解决方案
DRBD需构建在底层设备之上,然后构建出块设备。对用户来说DRBD设备就像是物理磁盘,可在其内创建文件系统; Drbd支持的底层设备块设备分类:
磁盘分区,整块磁盘
LVM 逻辑卷
soft raid设备
EVMS(Enterprise Volume Management System,企业卷管理系统)的卷。
数据镜像:实时、透明、同步(所有服务器都成功后返回)、异步(本地服务器成功后返回)。
1.Drbd工作原理 drbd软件工作在文件系统层级以下,比文件系统更加靠近操作系统内核及IO栈,所以drbd是工作在系统内核之中的;但它不能神奇地添加上层的功能比如检测到EXT3文件系统的崩溃; 原理:基于DRBD的高可用(HA)两台服务器主机中,当我们将数据写入(主)磁盘中时候数据还将被发送到网络上的另外一台主机中(备);以相同的形式记录在磁盘之中,使得本地(Master)与远程主机(slave)的数据实时同步;drbd服务作用类似于磁盘阵列里的RAID1功能,就相当于把网络中两台服务器做成了类似于磁盘阵列里的RAID1一样;
在高可用方案(HA)使用DRBD功能代替了共享盘阵(保存两份-冗余是50%),当Master出现故障时候,远程主机还会保留有一份和主节点相同的数据备份可以继续切换使用(直接接管提供服务,降低岩机修复时间),而不会发与故障前数据不一致的问题;
工作原理图:
weiyigeek.top-drbd工作原理图
一般情况下文件写入磁盘的步骤是: 写操作 –> 文件系统 –> 内存缓存中 –> 磁盘调度器 –> 磁盘驱动器 –> 写入磁盘 ; 而DRBD的工作机制如上图所示数据经过buffer cache后有内核中的DRBD模块(复制写入磁盘的数据)通过tcp/ip协议栈经过网卡和对方服务器DRBD服务建立数据同步。
2.Drbd工作模式与协议 当某一进程对某一文件执行了写操作时,写操作在上图执行到那个过程时就认为文件已经同步完成。
Drbd的三种同步复制协议: 协议的选择将影响流量,从而影响网络延时;
协议A:异步 asynchronous 复制协议(本地写入成功后立即返回,data放在发送的buffer中,可能会丢失) 如上图文件写操作执行到A点是就认为写入磁盘成功(性能好/但是数据可靠性差)
协议B:内存同步(半同步 Semi sync )复制协议(本地写入成功并将数据发送到对方后立即返回,如果双机掉电数据丢失) 如上图文件写操作执行到B点是就认为写入磁盘成功。性能好,数据可靠性介于A和C之间。
协议C:同步复制协议(sync),本地和对端服务器磁盘都写入成功确认后返回成功(如果单机电和单机磁盘损坏则数据不会丢失),drbd默认使用的复制协议; 如上图文件写操作执行到C点是就认为写入磁盘成功。性能差,数据可靠性高。
Drbd支持的两种模式:
实时同步模式 当数据写入到本地磁盘和远端所有服务器磁盘都成功后才会返回成功写入;防止本地与远端的数据丢失不一致,生产环境中常用(DRBD服务协议C级别即该种同步模式)
异步同步模式 当数据写入到本地服务器成功后就返回成功写入,不管远端服务死否写入成功;还可能是数据写入到本地服务器或远端的Buffer成功后返回;(DRBD服务协议a/b级别)
提示:nfs网络系统文件也有类似的参数(sync/async)与功能;实时同步与异步同步;
DRBD的工作模式:
主从模型 master/slave(primary/secondary) | 单主模式 在某一时刻只允许有一个主节点,主节点的作用是可以挂在使用与写入数据等;从节点知识作为主节点的镜像是主节点的备份。
优点:有效的避免磁盘出现单点故障,文件系统不会错乱
缺点: 主节点读取/使用,而备节点只做备份使用(不能同上进行读取/写入)导致资源的浪费
weiyigeek.top-主备模式
双主模型 dula primary(primary/primary)[DRBD8.0之后的新特性] 所谓双主模型是2个节点都可以当做主节点来挂载使用;需要采用共享的cluster文件系统,如GFS和OCFS2用于需要从2个节点并发访问数据的场合,需要特别配置;
weiyigeek.top-主主模式
那么思考当第一个主节点对某一文件正在执行写操作,此时另一个节点也正在对同一文件也要执行写操作,结果会如何呢? 答:一般这种情况会造成文件系统的错乱,导致数据不能正常使用。 原因是:对文件的加速机制是由操作系统内核所管理的,一个节点对文件加速之后,另一个节点并不知道对方的锁信息。 解决办法是:使用集群文件系统,集群文件系统使用分布式文件锁管理器,当一个节点对文件加锁之后会通过某种机制来通知其他节点锁信息,从而实现文件锁共享。
补充知识点: Oracle的dg服务模式分为两种
一种是逻辑上如SQL语句执行方法,8i~10g 备节点不提供服务
另一种就是物理的如block块级模式,Oracle 11g 支持主库写从库读的方式
(2) drbd 应用场景 生产环境中Drbd常用于高可用服务器之间的数据同步解决方案; 如Heartbeat + drbd + nfs/mfs/gfs ; heartbeat + drbd + mysql/Oracle等等,实际上可以结合任意需要数据同步的所有服务的应用场景;
相关数据同步工具介绍: (1) rsync [实时同步工具,但效率不高] (2) scp [实时同步工具,但效率不高] (3) nc / nfs (网络文件系统) (4) union 双机同步 (5) csync2 多机同步 (6) 软自身同步机制 (mysql,oracle,mongdb,ttserver,redis
) 文件放到数据库,同步到从库再把文件拿出来; (7) drbd 高可用
(3) drbd的安装 Drbd软件分类:
Centos5.x 适合drbd 8.3 YUM
Centos6.x 适合drbd 8.4
Centos7.x 适合源码编译安装
配置目标:两台服务器分别配置号drbd服务,实现Master-data1机器上/dev/sdb/分区上写入数据,数据会实时同步到Master-data2j机器上;一旦服务器出现异常,瞬间接替损坏数据或宕机的机器,实现数据异机实时同步,达到数据高可用无业务影响的目的;
配置提示:
配置的是drbd主备模式,及应用时只在主的一端写入数据,备的一端仅处于数据热备状态;
备节点drbd的分区是不可见的,也是处于非活动状态,不能人为写入数据;
多drbd分区主主双向同步模式,在实际生产环境中配置成为主主模式即如上面图所示:
drbd 服务网卡以及资源配置:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 管理IP : ETH1:192.168.1.100/24 DRBD管理名称与挂载目录: data /data DRBD逻辑设备: /dev/drbd0 心跳连接以及数据同步: ETH2:192.168.2.100/24 DRBD 存储设备: /dev/sdb1 DRBD Meta设备: /dev/sdb2[0] 虚拟IP(VIP) : ETH1:192.168.1.10 管理IP : ETH1:192.168.1.101/24 DRBD管理名称与挂载目录: data /data DRBD逻辑设备: /dev/drbd0 心跳连接以及数据同步: ETH2:192.168.2.101/24 DRBD 存储设备: /dev/sdb1 DRBD Meta设备: /dev/sdb2[0] 虚拟IP(VIP) : ETH1:192.168.1.11 192.168.2.100 Master-data1 192.168.2.101 Master-data2
安装环境:CentOS release 6.10 (Final) - 基础环境操作参看高可用服务解决方案(DBA)
DRBD 配置步骤:1 2 3 4 5 6 7 8 9 1. 安装drbd以及磁盘分区,加载modproed内核 2. 配置资源文件(定义资料名称,磁盘,节点信息,同步限制等) 3. 将drbd加入到系统服务chkconfig --add drbd 4. 初始化资源组 drbdadm create-md resource_name 5. 启动服务 service drbd start 6. 设置primary主机并同步数据 7. 分区、格式化/dev/drbd* 8. 一个节点进行挂载 9. 查看状态cat /proc/drbd
DRBD 安装流程:(跳过上面配置IP与hosts文件,添加主机路由)1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 service iptables stop //关闭iptables setenforcing 0 //暂时关闭selinux sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/sysconfig/selinux //永久关闭selinux ntpdate -u asia.pool.ntp.org [root@Master-data1/2 drbd]$ rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org [root@Master-data1/2 drbd]$ yum install https://www.elrepo.org/elrepo-release-6-8.el6.elrepo.noarch.rpm $ yum makecache $ yum install kernel-devel kernel-header flex drbd84-utils kmod-drbd84 parted -y Installed: drbd84-utils.i686 0:9.5.0-1.el6.elrepo flex.i686 0:2.5.35-9.el6 kernel-devel.i686 0:2.6.32-754.12.1.el6 kmod-drbd84.i686 0:8.4.11-1.el6_10.elrepo Complete! [root@Master-data1/2 ]$ modprobe drbd && lsmod | grep drbd drbd 485533 0 libcrc32c 841 1 drbd echo "modprobe drbd" >> /etc/rc.d/rc.local echo "modprode drbd > /dev/null 2>&1" > /etc/sysconfig/modules/drbd.modules主节点:512MB 备节点:1024MB [root@Master-data1/data2 ~]$ fdisk -l Disk /dev/sda: 536 MB, 536870912 bytes Disk /dev/sda: 1073 MB, 1073741824 bytes /dev/sdb1 /data 存储数据目录 256MB / 768MB (数) /dev/sdb2 mete data分区 存储drbd同步信息 总大小减去上面的大小 1.这里的meta data 分区一定不能个数建立文件系统 2.分浩的分区现在不能进行挂载(mount) 3.生产环境中DRBD meta data 分区一般设置为1~2G [root@Master-data1 ~] Command (m for help ): p Disk /dev/sda: 536 MB, 536870912 bytes Device Boot Start End Blocks Id System Command (m for help ): n Command action e extended p primary partition (1-4) p Partition number (1-4): 1 First cylinder (1-512, default 1): 1 Last cylinder, +cylinders or +size{K,M,G} (1-512, default 512): +256M Command (m for help ): n Command action e extended p primary partition (1-4) p Partition number (1-4): 2 First cylinder (386-512, default 386): Last cylinder, +cylinders or +size{K,M,G} (386-512, default 512): Command (m for help ): p Device Boot Start End Blocks Id System /dev/sdb1 1 385 394224 83 Linux /dev/sdb2 386 512 130048 83 Linux w [root@Master-data2 ~]$ fdisk /dev/sda Device Boot Start End Blocks Id System /dev/sdb1 1 99 795186 83 Linux /dev/sdb2 100 130 249007+ 83 Linux $ partprobe [root@Master-data1/2 ~]$ mkfs.ext4 /dev/sda1
weiyigeek.top-建立一个磁盘分区
补充:drbd磁盘采用parted分区[master/slave都执行] 1 2 3 4 5 6 7 8 9 10 11 12 [root@data2 ~]$ fdisk -l [root@data2 ~]$ parted /dev/sdb mkpart primary 0 600 [root@data2 ~]$ parted /dev/sdb mkpart primary 600 1073 [root@data2 ~]$ parted /dev/sdb p Number Start End Size File system Name Flags 1 17.4kB 600MB 600MB primary 2 600MB 1073MB 473MB primary partprobe
(4) drbd的配置文件 修改配置文件流程:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 global { usage-count no; } common { protocol C; startup { degr-wfc-timeout 240; } disk { on-io-error detach; } net { cram-hmac-alg md5; shared-secret "testdrbd" ; } syncer { rate 100M; verify-alg crc32c; } } resource data{ disk { on-io-error detach; } on Mzabbix { device /dev/drbd0; disk /dev/sdb1; address 192.168.56.103:7788; meta-disk /dev/sdb2[0]; } on data2 { device /dev/drbd0; disk /dev/sdb1; address 192.168.56.102:7788; meta-disk /dev/sdb2[0]; } }
然后将上面的配置复制到 Master-data2 上的 /etc/drbd.conf 中即可;
(5) drbd的启动运行 Drbd高可用运行案例:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 dd if =/dev/zero of=/dev/sdb{1..2} bs=1M count=100;sync $ drbdadm create-md data New drbd meta data block successfully created. drbd /etc/init.d/drbd start $ drbdadm up data $ drbdadm status data role:Secondary disk:Inconsistent peer connection:Connecting $ cat /proc/drbd version: 8.4.11-1 (api:1/proto:86-101) GIT-hash: 66145a308421e9c124ec391a7848ac20203bb03c build by mockbuild@Build64R6, 2018-09-28 19:36:27
weiyigeek.top-drbd状态
同步drbd数据到对端Server使数据保持一致,指定一个要同步的资源同步数据到对端: (1) 如果为空磁盘可以随意执行操作不需要考虑数据 (2) 如果两边数据不一样(注意同步数据的方向否则可能会丢失数据)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 $ drbdsetup /dev/drbd0 primary --force $ drbdadm primary data [root@Master-data1/2 ~]$ cat /proc/drbd version: 8.4.11-1 (api:1/proto:86-101) 0: (连接状态)cs:Connected (角色)ro:Secondary/Primary ds(数据状态):UpToDate/UpToDate(同步状态) C r----- ns(网络发送):0 nr(网络接收):292952 dw(磁盘写):292952 dr(磁盘读):0 al(活动日志):16 bm():0 lo():0 pe():0 ua:0 ap:0 ep:1 wo:f oos:0 [root@Master-data1 ~]$ drbdadm status data role:Primary disk:UpToDate peer role:Secondary replication:Established peer-disk:UpToDate [root@Master-data1 ~]$ mkfs -t ext4 -b 4096 /dev/drbd0 [root@Master-data1 ~]$ mkdir /drbddata [root@Master-data1 ~]$ mount /dev/drbd0 /drbddata/ [root@Master-data1 ~]$ df -h Filesystem Size Used Avail Use% Mounted on /dev/drbd0 256M 792K 709M 1% /drbddata [root@Master-data1 ]$ touch `seq 0 10` [root@Master-data2 ~]$ drbdadm down data [root@Master-data2 ~]$ mount /dev/sdb1 /mnt/ [root@Master-data2 ~]$ ls /mnt/ 0 1 10 11 12 13 14 15 16 17 18 19 2 20 3 4 5 6 7 8 9 lost+found [root@Master-data2 ~]$ umount /mnt/ [root@Master-data2 ~]$ drbdadm up data [root@Master-data2 ~]$ df -h /dev/sdb1 256M 792K 709M 1% /mnt
补充:CentOS7实例: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 [root@data1 ~]$parted /dev/sdb mkpart primary 0 300 Warning: The resulting partition is not properly aligned for best performance. Ignore/Cancel? ignore Information: You may need to update /etc/fstab. [root@data1 ~]$parted /dev/sdb mkpart primary 300 536 Warning: The resulting partition is not properly aligned for best performance. Ignore/Cancel? ignore Information: You may need to update /etc/fstab. [root@data1 ~]$parted /dev/sdb p Model: ATA VBOX HARDDISK (scsi) Disk /dev/sdb: 537MB Sector size (logical/physical): 512B/512B Partition Table: gpt Disk Flags: Number Start End Size File system Name Flags 1 17.4kB 300MB 300MB primary 2 300MB 536MB 236MB primary drbdadm -- --overwrite-data-of-peer primary data $ cat /proc/drbd 0: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r----- [root@data1/2 ~]$ mkdir /data -p mkfs.ext4 /dev/drbd0 && mount /dev/drbd0/data [root@data2 ~]$ drbdadm down data [root@data2 ~]$ mount /dev/sdb1 /mnt [root@data2 ~]$ ls [root@data2 ~]$ umount /mnt [root@data2 ~]$ drbdadm up data [root@Master-data1 ~]umount /mnt [root@Master-data1 ~]drbdadm secondary data [root@Master-data2 ~]drbdadm primary data [root@Master-data2 ~]mount /dev/drbd0 /mnt
(7) 附录补充 DRBD配置工具:
drbdadm: 高级管理工具,管理/etc/drbd.conf,向drbdsetup和drbdmeta发送指令
drbdsetup: 配置装载进kernel的DRBD模块,平时很少用
drbdmeta: 管理META数据结构,平时很少用
6.1 drbd命令解析 (1)drbdadm 命令: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 $ drbdadm up all drbdadm attach all drbdadm syncer all drbdadm connnect all $ drbdadm down all $ drbdadm disconnect data $ drbdadm status $ drbdadm role 资源名 $ drbdadm -- --overwrite-data-of-peer primary data $ drbdadm primary data $ drbdadm secondary data $ drbdadm -- --discard-my-data connect data $ drbd-overview
drbdsetup 命令: 1 drbdsetup /dev/drbd0 primary --force
6.2 drbd状态的意义 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 输出文件上面最开始是drbd的版本信息,然后就是数据同步的一些状态信息: cs — connection state st — node state (local /remote) ld — local data consistency ds — data consistency ns — network send nr — network receive dw — disk wr ite dr — disk read pe — pending (waiting for ack) ua — unack’d (still need to send ack) al — access log write count StandAlone 独立的:网络配置不可用;资源还没有被连接或是被管理断开(使用 drbdadm disconnect 命令),或是由于出现认证失败或是脑裂的情况 Disconnecting 断开:断开只是临时状态,下一个状态是StandAlone独立的 Unconnected 悬空:是尝试连接前的临时状态,可能下一个状态为WFconnection和WFReportParams Timeout 超时:与对等节点连接超时,也是临时状态,下一个状态为Unconected悬空 BrokerPipe:与对等节点连接丢失,也是临时状态,下一个状态为Unconected悬空 NetworkFailure:与对等节点推动连接后的临时状态,下一个状态为Unconected悬空 ProtocolError:与对等节点推动连接后的临时状态,下一个状态为Unconected悬空 TearDown 拆解:临时状态,对等节点关闭,下一个状态为Unconected悬空 WFConnection:等待和对等节点建立网络连接 WFReportParams:已经建立TCP连接,本节点等待从对等节点传来的第一个网络包 Connected 连接:DRBD已经建立连接,数据镜像现在可用,节点处于正常状态 StartingSyncS:完全同步,有管理员发起的刚刚开始同步,未来可能的状态为SyncSource或PausedSyncS StartingSyncT:完全同步,有管理员发起的刚刚开始同步,下一状态为WFSyncUUID WFBitMapS:部分同步刚刚开始,下一步可能的状态为SyncSource或PausedSyncS WFBitMapT:部分同步刚刚开始,下一步可能的状态为WFSyncUUID WFSyncUUID:同步即将开始,下一步可能的状态为SyncTarget或PausedSyncT SyncSource:以本节点为同步源的同步正在进行 SyncTarget:以本节点为同步目标的同步正在进行 PausedSyncS:以本地节点是一个持续同步的源,但是目前同步已经暂停,可能是因为另外一个同步正在进行或是使用命令(drbdadm pause-sync)暂停了同步 PausedSyncT:以本地节点为持续同步的目标,但是目前同步已经暂停,这可以是因为另外一个同步正在进行或是使用命令(drbdadm pause-sync)暂停了同步 VerifyS:以本地节点为验证源的线上设备验证正在执行 VerifyT:以本地节点为验证目标的线上设备验证正在执行
6.3 drbd配置文件 DRBD配置文件:DRBD的主配置文件为/etc/drbd.conf 为了管理的便捷性通常会将些配置文件分多个部分,但都保存至/etc/drbd.d目录。主配置文件中仅使用”include”指令将这些配置文件片断整合。 通常/etc/drbd.d中的文件为global_common.conf和所有以.res结尾的文件。其中:
global_common.conf中主要定义global段和common段
每个.res文件用于定义一个资源
一个DRBD设备(即/dev/drbdX),叫做一个”资源”。里面包含DRBD设备的主备节点的ip信息,底层存储设备名称及设备大小,meta信息存放方式,drbd对外提供的设备名等: DRBD资源:
Resource name: 除空白字符的任意的ACSII码字符
DRBD device: 在双方节点上,此DRBD设备的设备文件;一般为/dev/drbdN,其主设备号147
Disk configuration: 在双方节点上各自提供的存储设备
Nerwork configuration: 双方数据同步时所使用的网络属性
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 $vim /etc/drbd.d/global_common.conf 目前global段中可以定义的参数仅有minor-count, dialog-refresh, disable -ip-verification和usage-count。 global { usage-count no; } common { protocol C; handlers { pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f" ; pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f" ; local -io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f" ; } startup { wfc-timeout 60; degr-wfc-timeout 60; outdated-wfc-timeout 06; } disk { on-io-error detach; } net { cram-hmac-alg sha1; shared-secret "testdrbd" ; max-buffers 2048; max-epoch-size 2048; } syncer { rate 30M; verify-alg crc32c; } } resource data{ meta-disk internal; on data1 { device /dev/drbd0; disk /dev/sdb1; address 192.168.2.100:7788; meta-disk /dev/sdb2[0]; } on data2 { device /dev/drbd0; disk /dev/sdb1; address 192.168.2.101:7788; meta-disk /dev/sdb2[0]; } } cat /etc/drbd.d/nfsdrbd.res resource nfsdrbd { on pz142 { device /dev/drbd0; disk /dev/vg1/lv1; address 192.168.1.142:7789; meta-disk internal; } on pz144 { device /dev/drbd0; disk /dev/vg1/lv1; address 192.168.1.144:7789; meta-disk internal; } }
6.4 drbd入坑计 Q:问题 drbdadm create-md data失败? 问题:/etc/drbd.conf:6: Parse error: ‘a syncer option keyword’ expected,but got ‘rate’ 解决方法:yum install gcc gcc-c++ make glibc flex kernel kernel-devel kernel-headers
Q:问题 drbdadm up all 失败? 问题:1 2 3 0: Failure: (119) No valid meta-data signature found. ==> Use 'drbdadm create-md res' to initialize meta-data area. <== Command 'drbdsetup-84 attach 0 /dev/sdb1 /dev/sdb2 0 --on-io-error=detach --resync-rate=30M' terminated with exit code 10
解决办法:查看分区是否错误,分区后重启系统再启动; dd if=/dev/zero bs=1M count=1 of=/dev/sdb{1..2};sync dd if=/dev/zero bs=1M count=1 of=/dev/sda{1..2};sync
Q:同步状态出现异常? 问题:1 2 0: cs:WFConnection ro:Secondary(本端角色)/Unknown ds:Inconsistent/DUnknown(问题点) C r----s ns:0 nr:0 dw:0 dr:0 al:8 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:795188
解决办法:
检测两台drbd服务器物理网络链接或者IP及主机路由是否正确
停止iptables防火墙或者放行drbd(指定IP形式)
Secondary/Unkonwn 可能是发生裂脑导致的结果1 2 3 4 5 6 #在从节点执行: modprobe drbd drbdadm secondary data drbdadm up data drbdadm disconnect data drbdadm -- --discard-my-data connect data
Q:如何解决drbd裂脑问题? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 [root@ pz142 ~] [root@ pz142 ~] [root@ pz142 ~] [root@ pz144 ~] [root@ pz144 ~] [root@ pz144 ~] [root@ pz144 ~] drbdadm -- --overwrite-data-of-peer primary drbd
Q:drbd主节点无法进行挂载mount 1 2 3 4 5 6 7 [root@data1 log ] mount: /dev/drbd0 is write-protected, mounting read -only mount: unknown filesystem type '(null)' mkfs -t ext4 -b 4096 /dev/drbd0