HA集群之CoroSync+Pacemaker浅析及实现

时间：2014-05-11 19:42:13 阅读：762 评论：0 收藏：0 [点我收藏+]

一、CoroSync

corosync最初只是用来演示OpenAIS集群框架接口规范的一个应用，可以说corosync是OpenAIS的一部分，然而后面的发展超越了官方最初的设想，越来越多的厂商尝试使用corosync作为集群解决方案。如Redhat的RHCS集群套件就是基于corosync实现。

corosync只提供了message layer(即实现HeartBeat + CCM)，而没有直接提供CRM，一般使用Pacemaker进行资源管理。

OpenAIS是基于SA Forum 标准的集群框架的应用程序接口规范。OpenAIS提供一种集群模式，这个模式包括集群框架，集群成员管理，通信方式，集群监测等，能够为集群软件或工具提供满足AIS标准的集群接口，但是它没有集群资源管理功能，不能独立形成一个集群。

服务可用性论坛（SA Forum）是一个开放性论坛，它开发并发布AIS规范。AIS是应用接口规范，是用来定义应用程序接口（API）的开放性规范的集合，应用程序作为中间件为应用服务提供一种开放、高移植性的程序接口，是在实现高可用应用过程中是亟需的。使用AIS规范的应用程序接口（API），可以减少应用程序的复杂性和缩短应用程序的开发时间，这些规范的主要目的就是为了提高中间组件可移植性和应用程序的高可用性。

二、Pacemaker

Pacemaker是由Linux-HA工程的Heartbeat项目中的CRM组件发展而来。 Heartbeat 3开始，Heartbeat 3 按模块把的原来Heartbeat拆分为多个子项目。CRM组件单独由另一独立项目Pacemaker 负责。单独成一个项目之后，Pacemaker以做一个可扩展性高可用集群资源管理器(A scalable High-Availability cluster resource manager)为目标，并同时支持Corosync和Heartbeat 。

具体组件请看上图。

三、基于corosync实现web高可用基础配置

1.配置主机名

节点名称很关键，集群每个节的名称都得能互相解析。/etc/hosts中的主机名配置结果必须跟”uname -n”的解析的结果一致。

node1/node2都添加：

node1示例：
# vim /etc/hosts
172.16.1.11 node1.hoo.com node1
172.16.1.12 node2.hoo.com node2
# ifconfig eth0 172.16.1.11  up
# hostname node1.hoo.com
# uname -n
# vim /etc/sysconfig/network  //重启才生效，source也不生效
hostname=node1.hoo.com

2.时间同步

node1,node2都配置

# crontab -e
*/5 * * * * /usr/sbin/ntpdate  172.16.0.1 &> /dev/null

3.配置node之间SSH互信

node1:
#ssh-keygen  -t rsa -f ~/.ssh/id_rsa  -P ‘‘
# ssh-copy-id -i .ssh/id_rsa.pub root@node2.hoo.com
node1:
#ssh-keygen  -t rsa -f ~/.ssh/id_rsa  -P ‘‘
# ssh-copy-id -i .ssh/id_rsa.pub root@node1.hoo.com
node1：测试
#  ssh node2.hoo.com ‘date’;date

4.安装httpd

node1,node2

# yum install httpd -y
# ssh node2 "yum install httpd -y "
# ss -tunl | grep 80
# ssh node2 "ss -tunl | grep 80"

node1,node2均关闭httpd的自启动，httpd由Pacemaker管理

# chkconfig httpd off
# ckconfig --list httpd  //检查

node1,node2提供测试页

[root@node1 ~]# echo "node1.hoo.com" >/var/www/html/index.html
[root@node2 ~]# echo "node2.hoo.com" >/var/www/html/index.html

5.安装corosync和pacemaker

所有节点均安装

# yum install corosync pacemaker -y
# rpm -ql corosync
    //配置目录：/etc/corosync
    //配置模板：/etc/corosync/corosync.conf.example
    //服务器脚本：/etc/rc.d/init.d/corosync

6.安装资源管理器客户端命令接口工具crmsh

从pacemaker 1.1.8开始，crmsh发展成了一个独立项目，叫crmsh。pacemaker默认不提供命令接口工具，需要单独安装crmsh。

//crmsh依赖pssh
# yum -y install pssh-2.3.1-2.el6.x86_64.rpm
# yum -y install crmsh-1.2.6-4.el6.x86_64.rpm

7.配置主配置文件

[root@node1 ~]# cd /etc/corosync/
[root@node1 corosync]# cp corosync.conf.example corosync.conf
[root@node1 corosync]# vi corosync.conf
compatibility: whitetank   #表示是否兼容0.8之前的版本
totem {        #图腾，定义集群中各节点中通信机制以及参数
        version: 2    #图腾的协议版本号，不修改
        secauth: on   #安全认证功能是否启用，当使用aisexec时，会非常消耗CPU
        threads: 0    #实现认证时的并行线程数，0表示默认配置
        interface {   # 指定在哪个接口发心跳信息，子模块
                ringnumber: 0   #冗余环号，节点有多个网卡是可定义，避免心跳信息成环。
                bindnetaddr: 192.168.1.0   #绑定心跳网段
                mcastaddr: 226.94.8.8      #心跳组播地址
                mcastport: 5405            #心跳组播使用端口
                ttl: 1                     #表示只向外播一次
        }
}
logging {          # 跟日志相关
        fileline: off       #指定要打印的行
        to_stderr: no       #是否发送到标准错误输出，即屏幕
        to_logfile: yes     #记录到日志文件
        to_syslog: no       #记录到系统日志syslog
        logfile: /var/log/cluster/corosync.log  #日志文件路径
        debug: off          #是否启动调试
        timestamp: on       #是否打印时间戳
        logger_subsys {     #日志的子系统
                subsys: AMF
                debug: off
        }
}
service {
  ver:  0
  name: pacemaker        #定义corosync启动时同时启动pacemaker
  # use_mgmtd: yes
}
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
aisexec {     #表示启动ais的功能时，以哪个用户的身份运行
              #这个块可不定义，corosync默认就是以root身份运行的
  user: root
  group: root
}
amf {     # 跟编程接口相关的
        mode: disabled
}

8.生成认证key

用corosync-keygen生成key时，由于要使用/dev/random生成随机数，因此如果新装的系统操作不多，如果没有足够的熵，狂敲键盘即可，随意敲，敲够即可。（关于random使用键盘敲击产生随机数的原理可自行google）

实验演示没有足够的熵，这里将采用投机的方式，生产环境，切切不可。

//投机的认证方式
# mv /dev/random /dev/lala
# ln /dev/urandom /dev/random   //将随机数生成器链接至伪随机数生成器
# corosync-keygen    //生成密钥文件，用于节点通信，会生成authkey文件
# rm -rf /dev/random        //删除链接
# mv /dev/lala /dev/random     //还原随机数生成器

9.copy配置给node2

[root@node1 corosync]# scp authkey corosync.conf node2:/etc/corosync/

10.启动corosync

[root@node1 corosync]# service corosync start
[root@node1 corosync]# ssh node2  "service corosync start"

11.检查启动情况

//查看corosync引擎是否正常启动
[root@node1 corosync]# grep -e "Corosync Cluster Engine" -e "configuration file" /var/log/messages
//查看初始化节点通知是否正常发出
[root@node1 corosync]# grep  TOTEM  /var/log/messages
//检查启动过程中是否有错误产生
[root@node1 corosync]# grep ERROR: /var/log/messages | grep -v unpack_resources
//查看pacemaker是否正常启动
[root@node1 corosync]# grep pcmk_startup /var/log/messages

四、基于corosync实现web高可用资源管理

1.crmsh使用介绍

[root@node1 ~]# crm  //进入crmsh
crm(live)# help   #查看帮助
This is crm shell, a Pacemaker command line interface.
Available commands:
    cib              manage shadow CIBs            #CIB管理模块
    resource         resources management     #资源管理模块
    configure        CRM cluster configuration  #CRM配置，包含资源粘性、资源类型、资源约束等
    node             nodes management  #节点管理
    options          user preferences  #用户偏好
    history          CRM cluster history  #CRM 历史
    site             Geo-cluster support  #地理集群支持
    ra               resource agents information center #资源代理配置
    status           show cluster status  #查看集群状态
    help,?           show help (help topics for list of topics)  #查看帮助
    end,cd,up        go back one level  #返回上一级
    quit,bye,exit    exit the program  #退出
crm(live)# configure         #进入配置模式
crm(live)configure# show     #查看当前配置
crm(live)configure# verify   #检查当前配置语法
crm(live)configure# commit   #提交配置
crm(live)configure# cd
crm(live)# ra   //进入RA（资源代理配置）模式
crm(live)ra# help
This level contains commands which show various information about
the installed resource agents. It is available both at the top
level and at the `configure` level.
Available commands:
    classes          list classes and providers    ##查看RA类型
    list             list RA for a class (and provider)  ##查看指定类型（或提供商）的RA
    meta,info        show meta data for a RA   ##查看RA详细信息
    providers        show providers for a RA and a class  ##查看指定资源的提供商和类型
    help,?           show help (help topics for list of topics)
    end,cd,up        go back one level
    quit,bye,exit    exit the program
crm(live)ra# cd
crm(live)# status   //查看集群状态

2.stonith参数的调整

禁用stonith功能，corosync默认是启用stonith功能的，没有stonith设备，若直接去配置资源的话，verif会报错，无法commit。

[root@node1 corosync]# crm configure    #进入crm命令行模式配置资源等
crm(live)configure# property    #切换到property目录下，可以用两次tab键进行补全和查看
usage: property [$id=<set_id>] <option>=<value>    # property的用法和格式
crm(live)configure# property stonith-enabled=false   #禁用stonith-enabled
crm(live)configure# verify      #检查设置的属性是否正确
crm(live)configure# commit    #提交
crm(live)configure# show     #查看当前集群的所有配置信息

3.配置web集群

a).定义IP

crm(live)configure# primitive webip ocf:heartbeat:IPaddr params ip=172.16.1.100
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# cd
crm(live)# status

验证

[root@node1 ~]# ifconfig
发现：eth0:0有IP

转移资源

[root@node2 ~]# ssh node1 ‘service corosync stop‘
[root@node2 ~]# ssh node1 ‘ifconfig‘
[root@node2 ~]# ifconfig
发现：IP转移

b).配置httpd资源

crm(live)configure# primitive webserver lsb:httpd   //定义资源，资源类型为lsb
crm(live)configure# verify
crm(live)configure# show
crm(live)configure# commit
crm(live)# status
    //资源运行于两个节点上，默认以均衡的方式进行工作,尽可能将不同的资源运行在不同的节点上;

4.资源约束定义

若想将多个资源运行在同一个节点上，则，做成组，或定义排列约束。

资源约束则用以指定在哪些群集节点上运行资源，以何种顺序装载资源，以及特定资源依赖于哪些其它资源。

pacemaker共给我们提供了三种资源约束方法：

1）Resource Location(资源位置）:定义资源可以、不可以或尽可能在哪些节点上运行；
2）Resource Collocation(资源排列）：排列约束定义集群资源可以、不可以在某个节点上同时运行；
3）Resource Order(资源顺序)：顺序约束定义集群资源在节点上启动的顺序；

a).定义组，将资源运行在同一个节点上

//定义资源组webservice
crm(live)configure# help group
crm(live)configure# group webservice webip sebserver
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# show
crm(live)configure#cd
crm(live)# status

浏览器访问测试，成功！

测试：

//让node1离线，测试是否转移：
crm(live)# node
crm(live)node# help standby
crm(live)node# standby node1.hoo.com   //需要使用完整名称
crm(live)configure#cd
crm(live)# status
    //转移到node2
让node1重新上线：
# crm node online node1.hoo.com
# crm status

b).定义排列约束

先删除组：
crm(live)configure#help delete
crm(live)configure# delete webservice
                //无法删除，正在运行
crm(live)configure#cd
crm(live)# resource
crm(live)resource# help
crm(live)resource# help stop
crm(live)resource# stop sebservice
crm(live)resource# status webservice
crm(live)resource#cd
crm(live)configure#delete webservice
crm(live)configure#show
crm(live)configure#commit
crm(live)configure#cd
crm(live)#status
        //负载均衡
//定义排列约束：
crm(live)configure#help colocation
    //role(可省）:每一个资源都可以定义很多角色， 每一个资源代理在启动一个资源时，会经过很多阶段，刚准备启动叫premote,启动起来叫start，停止为stop。role在主从模型中用的多点，定义主的启动了，从的才能启动或其它role。
crm(live)configure#colocation webserver_with_webip inf: webserver webip 
            //让webserver与webip在一起
crm(live)configure#verify
crm(live)configure#commit
crm(live)configure#cd
crm(live)#status

c).定义顺序约束

义顺序约束：
crm(live)configure#help order
    //kind类型：Mandatory | Optional | Serialize
           强制，可选，顺序
crm(live)configure# order webip_before_webserver mandatory: webip webserver
            //按启动顺序写，从左至右
crm(live)configure#commit
crm(live)configure#show

d).定义位置约束

crm(live)configure#location webip_on_node2 webip 200: node2.hoo.com                      
     //定义为webip运行在node2的倾向性为200
crm(live)configure#verify
crm(live)configure#cd
crm(live)#status
    //已转移到node2,node1默认为0;

观察，停掉node2

//停掉node2
# service corosync stop
#crm status
    //资源没有转移到node1上，资源也没有显示了;
    //显示：Current DC: node1.magedu.com - partition WITHOUT QUORUM,表明，node2挂了，node1不具备法定票数，不具备法定票数的默认操作为suicide或stop;suicide全部资源全挂，不显示任何资源
    //两节点集群是一个特殊的集群，当node2挂了，希望资源转移到node1上，此时需要定义全局属性，一旦不具备法定票数时，应该忽略，而不是停止资源：
//上线node2:
#service corosync start
#crm status
    //显示在node2上启动了;
#crm configure
crm(live)configure#property  no-quorum-policy=ignore
crm(live)configure#verify
crm(live)configure#show
crm(live)configure#commit
//观察，停掉node2:
# service corosync stop
#crm status
    资源转移到node1，
    仍显示：Current DC: node1.magedu.com - partition WITHOUT QUORUM
//启动node2:
#service corosync start
#crm status
    //资源转移到node2,node2倾向性大

node1添加倾向值，观察

crm(live)configure#location webserver_on_node1 webserver 200: node1.hoo.com
            //定义为webserver运行在node1的倾向性为200
crm(live)configure#verify
crm(live)configure#commit
crm(live)configure#show
#crm status
    //此时仍在node2;
//停止node2:
# service corosync stop
#crm status
    //转移到node1;
//上线node2:
#service corosync start
#crm status
    //显示仍在node1;因为node1与node2倾向性一样，最终的倾向性取决于所有倾向性之和;

e).定义资源默认粘性

资源粘性生效于当前运行节点。资源运行在哪里，即在哪里生效。

crm(live)configure#help
crm(live)configure#edit
    //删除webserver定义的对node1的200的倾向性;
#crm status
        //此时所有服务都运行在node2
//配置粘性：
crm(live)configure#rsc-defaults resource-stickness=100
crm(live)configure#verify
crm(live)configure#show
crm(live)configure#commit
crm(live)configure#cd
crm(live)# status

测试：

//故障node2:
# service corosync stop
#crm status
    //资源转移到node1;
//上线node2:
#crm status
    //资源没有转移;
    //对当前node的粘性和为200,与对node2的倾向性相同，故留在当前节点
    //粘性定义，无关任一node，只生效当前所运行节点;

f).定义资源监控

//强行kill掉当前节点httpd
#killall httpd
#ss -tnl
#crm status
    //显示服务照常运行
#service httpd status
       //显示：httpd dead but subsys locked,subsys没有删除
       //kill掉服务，不会自动重启;因为，节点没有故障，所有资源不会转移，默认情况下，pacemaker不会对任何资源进行监控,所以，即便是资源关掉了，只要节点没有故障，资源依然不会转移;要想达到资源转移的目的，得定义监控(monitoer);

//定义监控：
#crm configure
crm(live)configure#cd
crm(live)#status
        //仍然在节点上运行着
crm(live)#resource
crm(live)resource# status
        //仍然显示：start,没有定义监控，意识不到httpd停掉
crm(live)resource# stop webserver
crm(live)resource# stop webip
crm(live)resource# status
crm(live)resource# cleanup webserver
crm(live)resource# cleanup webip
            //如果服务被非法关闭，需要清理，以免后续配置的一些麻烦
crm(live)resource# cd
crm(live)resource# configure
crm(live)configure# help monitor
crm(live)configure# monitor webserver 20s:15s
                                //监控时间：超时时间
crm(live)configure# verify
crm(live)configure#commit
crm(live)configure#cd
crm(live)# resource
crm(live)resource# start webip
crm(live)resource# start webserver
crm(live)resource#cd
crm(live)# status
        //资源在node2上启动;

测试：

# service httpd stop
# ss -tnl
    //查看日志：
#tail /var/log/cluster/corosync.log
    //查看node2的httpd是否自启：
#ss -tnl
     //启动成功;
//监控的意义：一旦发现服务没启动，就会尝试在当前主机上重启;
//配置ngnix争用端口                                
#service httpd stop  &&　service ngnix start                                 
#ss -tnl
crm(live)#status
            //重启无法成功，资源转移到node1

补充：

//定义资源的同时可以定义监控：
crm(live)configure# primitive vip ocf:heartbeat:Ipaddr  params ip=172.16.100.41 op monitor interval=30s timeout=15s op start timeout=20s op stop timeout=20s                            crm(live)resource#show                       
crm(live)configure#delet vip
                    //直接删除上面的定义

补充：CRM中的几个基本概念

1.资源类型

primitive（native）：基本资源，原始资源
group：资源组
clone：克隆资源（可同时运行在多个节点上），要先定义为primitive后才能进行clone。主要包含STONITH和集群文件系统（cluster filesystem）
master/slave：主从资源，如drdb（下文详细讲解）

2.RA类型