文章目录
Haproxy概述
Haproxy 是目前比较流行的一种群集调度工具,同类群集调度工具有很多,如 LVS 和 Nginx。相比较而言,LVS 性能最好,但是搭建相对复杂;Nginx 的 upstream 模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有 Haproxy 好。Haproxy 官方网站 是 http://www.haproxy.org/。
Haproxy与LVS相比
- Haproxy是一款可提供高可用性、负载均衡、及基于TCP和HTTP应用的代理的软件,特别适用于负载特别大的Web站点
- 运行在当前的硬件上可支持数以万计的并发连接连接请求
- LVS性能最好,但不支持正则处理,不能实现动静分离
- 对于大型网站,LVS的实施配置复杂,维护成本相对较高
一、 Haproxy 功能及常用群集调度算法
Haproxy支持多种调度算法,最常用的有三种:RR(Round Robin),LC(Least Connections),SH(Source Hashing)
1.1 轮询 RR(Round Robin)
RR 算法是最简单最常用的一种算法,即轮询调度。例如,有 三个节点 A、B、C,第一个用户访问会被指派到节点 A,第二个用户访问会被指派到节点 B, 第三个用户访问会被指派到节点 C,第四个用户访问继续指派到节点 A,轮询分配访问请求 实现负载均衡效果。此算法还有一种加权轮询,即根据每个节点的权重轮询分配访问请求。
1.2 最小连接数 LC(Least Connections)
LC 算法就是最小连接数算法,根据后端的节点连接数大小动态分配前端请求。例如,有三个节点 A、B、C,各节点的连接数分别为 A∶4、B∶5、C∶ 6,此时如果有第一个用户连接请求,会被指派到 A 上,连接数变为 A∶5、B∶5、C∶6;第二 个用户请求会继续分配到 A 上,连接数变为 A∶6、B∶5、C∶6;再有新的请求会分配给 B, 每次将新的请求指派给连接数最小的客户端。由于实际情况下 A、 B、 C 的连接数会动态释放, 很难会出现一样连接数的情况,是目前用到比较多的一种算法。
1.3 基于来源访问 SH(Source Hashing)
基于来源访问调度算法,此算法用于一些有 Session 会话记录在服务器端的场景,可以基于来源的 IP、Cookie 等做群集调度。例如,使用基于源 IP 的群集调度算法,有三个节点 A、B、C,第一个用户第一次访问被指派到了 A,第二个 用户第一次访问被指派到了 B,当第一个用户第二次访问时会被继续指派到 A,第二个用户 第二次访问时依旧会被指派到 B,只要负载均衡调度器不重启,第一个用户访问都会被指派 到 A,第二个用户访问都会被指派到 B,实现群集的调度。此调度算法好处是实现会话保持, 但某些 IP 访问量非常大时会引起负载不均衡,部分节点访问量超大,影响业务使用。
1.4 常见的 Web 群集调度器
目前,常见的 Web 群集调度器分为软件和硬件。软件通常使用开源的 LVS、Haproxy、 Nginx,硬件一般使用比较多的是 F5。也有很多人使用国内的一些产品,如梭子鱼、绿盟等。
二、 Haproxy群集搭建
实验目的
Haproxy搭建Web群集,实现正常访问
实验环境
VMware软件
两台centos7虚拟机作为NGINX(IP地址:14.0.0.110 IP地址:14.0.0.177)
一台centos7虚拟机作为Haproxy(IP地址:14.0.0.107)
实验过程
1. nginx的手工编译安装
两台web服务器都要安装,以一台安装为例
[root@localhost ~]# iptables -F
[root@localhost ~]# setenforce 0
[root@localhost ~]# yum install -y pcre-devel zlib-devel gcc gcc-c++ make ##安装环境包
将软件包拷贝到当前目录
[root@localhost ~]# useradd -M -s /sbin/nologin nginx ##创建一个管理nginx的用户,不创建家目录,不能登录
[root@localhost ~]# tar zxvf nginx-1.12.0.tar.gz ##解压软件包
[root@localhost ~]# cd nginx-1.12.0/
[root@localhost nginx-1.12.0]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx ##configure配置
[root@localhost nginx-1.12.0]# make && make install ##编译安装
[root@localhost nginx-1.12.0]# ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/ ##建立软连接
为nginx创建一个首页便于测试
[root@localhost nginx-1.12.0]# vim /usr/local/nginx/html/test.html ##这是web服务器14.0.0.110的测试首页
<h1>this is Hello web</h1>
web服务器14.0.0.117的测试首页
[root@localhost nginx-1.12.0]# vim /usr/local/nginx/html/test.html
<h1>this is World web</h1>
[root@localhost nginx-1.12.0]# nginx
[root@localhost nginx-1.12.0]# netstat -ntap | grep 80
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 14074/nginx: master
2. Haproxy安装
Haproxy在负载均衡器上安装(14.0.0.107)
安装步骤
- 安装基础软件包
- 编译安装 haproxy
要注意操作系统版本,是32位系统还是64位 - 建立 Haproxy的配置文件
- 创建配置文件目录/etc/haproxy
- 将源码包提供的配置文件样例 haproxy.cfg复制到配置文件目录中
[root@localhost ~]# iptables -F
[root@localhost ~]# setenforce 0
[root@localhost ~]# yum -y install pcre-devel bzip2-devel gcc gcc-c++ make ##安装基础环境包
将软件包拷贝到当前目录下
[root@localhost ~]# tar zxvf haproxy-1.5.19.tar.gz
[root@localhost ~]# cd haproxy-1.5.19/
[root@localhost haproxy-1.5.19]# make TARGET=linux26 ##编译
[root@localhost haproxy-1.5.19]# make install ##安装
[root@localhost haproxy-1.5.19]# mkdir /etc/haproxy
[root@localhost haproxy-1.5.19]# cp examples/haproxy.cfg /etc/haproxy/
# this config needs haproxy-1.1.28 or haproxy-1.2.1
global
log 127.0.0.1 local0
log 127.0.0.1 local1 notice
#log loghost local0 info
maxconn 4096
# chroot /usr/share/haproxy '//固有目录,可注释掉'
uid 99
gid 99
daemon
#debug
#quiet
defaults
log global
mode http
option httplog
option dontlognull
retries 3
# redispatch '//注释'
maxconn 2000
contimeout 5000
clitimeout 50000
srvtimeout 50000
listen webcluster 0.0.0.0:80 '//删除原本listen内容,添加一下内容'
option httpchk GET /test.html '//监听检查服务器的index.html文件(节点服务器的主页)'
balance roundrobin '//负载均衡调度算法使用轮询算法'
server inst1 14.0.0.110:80 check inter 2000 fall 3 '//定义在线节点'
server inst1 14.0.0.177:80 check inter 2000 fall 3
[root@localhost haproxy]# cd ~/haproxy-1.5.19/examples/
[root@localhost examples]# cp haproxy.init /etc/init.d/haproxy ##启动脚本
[root@localhost examples]# cd /etc/init.d/
[root@localhost init.d]# chmod +x haproxy
[root@localhost init.d]# chkconfig --add /etc/init.d/haproxy ##添加到service管理
[root@localhost init.d]# ln -s /usr/local/sbin/haproxy /usr/sbin/ ##建立软链接
[root@localhost init.d]# service haproxy start
Starting haproxy (via systemctl): [ 确定 ]
[root@localhost init.d]# netstat -ntap | grep haproxy
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 13305/haproxy
Haproxy配置文件详解
Haproxy配置文件通常分为三个部分
- global:为全局配置
- defaults:为默认配置
- listen:为应用组件配置
global配置参数 - log127.0.0.1 lcal0:配置日志记录,local0为日志设备,默认存放到系统日志
- log127.0.0.1 loca1 notice:notice为日志级别,通常有24个级别
- maxconn4096:最大连接数
- uid 99:用户uid
- gid 99:用户gid
- defaults配置项配置默认参数,一般会被应用组件继承,如果在应用组件中 没有特别声明,将安装默认配置参数设置
- log global:定义日志为global配置中的日志定义
- mode http:模式为http
- option httplog:采用http日志格式记录日志
- retries 3:检查节点服务器失败连续达到三次则认为节点不可用
- maxconn2000:最大连接数
- contimeout5000:连接超时时间
- clitimeout50000:客户端超时时间
- srvtimeout50000:服务器超时时间
- listen配置项目一般为配置应用模块参数
- listen appli4- backup 0.0.0.0:10004:定义一个appli4- backup的应用
- option httpchk /index.html检查服务器的index.html文件
- option persist:强制将请求发送到已经down掉的服务器
- alance roundrobin:负载均衡调度算法使用轮询算法
- server inst1 192.168.114.56:80 check inter 2000 fall 3:定义在线节点
- server inst2 192.168 114.56:81 check inter 2000 fall 3 backup:定义备份节点
3. 在win10虚拟机中验证
虚拟机中就配14.0.0.0网段的IP地址
三、 Haproxy日志管理
Haproxy 的日志默认输出到系统的 syslog 中,查看起来不是非常方便,为了更好地管理 Haproxy 的日志,在生产环境中一般单独定义出来。
- 修改 Haproxy配置文件中关于日志配置的选项,加入配置:
log /dev/log local0 info
log /dev/log local0 notice - 修改 rsyslog配置,将 Haproxy相关的配置独立定义到
haproxy.conf,并放到/etc/rsyslog.d/下 - 保存配置文件并重启 rsyslog服务,完成 rsyslog配置
- 访问网页并查看日志信息是否成功生成
[root@localhost init.d]# vim /etc/haproxy/haproxy.cfg
log /dev/log local0 info
log /dev/log local0 notice
[root@localhost init.d]# cd /etc/rsyslog.d/
[root@localhost rsyslog.d]# vim haproxy.conf
if ($programname == 'haproxy' and $syslogseverity-text == 'info')
then -/var/log/haproxy/haproxy-info.log
&~
if ($programname == 'haproxy' and $syslogseverity-text == 'notice')
then -/var/log/haproxy/haproxy-notice.log
&~
[root@localhost rsyslog.d]# systemctl restart rsyslog.service
[root@localhost rsyslog.d]# service haproxy restart
Restarting haproxy (via systemctl): [ 确定 ]
[root@localhost rsyslog.d]# ls /var/log/haproxy/ ##查看到了日志文件
haproxy-info.log haproxy-notice.log
四、 Haproxy 参数优化
参数 | 参数说明 | 优化建议 |
---|---|---|
maxconn | 最大连接数 | 此参数根据应用的实际使用情况进行调整,推荐使用 10240,同时“defaults”中的最大连接数的值不能 超过“global”段中的定义 |
daemon | 守护进程模式 | Haproxy 可以使用非守护进程模式启动,生产环境建议使用守护进程模式启动 |
nbproc | 负载均衡的并发进程数 | 建议与当前服务器 CPU 核数相等或为其 2 倍 |
retries | 重试次数 | 此参数主要用于对群集节点的检查,如果节点多,且 并发量大,设置为 2 次或 3 次;在服务器节点不多的 情况下,可以设置 5 次或 6 次 |
option http-server-close | 主动关闭 http 请求选项 | 建议在生产环境中使用此选项,避免由于 timeout 时 间设置过长导致 http 连接堆积 |
timeout http-keep-alive | 长连接超时时间 | 此选项设置长连接超时时间,具体参考应用自身特点 设置,可以设置为 10s |
timeout http-request http | 请求超时时间 | 建议将此时间设置为 5~10s,增加 http 连接释放速度 |
timeout client | 客户端超时时间 | 如果访问量过大,节点响应慢,可以将此时间设置短 一些,建议设置为 1min 左右就可以了 |
来源:oschina
链接:https://my.oschina.net/u/4330611/blog/4546778