背景
LB集群使用了LVS做负载均衡,使用的是NAT模式对tcp 80端口进行负载均衡。因为服务器访问量比较大,所以负载均衡后面的web服务器上出现了大量的 timewait 状态连接。
分析思路
- 打开tcp_tw_recycle;load balancer作为中间代理应该需要开启tcp_tw_recyvle 同时需要开启tcp_timestamps
- 设置SO_LINGER ; 只有正常的四次挥手过程才会出现time-wait。 打开so-linger同时将延时设为0,服务器发起关闭时,发送RST直接断开连接
- 调整tcp_max_tw_buckets