宁波云主机云服务器公司 号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部 你是不是也遇到过这种情况:明明 ping 能通目标服务器但 tel···
宁波云主机云服务器公司
号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部
你是不是也遇到过这种情况:
明明 ping 能通目标服务器但 telnet、curl、网页死活连不上有时候甚至能打开首页,点个功能就断了客户问你是不是网络不通,你看着 ping 一脸懵逼这类问题老网工见多了。
先了解一下「ping」命令的工作过程:
假设有两个主机,主机A(192.168.0.1)和主机B(192.168.0.2),现在我们要监测主机A和主机B之间网络是否可达,
在主机A上输入命令:ping 192.168.0.2
能 ping 不代表服务能正常访问,这个问题根本不是网络通不通这么简单,而是牵涉了五个常见盲区。
1. ping 通 ≠ 应用通,是两回事!
首先把一件事讲清楚:
ping 用的是 ICMP 协议网页访问、API 调用、数据库连接,用的是 TCP 或 UDP很多网络设备(尤其是防火墙、云主机)对这两类协议的处理逻辑是完全不同的。
所以出现这种情况其实非常常见:
ICMP 放行了,ping 没问题TCP/UDP 被策略拦了,服务访问挂了所以第一件事不是继续 ping,而是换工具测试目标端口,比如:
telnet 192.168.1.10 80curl http://192.168.1.10nc -zv 192.168.1.10 80
这才是服务是否可达的基本测试手段。
2. 防火墙策略拦了 TCP,但 ICMP 没管
这个是最常见的根源。
很多防火墙策略长这样:
allow icmp any anydeny tcp any any
特别是在云上(阿里云、华为云、腾讯云)或企业用堡垒机出口的环境中,一大堆默认规则允许 ping,却默认拦掉了 80/443/3306 这些服务端口。
怎么排查?
看安全组 / 防火墙策略是否只允许 ICMP,其他都被 Drop在服务端看监听状态,用 netstat -ntlp、ss -ntlp 看是否在监听配合 tcpdump 抓包,看包是不是到了但没回应3. 服务监听了 127.0.0.1,没有监听实际 IP
这个坑新手容易踩,比如部署 Nginx、MySQL、Redis 时:
阿里云服务器系统
你启动服务了,它确实也在跑,但你访问不了。
为啥?
看监听地址:
ss -ntlp
输出是这样:
LISTEN 0 128 127.0.0.1:6379 ...
那你从外部访问 192.168.1.10:6379 肯定不通啊,因为服务只监听了 localhost,根本没绑定在你实际的网卡 IP 上。
云服务器4核
改服务配置,把监听地址从 127.0.0.1 改成 0.0.0.0 或实际网卡 IP,就好了。
4. 路由表正常但回程不通,流量回来走错了
这个问题在双网卡、双出口的机器上特别常见。
表现就是:
ping 没问题(因为 ICMP 是对等的)telnet、HTTP 连接超时(尤其是三次握手不成功)原因在于:
请求是从网卡 eth0 发出去的返回却走 eth1,结果对端收不到回包表现就是 ping 通,服务死怎么查?
用 traceroute 和 tcpdump 同时看入站和出站接口把服务器的路由表 ip route 输出看清楚尝试只绑定一个网卡、关闭第二个默认路由试试这种问题看着像网络问题,其实是服务器自身的问题,很多时候和网络设备毫无关系。
5. MTU/丢包/ACL:最后的看不见的问题
有时候你以为是访问不了,其实是大包被截断了。
比如:
ping 默认包 56 字节,可以通业务发的 TCP 包是 1460 字节,被中间设备丢掉了常见的场景是:
IPSEC/VPN 通道、GRE 隧道里走了应用没调 MTU,或者中间丢包严重解决办法:
用 ping -s 1500 -M do 检查最大传输单元用 iperf 测一下通道质量用 tcpdump 看看是否三次握手卡在 SYN-ACK结尾:一眼就能定位的排查思路,送你一张表
所以,ping 通却访问不了服务并不稀奇,这个问题基本三两眼就能定位,因为他们心里有这张排查逻辑图:
第一步:协议是否一致(ICMP vs TCP)第二步:服务监听没问题(IP、端口)第三步:路径是否通(ACL、防火墙、策略路由)第四步:抓包分析是否有回包(排查 MTU、NAT、回程问题)原创:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部
云服务器价格计算

发表评论
最近发表
标签列表