1) 明确目标:带宽大小、时延(目标值例如 <=50ms)、丢包率(<0.5%)、抖动(<20ms)、可用性(99.95% 以上)以及业务类型(VoIP、游戏、Web 等)。
2) 准备测试点:至少准备两个测试端(一个在台湾或接入台湾运营商节点,一个在你当前网络),或使用云主机(如 GCP/Taiwan、AWS 台湾区域)和本地测试主机。
1) 查 AS 和对端:在 bgp.he.net / PeeringDB 上查目标提供商的 AS、对等信息、IX 交换点。
2) 使用 Looking Glass:到对方的 looking glass(或第三方)执行 "show ip bgp <你的前缀>"、"show ip bgp" 查看 AS-PATH、Next-hop 是否稳定,并记录多时段结果。
1) traceroute 命令示例:Linux: traceroute -n -w 2 -q 1 <目标IP>;Windows: tracert -d -h 30 <目标IP>。记录每跳延迟和丢包。
2) MTR 连续测试:mtr -r -c 100 <目标IP>(或 mtr --report --report-cycles 200),观察哪一跳开始出现丢包或抖动,判断是不是骨干链路问题还是最后一跳丢包。
1) Ping 长时间统计:ping -c 200 -i 0.2 <目标IP>,记录平均、最小、最大延迟与丢包率。
2) 大包与分片测试:ping -s 1200 -c 50 <目标IP> 检查 MTU/PMTUD 问题;在必要时启用 DF 标志测试。注意在业务高峰和低峰分别测试。
1) iperf3 测试:在对端放置 iperf3 服务器,客户端执行 iperf3 -c
2) 多时段与双向测试:分别测试上行、下行及双向并行,记录吞吐曲线(30min 以上更可靠)。
1) 部署长期监测:用 Smokeping、Prometheus+Blackbox 或第三方(ThousandEyes)做 24/7 监控,设置阈值报警。
2) 被动流量分析:如果能接入对端 NetFlow/sFlow,检查重传、会话中断和不同端口的表现差异,确认是否存在中间策略限速或 QoS 问题。
1) 延迟判断:延迟 <=50ms 为优秀,50-100ms 可接受,>150ms 不可接受(按业务敏感度调整)。
2) 丢包/抖动判断:丢包 <0.5% 良好;0.5%-1% 需关注;>1% 要求提供商定位。抖动 <20ms 良好。注意查看是否在特定时段或路由发生。
1) 要求明确 SLA 指标:可用率、延迟/丢包上限、恢复时间(MTTR)、故障通报时间及信用扣减办法。
2) 测量方法写清楚:约定第三方或双方监测点、测量频率、是否排除计划维护、信用计算公式与申诉流程。
1) 测试响应速度:提出工单或邮件,记录首次响应时间、问题定位速度以及升级路径(NOC、二线、工程师)。
2) 技术能力证实:要求提供工程师联系方式、维护窗口、应急电话,并要求出具近 12 个月的维护记录或可用性报告样本。
问:如何验证对方是否真用 CN2(而不是普通骨干)?
答:先通过 traceroute/mtr 观察 AS 路径和跃点标签,结合 bgp.he.net 查询对方 AS 描述是否包含 CN2;再用对方提供的 Looking Glass 或上海/台湾节点做确认;如需更严谨,可要求提供运营商的内部路由文档或交换点列表。
问:若测试发现峰值时段丢包突增,我该怎样定位责任方?
答:先用 MTR 定位哪一跳开始丢包(如果是业务链路最后一跳,通常对端责任;如在中间骨干跳,可能是骨干或中间传输问题),同时提交带时间戳的原始测试数据给提供商并要求他们用自己的监控对照并出具三方日志;如双方意见不同,可用第三方监测节点(例如 RIPE Atlas)交叉验证。
问:选择供应商时,哪些合同条款不能忽略?
答:必须包含明确的 SLA(指标与测量方法)、违约赔偿/信用、升级与响应时间、维护窗口与提前通知、流量工程与变更通知、紧急联络链、以及退订/变更条款(例如违约金与提前终止条件)。同时保留第三方独立测量并作为仲裁依据的权利。
