如何做监控
如何做监控
监控:
- 什么是监控?
- 对线上质量的一个实时检查
- 重要性
- 发现线上问题(早于用户)
- 快速止损、定位
- 及时发现隐藏的问题,指导策略优化
- 如何做好监控?
- 监控的流程及内容
- 监控需求提出
- 监控需求开发
- 监控需求测试
- 监控指标确认
- 监控报警添加
- 确认监控内容
- 新功能添加监控
- 补充监控
- 围绕
- 系统正确性
- 系统异常
- 异常定位
- 隐藏问题指导策略
- 监控数据获取
- 打点数据
- 日志数据
- 数据库数据
- redis 数据
- 监控报警添加
- 监控可视化
- 确定触发报警策略
- 确定报警频率
- 确定报警接收人
- 配置监控
- 监控处理
- 收到报警
- 问题跟进
- 问题周知
- 问题处理
- 定损
- 复盘 & casestudy
- 监控报警优化
- 漏报
- 不同报警类型
- 突升突降代替固定阈值
- 无效报警太多(准确率)
- 准确性提升
- 放大时间窗口,屏蔽预期内的单点抖动
- 工作日、节假日不同阈值
- 推送方式优化
- 连续失败
- 通知间隔
- 通知依赖
- 不同方式报警(短信、电话)
- 准确性提升
- 报警处理不及时
- 自愈脚本等
- 漏报
- 问题定位
- 流量分析
- 流量细分
- 行业
- 地域
- 机房
- 流量细分
- 系统分析
- 线上出现报错、fatal、pvlost
- 例行上线功能影响
- 数据变更
- 流量分析
- 监控的流程及内容
监控发现有问题之后可以了解一下 如何追查线上问题
本站总访问量次 本站访客数人次 本文总阅读量次