跟私募做股票靠谱吗 林亚:大型企业系统可观测性的最佳实践
盘面上跟私募做股票靠谱吗,行业板块涨多跌少,航空装备、广播电视、一般零售、教育培训、专业连锁、林业等板块涨幅靠前,工程咨询服务、乘用车、酿酒、房屋建设等板块跌幅靠前。
今天分享的是:林亚:大型企业系统可观测性的最佳实践
报告共计:33页
该文档主要探讨大型企业系统可观测性的最佳实践,包括企业IT系统环境、可观测性平台、案例研究及具体实践方法等方面。
1. 大型企业IT系统环境
- 系统介绍:大型企业IT系统环境多样,包括遗留系统、云原生系统和硬件系统。遗留系统运行于虚拟机,对业务重要但监控困难;云原生系统基于云基础设施,具可扩展性;硬件系统有独特可观测性挑战。
- 可观测性挑战:面临系统复杂性、技能差距、数据和组织孤岛、工具激增、缺乏标准化等挑战,导致平均修复时间增加、系统可靠性降低、上市时间延长和运营成本增加。
2. 可观测性平台
- 平台概述:可观测性平台涵盖数据生成、收集保存和可视化价值提取。数据类型有指标、日志和跟踪。数据收集保存面临延迟、可靠性和安全性挑战,需选择合适协议、优化网络配置、使用数据压缩,选择合适存储方案、实施保留策略和利用重复数据删除。有效价值提取可改进决策、加快事件响应、提高运营效率、实现创新。
3. 案例研究:某公司有多个本地和云数据中心,采用集中式DevOps/SRE团队,面临可观测性工具激增、缺乏标准化和确定根本原因困难等挑战,系统故障中断发生率高。
4. 可观测性最佳实践
- 团队协作:将SRE纳入开发团队,共享所有权,主动解决问题,改进协作,加强知识传授。
- 标准制定:建立可观测性标准,包括指标定义、日志记录约定和项目模板,采用OpenTelemetry框架,领导层推动自上而下的标准化,提供培训并定期审查更新。
- 降低复杂性:降低系统复杂性可提升管理维护效率、节省成本、增强数据一致性,可从系统级复杂性方面评估,如训练时间、说明时间、管理多样性和部署配置多样性等。
- 数据精简:减少指标、日志和跟踪,可降低成本、加快分析、提高性能、增强专注力,识别并去除不必要的指标、标签,合理采样,关闭生产环境中的调试日志等。
- 应用分析:日志、指标和跟踪有局限性,需进行性能、内存、CPU和线程分析。
- 优化策略:遵循80/20原则,优先关注关键系统和指标,优化数据收集,确定事件响应优先级。实践后,该公司严重事件、事故总数和平均MTTR显著减少,可观测性覆盖率提高,后续将使用内部代码模板并集成分布式跟踪。
以下为报告节选内容
云数据中心系统指标日志林亚发布于:广东省声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。