SRE服务端预案,应急处理手册
服务端应急处理流程 问题升级流程 问题升级步骤 SRE人员-各端组长-业务线负责人 现有降级手段 App业务入口降级 降级范围以及作用域 使用App降级策略,App在各个业务入口会直接降级,关闭对应的业务入口 使用场景 对应业务出现会持续扩大损失并且短期无法修复的报错,比如应用持续出现异常,并且异常会导致越来越多的脏数据影响业务流程 应用无法正常提…
SRE-基于阿里云的告警体系建设
SRE-描述文档
事记-202310
2023年技术圈发生了什么
中国人缺少思想力量
基于数据源来做分类 sls日志告警 配置以及查看方式 sls日志左侧点击铃铛进入告警中心配置 告警规则触发就是sls日志的查询语句,配置的规则时间内,查询语句查询的数量达到配置值,就会触发告警 现状 5XX告警 应用error日志告警 云产品监控告警 配置以及查看方式 阿里云直接搜索云监控 左边云产品监控,然后搜索要配置的云产品即可,比如redis…
SRE是什么 SRE(Site Reliability Engineering)即网站可靠性工程,以软件工程的方法论重新定义研发运维,驱动并赋能业务演进。 SRE的职责 SRE主要负责所有核心业务系统的可用性、性能、容量相关的事情,根据《Site Reliability Engineering 》一书提及的内容,笔者做简单汇总,SRE的工作主要包括…
Travel 整个国庆回老家就发烧,烧退了的早上就回杭州了,整个咳嗽晚上经常咳嗽的睡不着,真是麻了 国庆回来就连上7天,调NM的休 要养一只小金渐层猫咪了 Society 很多经济博主比较多讨论以下问题,并输出观点 养老金问题,目前已经收不抵支,预计2035年养老金会开始巨量亏空 央行大量增加黄金库存,人民币进入“无锚时代” 许家印被抓 碧桂园正式…
2023年技术圈发生了什么 https://www.infoq.cn/article/DUcAjpfd9ueWK9C1yOsN
主要矛盾 高中时在政治书上看到过一句类似的话,但是没有记忆了,只有大概的印象,内容为: 我国社会主要矛盾为逐渐丰富的物质发展以及落后的精神文明建设之间的矛盾 现在深以为然 中国人在统一的思想上的矛盾 从两千多年前儒家文化出现以来,中国并没有出现第二种文化思想,马克思主义只有一个美好未来和一大堆方法论,对中国几千年建立起来的文化冲击却微乎其微,偏偏国…
事记-202309
个人 迁移了博客 博客从cnblog迁移到了自建的网址,hugo+cloudflarepage,之前对cnblog已经挺满意的了,但是不知道为什么总觉得不是自己的地方,所以写东西的动力很弱,有一种莫名的割裂感。最后只是偶尔同步下工作里的分享和记录过去。 迁移来来回回折腾了2周,不得不吐槽前端还是博大精深,啥时候能统一下啊 工作 9月的开始确定了今年…
互联网安全
通信链路安全 加解密相关常见概念 密钥 密钥与算法一起使用,密钥+算法+明文=密文 密钥根据算法的不同,一般会是一个(对称加密)或者一对(非对称加密) 公私钥 公私钥一直是一个比较容易混淆的概念,这里仔细说下 公私钥首先存在于非对称加密的场景 密钥本身并没有所谓公私的概念,所谓公私只取决于你对他的使用,比如,密钥A和B是一对密钥,A和B都能对彼此加…
分库分表使用规范
建模过程总结
1 设计规范 1.1 必须使用分布式主键 解读: l 分库分表后使用依旧使用自增主键会导致后续分库分表扩容时主键全部需要重写,并且其他数据依赖方(如大数据)取数聚合计算时出现冲突 l 主键就是对数据的唯一标识键,哪怕分库分表了也应该是如此 1.2 分库分表前需要谨慎评估是否真的需要分库分表 解读: l 分库分表会带来更多的问题,不带分表键的查询都不…
整个建模过程,个人总结来说应该分为3个阶段 前期准备工作,了解问题领域的现状,做好目标分析 做好模块的划分以及具体模块的设计 对整个项目进行总结反思,包括目标的达成情况、设计的实现情况,设计是否存在不合理 前期准备工作 了解问题领域 了解业务概况 在这一步,我们需要了解现在业务的“概况”,强调一定是概况,现在还没到具体详细分析业务的时候。了解业务概…