运维

运维

运维监控体系总结

JetLee 发表了文章 • 0 个评论 • 851 次浏览 • 2021-08-19 12:06 • 来自相关话题


总结归纳运维工作中的监控内容。

监控目标

明白监控的重要性以及使用监控要实现的业务目标。

通常包括以下三点:
  • 对目标系统进行实时监控
  • 监控可以实时反馈目标系统的当前状态,目标系统硬件、软件、业务是否正常、目前处于何种状态
  • 保...
查看更多

运维故障处理指南

aoxiang 发表了文章 • 0 个评论 • 1695 次浏览 • 2021-07-13 12:27 • 来自相关话题


故障处理原则

故障处理的原则只有两个:
  • 以恢复业务优先
  • 及时升级


恢复业务优先

恢复业务优先是指,不管在任何情况下,也不管任何级别的故障,都要先做到恢复业务,这个和故障定位不同,也有很多人会产生歧义,觉得如果不找到问题的根源,如何...
查看更多

OpenKruise v0.9.0 版本发布:新增 Pod 重启、删除防护等重磅功能

阿里巴巴云原生 发表了文章 • 0 个评论 • 1997 次浏览 • 2021-06-02 18:43 • 来自相关话题


作者 | 王思宇(酒祝)
Photo Creidt@ 王思宇(酒祝)

背景


OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Na...
查看更多

统一运维平台的思考

Andy_Lee 发表了文章 • 0 个评论 • 1711 次浏览 • 2021-05-05 21:48 • 来自相关话题


云原生的赛道拉开后,大公司都忙着不断引领潮流,小公司因为公有云的普及也可以紧跟潮流,反观当前最难受的是那些中型公司,不断思考云原生时代的转型,由于历史的包袱以及公司已经稳定的业务,通常都要开始进行内部统一平台的建设,今天首先简单给大家分享下,整个系统会做成一个...
查看更多

Serverless 时代 DevOps 的最佳打开方式

阿里巴巴云原生 发表了文章 • 0 个评论 • 2917 次浏览 • 2021-03-18 14:29 • 来自相关话题


作者 | 许成铭(竞霄)
来源 | 阿里巴巴云原生公众号

DevOps 简析

传统软件开发过程中,开发和运维是极其分裂的两个环节,运维人员不关心代...
查看更多

KubeNode:阿里巴巴云原生 容器基础设施运维实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 2985 次浏览 • 2021-03-11 15:15 • 来自相关话题


作者 | 周涛  阿里云技术专家
来源 | 阿里巴巴云原生公众号

阿里巴巴节点运维的挑战

在阿里巴巴的场景下,做节点运维面临的挑战主要来自于这几个...
查看更多

应云而生,幽灵的威胁 - 云原生应用交付与运维的思考

阿里巴巴云原生 发表了文章 • 0 个评论 • 2513 次浏览 • 2021-02-26 10:22 • 来自相关话题


作者 | 易立  阿里云资深技术专家
来源|阿里巴巴云原生公众号

本系列文章:
查看更多

申通快递 双11 云原生应用实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 2519 次浏览 • 2020-11-25 14:07 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... f9...
查看更多

OpenKruise:阿里巴巴 双11 全链路应用的云原生部署基座

阿里巴巴云原生 发表了文章 • 0 个评论 • 2355 次浏览 • 2020-11-24 14:08 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... 9c...
查看更多

订单峰值激增 230%,Serverless 如何为世纪联华降本超 40%?|双11 云原生实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 1991 次浏览 • 2020-11-18 13:41 • 来自相关话题


作者 | 朱鹏

导读:2020 年 双11,世纪联华基于阿里云函数计算 (FC) 弹性扩容,应用于大促会场 SSR、线上商品秒杀、优惠券定点发放、行业导购、数据中台计算等多个场景,业务峰值 QPS 较去年提升 230%,研发效率交付提效超过...
查看更多

运维监控体系总结

JetLee 发表了文章 • 0 个评论 • 851 次浏览 • 2021-08-19 12:06 • 来自相关话题


总结归纳运维工作中的监控内容。

监控目标

明白监控的重要性以及使用监控要实现的业务目标。

通常包括以下三点:
  • 对目标系统进行实时监控
  • 监控可以实时反馈目标系统的当前状态,目标系统硬件、软件、业务是否正常、目前处于何种状态
  • 保...
查看更多

运维故障处理指南

aoxiang 发表了文章 • 0 个评论 • 1695 次浏览 • 2021-07-13 12:27 • 来自相关话题


故障处理原则

故障处理的原则只有两个:
  • 以恢复业务优先
  • 及时升级


恢复业务优先

恢复业务优先是指,不管在任何情况下,也不管任何级别的故障,都要先做到恢复业务,这个和故障定位不同,也有很多人会产生歧义,觉得如果不找到问题的根源,如何...
查看更多

统一运维平台的思考

Andy_Lee 发表了文章 • 0 个评论 • 1711 次浏览 • 2021-05-05 21:48 • 来自相关话题


云原生的赛道拉开后,大公司都忙着不断引领潮流,小公司因为公有云的普及也可以紧跟潮流,反观当前最难受的是那些中型公司,不断思考云原生时代的转型,由于历史的包袱以及公司已经稳定的业务,通常都要开始进行内部统一平台的建设,今天首先简单给大家分享下,整个系统会做成一个...
查看更多

云产品的选型:8/2选择原则

阿娇 发表了文章 • 0 个评论 • 4740 次浏览 • 2020-04-29 18:56 • 来自相关话题


【编者的话】本文摘自于阿里云MVP、驻云科技运维总监乔锐杰撰写的《阿里云运维架构实践秘籍》一书,选好云平台后,接下来要考虑的是在这个云平台上选择什么样的云产品进行业务部署及规划。可是在面对云平台上的两三百款产品时,难免会眼花缭乱。如何选择对应的产品?选择的重点...
查看更多

民生银行数据库智能运维的探索与实践

玻璃樽 发表了文章 • 0 个评论 • 4686 次浏览 • 2020-01-04 10:56 • 来自相关话题


背景与挑战

近几年,随着业务的增长、数字化转型加速、互联网金融业务快速发展和迭代,银行数据中心传统的IT架构面临着巨大的挑战。数据库作为最重要的IT基础设施组件,数据库的数量出现井喷式增长,同时数据库的技术架构和运行环境也越来越复杂。数据库种类上从使用...
查看更多

运维团队中的流程规范

阿娇 发表了文章 • 0 个评论 • 7424 次浏览 • 2019-07-07 17:58 • 来自相关话题


这周在内部享关于团队在流程规范上的一些实践心得,整理一下分享到公众号。

运维工程师一般对业务功能上线要求还是比较严格的,但到了自己开发的功能上线和变更时,往往因为有较大的权限且缺乏监督,更容易疏忽和踩坑。

文章针对运维方面分享一些具体的实践经验和建议,一般...
查看更多

一篇文章全面了解运维监控知识体系

阿娇 发表了文章 • 0 个评论 • 4664 次浏览 • 2019-06-22 20:49 • 来自相关话题


监控目标

我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。
![](http://s...
查看更多

运维平台信用分——滴滴内部的数据驱动实践

老马 发表了文章 • 0 个评论 • 4219 次浏览 • 2019-05-25 21:03 • 来自相关话题


【编者的话】在大家的印象中,运维人员更多的是从属业务的角色。在传统的企业IT中,没有快速的产品迭代,没有每天成百上千次的服务发布和伸缩容,这样的角色看似没有问题。但在如今的 DevOps 时代,日常的运维工作中每天要应对成百上千次的服务发布与线上操作。如果运维...
查看更多

运维工程师不得不看的经验教训和注意事项

大卫 发表了文章 • 0 个评论 • 7444 次浏览 • 2019-05-22 19:48 • 来自相关话题


一、线上操作规范

测试使用

当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及...
查看更多

2019运维技能风向标

尼古拉斯 发表了文章 • 0 个评论 • 3926 次浏览 • 2019-05-20 09:04 • 来自相关话题


运维是一个融合多学科(网络、系统、开发、安全、应用架构、存储等)的综合性技术岗位,从最初的网络管理(网管)发展到现在的系统运维工程师、网络运维工程师、安全运维工程师、运维开发工程师等,可以看出,运维的分工一直在细化,并且对综合技能要求越来越高,可以看出,未来运...
查看更多

招聘贴:腾讯游戏招聘Docker运维开发工程师

回复

天空未留痕迹 发起了问题 • 1 人关注 • 0 个回复 • 7609 次浏览 • 2016-12-19 17:06 • 来自相关话题

Docker对话Swarm,诚邀教官检阅新兵Crane,体验有奖

回复

starjason 回复了问题 • 6 人关注 • 6 个回复 • 9129 次浏览 • 2016-09-08 10:46 • 来自相关话题

运维监控体系总结

JetLee 发表了文章 • 0 个评论 • 851 次浏览 • 2021-08-19 12:06 • 来自相关话题


总结归纳运维工作中的监控内容。

监控目标

明白监控的重要性以及使用监控要实现的业务目标。

通常包括以下三点:
  • 对目标系统进行实时监控
  • 监控可以实时反馈目标系统的当前状态,目标系统硬件、软件、业务是否正常、目前处于何种状态
  • 保...
查看更多

运维故障处理指南

aoxiang 发表了文章 • 0 个评论 • 1695 次浏览 • 2021-07-13 12:27 • 来自相关话题


故障处理原则

故障处理的原则只有两个:
  • 以恢复业务优先
  • 及时升级


恢复业务优先

恢复业务优先是指,不管在任何情况下,也不管任何级别的故障,都要先做到恢复业务,这个和故障定位不同,也有很多人会产生歧义,觉得如果不找到问题的根源,如何...
查看更多

OpenKruise v0.9.0 版本发布:新增 Pod 重启、删除防护等重磅功能

阿里巴巴云原生 发表了文章 • 0 个评论 • 1997 次浏览 • 2021-06-02 18:43 • 来自相关话题


作者 | 王思宇(酒祝)
Photo Creidt@ 王思宇(酒祝)

背景


OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Na...
查看更多

统一运维平台的思考

Andy_Lee 发表了文章 • 0 个评论 • 1711 次浏览 • 2021-05-05 21:48 • 来自相关话题


云原生的赛道拉开后,大公司都忙着不断引领潮流,小公司因为公有云的普及也可以紧跟潮流,反观当前最难受的是那些中型公司,不断思考云原生时代的转型,由于历史的包袱以及公司已经稳定的业务,通常都要开始进行内部统一平台的建设,今天首先简单给大家分享下,整个系统会做成一个...
查看更多

Serverless 时代 DevOps 的最佳打开方式

阿里巴巴云原生 发表了文章 • 0 个评论 • 2917 次浏览 • 2021-03-18 14:29 • 来自相关话题


作者 | 许成铭(竞霄)
来源 | 阿里巴巴云原生公众号

DevOps 简析

传统软件开发过程中,开发和运维是极其分裂的两个环节,运维人员不关心代...
查看更多

KubeNode:阿里巴巴云原生 容器基础设施运维实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 2985 次浏览 • 2021-03-11 15:15 • 来自相关话题


作者 | 周涛  阿里云技术专家
来源 | 阿里巴巴云原生公众号

阿里巴巴节点运维的挑战

在阿里巴巴的场景下,做节点运维面临的挑战主要来自于这几个...
查看更多

应云而生,幽灵的威胁 - 云原生应用交付与运维的思考

阿里巴巴云原生 发表了文章 • 0 个评论 • 2513 次浏览 • 2021-02-26 10:22 • 来自相关话题


作者 | 易立  阿里云资深技术专家
来源|阿里巴巴云原生公众号

本系列文章:
查看更多

申通快递 双11 云原生应用实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 2519 次浏览 • 2020-11-25 14:07 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... f9...
查看更多

OpenKruise:阿里巴巴 双11 全链路应用的云原生部署基座

阿里巴巴云原生 发表了文章 • 0 个评论 • 2355 次浏览 • 2020-11-24 14:08 • 来自相关话题


来源 | [阿里巴巴云原生公众号](http://mp.weixin.qq.com/s%3F__ ... 9c...
查看更多

订单峰值激增 230%,Serverless 如何为世纪联华降本超 40%?|双11 云原生实践

阿里巴巴云原生 发表了文章 • 0 个评论 • 1991 次浏览 • 2020-11-18 13:41 • 来自相关话题


作者 | 朱鹏

导读:2020 年 双11,世纪联华基于阿里云函数计算 (FC) 弹性扩容,应用于大促会场 SSR、线上商品秒杀、优惠券定点发放、行业导购、数据中台计算等多个场景,业务峰值 QPS 较去年提升 230%,研发效率交付提效超过...
查看更多