Google SRE 可能不適合你?

三肖中特图特码早公开 www.bsmte.icu 為促進社區發展,運維派尋求戰略合作、贊助、投資,請聯系微信:helloywp

莎士比亞的《麥克白》中有三位女巫唱道:“不辭辛勞不厭煩,釜中沸沫已成瀾;”,正如她們的警告得到的原比你想要的更多。該詩句十分適用網站可靠性工程師(SRES)。

盡管SRE的工作角色通常被直接定義為自動化,但事實上59%的SRE認為他們的組織中有太多的累活(定義為手動、重復、線性規模的策略性工作)。根據188名擔任SRE職務的員工的調查回復,Catchpoint的第二份年度SRE報告出人意料地發現,近一半(49%)的SRE認為他們的組織沒有使用自動化來減少工作量。

SRE經常受到DevOps的啟發,對自動化有很高的期望。然而,兩者之間存在著關鍵的區別,SRE的職責更接近于與系統管理員相關的職責。雖然SRE具有自動化和創新的能力,但往往因關注歷史事件管理和可靠性而成為IT運營的負擔。

資料來源:2018年SRE報告?

根據去年的報告,盡管自動化是SRES所需要的最高技術技能,但現實情況是,編寫新腳本或創建改進的基礎設施配置并不能總是消除IT運營的日常責任。事實證明,自動化CI/CD流程只是許多SRE職責之一。

另一個責任是響應“事件”,通常定義為服務中斷。52%的受訪者每周處理一次以上的事件,這些事件會產生很大的壓力,因為它們會影響客戶滿意度,而且可用性是衡量SRE成功的方法。

可用性是用于定義SRE角色“可靠性”部分的關鍵“指標”。四分之三的SRE說他們的組織有服務水平目標(SLOs),而在這個群體中,幾乎每個人都說可用性是被追溯的。最終用戶也會利用延遲和響應時間的經驗,但不會經常使用。

監控服務提供商和微調應用程序的性能可以減少事件的數量并使組織接近99.999%,這意味著一年只有5分鐘的?;奔?。然而,盡管有AIOPs或人工智能的承諾,但大多數事故不能自動排除。

雖然最受關注的是事故,但對SRE來說更多關注的可能是收到的非緊急告警的數量。27%的受訪者表示,非緊急信息是他們“辛苦工作”的首要來源,而只有15%的受訪者提到了電話通知。

SRE不僅僅是優化IT運營的專業人員,,但僅關注可用性意味著他們通常無法承擔他們正在努力解決的工程挑戰。

來自其他報告的上下文?

?事件會在開發人員和IT運營之間產生摩擦:四分之三的開發人員更愿意由應用程序開發團隊負責處理重大事件。根據2018年Atlassian的一項調查,其中的根本原因是軟件開發人員更了解錯誤,因為與IT團隊來回溝通需要花費太多時間。然而,集中式IT運營團隊的成員幾乎同樣強烈地認為他們應該帶頭負責,而且大多數C級高管都同意這一點。三分之二的受訪者確信軟件開發團隊參與所有重大事件的所占不到半數,因此C級主管可能是對的。

?AIOP只是解決方案的一部分:OpsRamp進行的一項調查發現,四分之三熟悉AIOP的高管認為,這種工具的主要目的是消除繁瑣的手動任務。然而,80%的受訪者表示,不到半數的事件是重復發生的?;瘓浠八?,它們不能通過自動化直接解決。

原文鏈接:https://thenewstack.io/sres-wish-automation-solved-all-their-problems/
譯者介紹:陸明,近二十年制造業IT相關從業經歷,主要從事基礎設施建設和運維工作,對IT服務管理及信息安全也有涉及。
公眾號出處:云技術

網友評論comments

發表評論

電子郵件地址不會被公開。 必填項已用*標注

暫無評論

Copyright ? 2012-2019 www.bsmte.icu - 運維派 - 粵ICP備14090526號-3
掃二維碼
掃二維碼
返回頂部
和值大小单双算法技巧 快三跟计划怎么稳赚 大乐透近100期走势图表 稳定长期稳赚注码法 二人麻将技巧之猜牌技巧 捕鱼达人2无限金币破解版 胜负彩 91计划pk10全天计划 北京pk赛车6码倍投表 21点手机游戏 黑龙江时时综合走势图 三分pk10手机计划软件 六肖怎样算中奖 麻将下载 pk10计划下载 幸运飞艇人工计划聊天室