度小滿陳存利:20年老“司令”聊運維、績效、成長

度小滿陳存利:20年老“司令”聊運維、績效、成長

通過采訪和約稿的方式,請運維領域老炮輸出深刻洞見,共同碰撞,以期形成一些先進的共識,推動行業更好得前進。

這一期我們邀請到的是陳存利,度小滿系統運維部總經理,20多年的職業生涯中絕大部分時間在互聯網領域。在百度運維部期間由于帶隊風格過硬,兄弟團隊稱其為”陳司令”。今天我們請“陳司令”來聊聊他的觀點。

這里是接地氣、有高度的《???運維百家講壇??》第 5 期,開講!

問題預覽

  • 您很早加入了百度,后來隨度小滿獨立,我們了解到您身邊有許多員工其實是很長時間一直跟隨著您,經歷了很多業務的運維考驗,相信大家都很感興趣,在運維這個辛苦的崗位上,如何能凝聚一群人一直走下去,想聽聽您的心得。
  • 很多人認為工程師不寫代碼就沒有價值,這個問題你怎么看?對于不寫代碼的工程師應該如何持續提升自己,你有什么建議嗎?
  • 您在百度和度小滿經歷了大小很多業務的發展和起伏,您認為不同階段和不同體量的業務運維在理念和方法上有沒有什么差異?是否有一些原則性的方法論指導做出決策?
  • 您覺得當下,運維行業有沒有哪些普遍做法其實是錯的?為什么?
  • 當下一些火熱的技術方向,包括FinOps、可觀測性、chatgpt等,您對這些技術方向的發展有什么看法,是炒概念還是有真價值,運維人員是否應該做出什么樣的應對舉措?
  • 隨著云的發展,傳統的只做Ops的運維崗位長期來看必將消亡,您是否認可這個觀點?對于這類朋友的轉型路徑您有沒有什么建議?
  • 很多朋友在脈脈上吐槽公司績效打分不公平,您對他們有沒有什么建議?另外您作為管理者,能否分享一下您是如何設計績效考核機制的?

采訪實錄

問:您很早加入了百度,后來隨度小滿獨立,我們了解到您身邊有許多員工其實是很長時間一直跟隨著您,經歷了很多業務的運維考驗,相信大家都很感興趣,在運維這個辛苦的崗位上,如何能凝聚一群人一直走下去,想聽聽您的心得。

答:我理解你們這是在夸獎我,我深表感謝。

2000年創業做計算機培訓開啟了我職業生涯,后又在國企工作3年,2004年在北京開啟我的互聯網相關工作生涯?;仡櫸?0多年職業經歷,很多都是從零組建團隊,因此運維類部門里工作過的同事應該超過千人,和我并肩打過幾次硬仗的兄弟也有300-400人,18年在小滿,再次從零組建了現在的團隊,一直走到今天。其實每次離開原有團隊和同學從零組建新團隊是痛苦和傷感的事。但看到很多過去的同仁,現在的工作和生活狀態都很好,部分人離開我的團隊后自己挑戰行業極限非常成功,當然賺的也比我多,我內心也替他們高興。

如果說我帶團隊有啥特點,我總結有3點:

  • 首先,我們很重視團隊文化。 每個新人入職的第一天就告訴他們我們團隊的愿景要成為是“全球頂尖的技術保障團隊”,團隊核心成員的夢想是“用技術重新定義服務保障,讓服務保障更簡單”。我們招大家來不是來填坑的,招大家來就是為了改變,用技術去改變現實工作中的不合理之處。 有個小故事對我個人影響很大,今天也分享給大家:北方的早晨,母親送孩子去上學的路上等紅綠燈,這時旁邊一位清潔工老人在辛勤的工作,這時母親為了教育孩子說:“你看清潔工爺爺他們每天那么辛苦,你可得好好學習,學習不好長大了就只能當清潔工掃大街了?!蓖瑯訄鼍?,另外一位母親教育孩子的語言就很觸動我,她說:“孩子,你看清潔工爺爺每天很辛苦,你要好好學習,將來發明出掃地的機器,讓所有人不要再辛苦的人工清理街道”,這個故事很觸動我,有些崗位的工作總是需要人去做的,我們做了就要做得不一樣,要用技術去改變它,讓未來的人不再那么難。
  • 其次,我們很注意人才的培養,分階段不同方式的來培養。 我們認為工作都是人來做的,只有提升這些人的能力才能做出不一樣的工作。我在2015年的時候總結了一套5-7年工程人才的培養機制。 這套機制里邊把人分做3個階段,第一階段是剛入職場的人,這類人前兩年主要歷練工作方法,技術深入的能力和成功的經歷,這里每一項都很重要。隨后他們將進入第二個階段,我們會通過2-3年提升綜合視野和實踐能力,現在的計算機工程涉及太廣,從網絡到操作系統,到內核再到應用和數據庫存儲等等,一名優秀的工程師在架構設計和故障排查時應當每個方向都有所涉獵,如果只看材料沒有實踐的經歷,會到處碰壁,在這個階段我們會有計劃的讓人員輪崗,每個方向都歷練一段時間,當然也會征求他們個人的意愿,通過輪崗歷練后,我們認為這些人技術通常不是問題,那么就進入第三個階段,在第三個階段我們會和他們協作,讓他們選一個自己喜歡并擅長的方向,一起去挑戰行業極限,共同一起成長。當然,這個階段離開的人也會比較多,因為他們能力強了,在外面也很容易獲得有挑戰且自己喜歡的方向,通?;貓笠矔浅:茫页8麄冋f,你們很多人未來都會比我走的更遠,到時別忘了我們,做事要積極、正向,別給我們一起奮斗過的團隊和人丟臉。
  • 最后,我們很關注團隊人員的多樣性和協作。 復雜的工作通常都不是一個工種可以獨立完成的,我們把運維看做是一種技術保障,要想做好這個保障,必須從運維場景分析、運維能力提升、運維產品創新開始,對應的產品、研發,運維,運營是都必不可少的。這就好比軍隊的一個特戰隊,要有通訊員,衛生員、火力小組,狙擊小組等,要根據團隊需求尋找合適的人,并保證他們的協作效率,要在實踐和團建中建立信任,做到坦誠相待。

問:很多人認為工程師不寫代碼就沒有價值,這個問題你怎么看?對于不寫代碼的工程師應該如何持續提升自己,你有什么建議嗎?

答:這個話題可以參考軍事管理,大家給我一個綽號叫“司令”,這可能跟我工作中喜歡經常用軍事的方法來做參照物有關,在我看來,這個問題就和軍人要不要上戰場開槍是一個道理:軍人要懂基本武器的使用,最好還有定期的鍛煉,當然也不是所有的軍人都拿武器去拼命才能打勝仗,打仗打的是后勤補給,打的是武器的先進性,打的也是正義,不論做后勤、做武器研究、還是做宣傳的人,都是戰爭必不可少的一部分,但無論在哪個崗位,都應該把崗位職責做到極致,剩下的要交給戰爭的指揮者。所以回到這個問題上,我理解工程師首先要了解好自己崗位在公司的定位,再結合個人自身的定位,盡量做到二者匹配,如果不匹配的話,還是換到匹配比較好。

問:您在百度和度小滿經歷了大小很多業務的發展和起伏,您認為不同階段和不同體量的業務運維在理念和方法上有沒有什么差異?是否有一些原則性的方法論指導做出決策?

答:這是一個很好的問題。不同體量的工作遇到的困難是完全不一樣的,維護10000臺機器面臨的困難和維護100臺機器面臨困難完全不一樣。

在維護100臺機器的時候,我們可能還不太需要一個快速發現機器故障并自動修復的工具,因為按行業機器故障率,靠體力就可以完成,且人們會覺得剛剛好,既不是很累,又有事干;但維護10000臺機器的時候,如果只依賴人工,每臺機器的巡檢就忙不過來,再加上跟供應商和業務協調維修時間,我們會忙到忘記吃飯。所以我給的建議是如果想生活和工作做好平衡,小公司就很好,如果要提升自己的技術能力和視野,肯定要去大規模大流量,這樣才能鍛煉自己。

再談另外一個話題,業務在不同的發展階段有不一樣的業務目標,那對應的運維的理念和方法也有很大的差異。很多公司初期能活下來就不錯了,他們會希望快速部署上線,因為業務得搶市場,只有先活下來才能繼續發展,所以很少考慮長遠的規劃。這個時候運維上來就跟老板說,我們應該考慮未來十年的業務增長,結合業務增長需求來構建基礎設施,這是不現實的。但如果一個業務已經有了幾百萬,甚至幾千萬的核心用戶,那么大概率業務會關注最終用戶的體驗,此時運維要圍繞用戶的最終體驗來設計整個底層架構和設施,所有提升用戶體驗的工作都會獲得老板的支持。當然老板還會關注投入產出的成本,是否可持續(業務增長速度和資源投入的比率)等其它問題。還需要注意的是,不同行業間差異也很大,比如金融和互聯網之間,就存在巨大差異。

總結起來可以概括為:技術是服務業務的,所有能夠幫助業務發展的技術,都會獲得資源的支持,無論什么工作,都需要從“如何讓公司變得更好”這一角度出發思考,公司好,你才會好,你所在的團隊好,你才能好。

問:您覺得當下,運維行業有沒有哪些普遍做法其實是錯的?為什么?

答:我暫時沒有深入的思考過行業有什么做法是不對的,每家都有自己的現實問題,不好評價。

不過,有一點我想提一下,我從沒有把自己限制在運維工作上,運維是我擅長的領域,是幫助公司守住用戶基本連接體驗的基礎,但我通常更關注公司的業務現在急需什么?公司最核心的用戶他們需要什么?他們需要什么我們就優先做什么,因為在我的視角里,保障服務穩定的工作,每家公司都欠了非常多的債,需要慢慢還。

問:當下一些火熱的技術方向,包括FinOps、可觀測性、chatGPT等,您對這些技術方向的發展有什么看法,是炒概念還是有真價值,運維人員是否應該做出什么樣的應對舉措?

答:我個人覺得這些方向都很好,如果大家只放在嘴上談談,那就是炒概念,只有實際做出來,才是先進的生產力。這些內容過去在百度時就做出不錯的效果,或許在一個體量很大的環境里更容易實現,因為對應的數據量、人才厚度都會更充足。但如果有人只有100臺機器,還談FinOps,那可能真是炒一炒概念,其他也同理。

問:隨著云的發展,傳統的只做Ops的運維崗位長期來看必將消亡,您是否認可這個觀點?對于這類朋友的轉型路徑您有沒有什么建議?

答:運維的崗位不會消失,需求也會越來越重,但是否是人來做確實需要好好想想了。

一個軟件工程中,運行維護是非常關鍵的環節,但這個環節是人來做,還是機器來做,要看科技的發展,就跟上面談到的掃大街一樣,只要有大街在,有人生活,掃大街這個需求是不會消失,且很旺盛,但替代的可能是無人的機器,現在已經逐漸替代為由人駕駛的掃路車。 我們要意識到這一點,同時也要認識到另外一點,運行維護是一個極其復雜的事情,它遠比掃路復雜,從云服務這么多年的成熟過程大家就能感受到,這是一個漫長的過程,我更建議這個運維自己革自己命的過程,由運維自身來主導和設計,最終我們會成為“運營維護”這個產品的擁有者。

問:很多朋友在脈脈上吐槽公司績效打分不公平,您對他們有沒有什么建議?另外您作為管理者,能否分享一下您是如何設計績效考核機制的?

答:這個話題比較敏感,也是運維同學非常期待討論的話題,所以下面觀點只是我個人職業生涯的經驗,不代表任何公司觀點。

以下是我個人感悟,績效是自己賺來的,談你績效好不好,就要看你為公司帶來多少突出的業績貢獻,你通過自己努力讓自己的本職工作發生哪些質的變化,績效通常是相對的排序,因此是相對公平,很難做到絕對的公平。

我們在談論績效的時候不妨和公司的老板們換位思考下,一個是為公司賺錢的,一個是為公司守住基本用戶體驗花錢的,只有賺來更多錢才能給大家發工資,因此結果顯而易見。

當然這也和大家吃的苦不一樣有關,有人說人生有五種苦,第一種是體力的苦,強調拼加班,很多傳統運維工作都能吃這個苦;第二種是思考的苦,拼的是你布局的周密性,做事的精細程度;第三種是耐得住寂寞的苦,要一個人不斷的默默的學習很多知識,人家吃喝玩樂的時候,他自己耗費了大把時光在不斷地學習新知識;第四種是尊嚴的苦,為了陪客戶老臉都不要,見誰都是自己的祖宗一樣點頭哈腰的伺候;第五種可以讓大家去猜一猜。不要說自己什么苦都能吃,不同角色吃的苦不一樣,有個好的心態是身體健康的基礎。

最后,我祝愿大家都能通過自己的努力獲得好的績效。以上觀點只是我個人經驗,不代表任何公司。

擴展閱讀

  • ??運維百家講壇第4期:又拍云邵海楊:25年linux老兵聊devops八榮八恥??
  • ??運維百家講壇第3期:快貓來煒:如何把運維的飯碗端穩??
  • ??運維百家講壇第2期:作業幫聶安:運維如何轉型,聽聽作業幫的OPaS思路??
  • ??運維百家講壇第1期:井源:運維幾何??

關于SRETalk

本公眾號聊SRE相關的話題,方方面面的,主理人是秦曉輝,Open-Falcon、Nightingale 創始研發,極客時間《??運維百家講壇??》作者,快貓星云(創業方向是統一監控、穩定性保障方向,如有需求歡迎聯系我做交流)合伙人。

? 版權聲明
THE END
喜歡就支持一下吧
點贊11 分享