• [TW] Lead Site Reliability Engineer (Advertising)

    加入威朋

    相信數據 與我們一起走在最前面

[TW] Lead Site Reliability Engineer (Advertising)

Taipei, Taiwan

About Job

  • Vpon 的廣告系統由數十個分佈在不同區域的分散式子系統組成,每天系統需要處理上億筆的流量數據。 SRE 團隊負責維護系統整體的性能以及穩定性,作為帶領這個部門的技術主管我們期待你可以運用你的技術以及管理技能來帶領團隊達到以下目標
  • 確保團隊專注在高效益提升系統穩定度的項目
  • 帶領團隊提高各方面系統的操作,穩定,容錯以及自我修復能力
  • 和其它工程團隊合作打造工具,建立流程規範,提升系統穩定度

About Responsibility

  • 招募,培訓以及維護團隊人才
  • 為團隊提供訓練與技術指導
  • 監控系統效率和穩定性,並且分析解決維運問題
  • 在雲端服務上建立,管理建立並且維運現有的服務容器 (Nomad / Consul / Docker)
  • 主動發現並且協助改善系統維運的痛點
  • 協助系統延展性的討論以及設計
  • 支援現有系統的 CI/CD 流程

About You

  • 5 年以上相關領域經驗
  • 對技術的好奇心以及想要充分瞭解的渴望
  • 熱誠於打造工具,儘量將身邊工作自動化
  • 對 Linux 上工具瞭如指掌,並且願意探索 Linux 核心技術
  • 對分散式,多層系統架構有充分的經驗或是瞭解
  • 對各項雲端服務系統(AWS, GCP, Aliyun)上的基礎建設,服務部署以及維運有充分的經驗
  • 良好的 shell scripting 能力