正社員
【具体的な業務内容】
■プロダクトチームへのSLO導入・ 運用の仕組みの構築
・プロダクトチームに対して、サービスレベル目標(SLO)の概要や意義・重要性についてのオンボーディング、及び導入支援
・SLOを効果的に導入・運用するためのSLO定義やアラート設定用Terraformモジュールの作成・整備
・SLOの達成度を定期的に評価し、信頼性向上のための改善策をプロダクトチームと協力して実施
■アラート/インシデントマネジメントの仕組みの構築
・プロダクトチームが自らアラートに対応できるよう、通知の仕組みを構築・改善
・Runbookの作成および各アラートの優先度や通知先などの基準を整備し、アラートの標準化を推進
■オブザーバビリティの向上
・システムの監視やトラブルシューティングに必要なログ・メトリクスの収集方法の整備
・収集したデータを可視化し、リアルタイムでの状況把握やトラブル発生時の迅速な対応を可能にするダッシュボードの構築
・収集したデータから、異常検知や障害原因の特定に役立つアラートの設定やチューニング
・収集したデータを分析し、システムのパフォーマンスやセキュリティ、ユーザー体験などの改善につながるインサイトの発掘
・オブザーバビリティ向上に必要なツールや技術の調査・導入、および既存ツールの改善やカスタマイズ
■キャパシティプランニングの改善
・サービス特性(トラフィックパターン、ピーク時など)の分析から将来的な利用量の予測、リソースの調達
・アーキテクチャやインフラを評価、プロダクトチームに対して改善提案
・ドキュメントによるプロダクトチームへの共有、それらの自動化
■プロダクトチームに対する SRE 文化の Enabling
・プロダクトチーム横断の委員会活動を通じ、プラットフォームへの課題感の吸い上げ
・プロダクトチーム内のトイル比率の可視化及び削減の支援
・プロダクトの運用・保守をよりスムーズにするためのドキュメンテーション作成や整備
・開発プロセスやシステム構成の見直しや最適化に向けたアドバイスや支援
【ビジョン/ミッション】
プロダクトチームがStream-Aligned Teamとしてソフトウェアライフサイクル全体を一貫してドライブできる世界を実現する。
同社ではユーザーに直接価値を届けるチームはプロダクトチームです。そのプロダクトチ…
募集職種 |
ITエンジニア系(ソフトウェア、ネットワーク) > 運用、監視、テクニカルサポート、保守 > サーバ運用、保守 ITエンジニア系(ソフトウェア、ネットワーク) > 運用、監視、テクニカルサポート、保守 > マシン運用、保守 |
---|---|
雇用形態 | 正社員 |
勤務時間 | - |
勤務地 | 東京都 |
交通 | - |
給与 | 年収 600万円~1000万円 |
待遇・福利厚生 | 経験・スキルに応じて変動します |
休日・休暇 | 完全週休二日(土日) |
応募資格 | 【必須要件】 ■AWS,GCP,Azure などのクラウド技術を用いたシステム設計・構築・運用経験 ■Docker, Kubernetesを利用したサービスの運用経験 ■IaCを用いたインフラ構築の経験 ■Datadog等何らかのSaaSを用いた監視・運用経験 ■Site Reliability Engineering に関する基本的な知識の保持 |
---|---|
応募方法 | このページ内の「応募」ボタンよりご応募ください。
|
選考プロセス | - |
かんたん登録で、お仕事探しがらくらくスムーズになる
転職EXに会員登録しよう!
転職EXの会員登録をすると、以下の便利な機能がすぐにご利用になれます。ぜひご利用ください。
新規会員登録 (無料)気になるリストに保存できる件数は20件までです。
20件以上保存するにはログインが必要です。
ログイン後は、今までログイン中気になるリストに入っていた案件も見ることができます。