NEW
正社員
掲載予定期間:2026/2/12(木)〜2026/5/13(水)
【横浜】インフラプラットフォームエンジニア◆本番環境の推論を実行するGPUプラットフォームを担当
■業務内容:
インフラストラクチャエンジニアとして、本番環境の推論を実行するGPUプラットフォームを担当します。クラスタアーキテクチャ、デプロイの信頼性、オブザーバビリティ、キャパシティ管理、インシデント対応メカニズムまでを含め、ハードウェア、モデル、テナント、トラフィックパターンのスケールアップ時でも、プラットフォームを予測可能かつ高信頼に保つことがミッションです。
■業務詳細:
◇GPUクラスタのアーキテクチャ設計および本番運用
プロビジョニング、ノードイメージ管理、ドライバ/ランタイムやGPUプラグイン/オペレーターのライフサイクル管理を担当し、サービングプールおよびシステムサービス向けの標準化されたデプロイパターンを構築
◇本番環境のベースライン定義・維持
ゴールデンノード構成、クラスタ・ハードニング、アップグレードパス、既知の良好な互換性マトリクスを整備し、変更に強い安定した本番運用を実現
◇信頼性を組み込んだ運用設計
SLO/SLI設計、アラート品質向上、運用手順書整備、インシデント対応および再発防止までを含む実効性のあるポストモーテムを推進
◇安全なデリバリーとフリート管理
カナリアデプロイや段階的ロールアウト、ロールバック経路の確保、設定変更のガードレール整備、ノードドレインやGPU隔離、自動修復、計画メンテナンスによるフリート健全性の維持
◇キャパシティおよび利用効率の最適化
スケジューリング制約、ビンパッキングや断片化管理、ウォームプールやオートスケーリングの仕組みを通じて、プロダクト要件と整合したキャパシティ管理を実施
◇異種混在環境・運用基盤の整備
ハードウェア世代やサーバープラットフォーム差異を考慮した運用設計、運用ツールや自動化の構築により、オペレーター効率とMTTRの改善を推進
◇可視化・セキュリティ・横断連携
ゲートウェイからサービング、GPUまでを対象としたオブザーバビリティ基盤を構築し、セキュリティベースラインを確立。ネットワーキングチームや他部門と連携し、高負荷下でも予測可能な基盤運用を実現
変更の範囲:会社の定める業務
【チーム/組織構成】
【その他プロジェクト事例】
【開発環境】
| 募集職種 |
Web、インターネット、ゲーム系 > Web、インターネット関連 > エンジニア(Web、インターネット関連) ITエンジニア系(ソフトウェア、ネットワーク) > 運用、監視、テクニカルサポート、保守 > サーバ運用、保守 |
|---|---|
| 雇用形態 | 正社員
<雇用形態補足> 期間の定め:無 <試用期間> 3ヶ月 |
| 勤務時間 | <勤務時間> 9:00~18:00 (所定労働時間:8時間0分) 休憩時間:60分 時間外労働有無:有 |
| 勤務地 | <勤務地詳細> 本社 住所:神奈川県横浜市西区みなとみらい2-3-1 受動喫煙対策:屋内全面禁煙 変更の範囲:会社の定める事業所 |
| 交通 | <転勤> 無 |
| 給与 | <予定年収> 800万円~1,400万円 <賃金形態> 月給制 <賃金内訳> 月額(基本給):666,000円~1,166,000円 <月給> 666,000円~1,166,000円 <昇給有無> 有 <残業手当> 有 <給与補足> ■昇給:あり 賃金はあくまでも目安の金額であり、選考を通じて上下する可能性があります。 月給(月額)は固定手当を含めた表記です。 |
| 待遇・福利厚生 | 通勤手当、健康保険、厚生年金保険、雇用保険、労災保険 <各手当・制度補足> 通勤手当:月上限15,000円 社会保険:補足事項なし <定年> 65歳 <教育制度・資格補助補足> ‐ |
| 休日・休暇 | 【休日・休暇】 週休2日制(休日は土日のみ) 年間有給休暇10日~(下限日数は、入社半年経過後の付与日数となります) 年間休日日数120日 |
| 応募資格 | <最終学歴>大学院、大学卒以上 <応募資格/応募条件> ■必須条件: ・本番分散システムを対象としたインフラ/SRE/プラットフォームエンジニアリングの経験5年以上 ・本番環境におけるKubernetes(または同等のオーケストレーション基盤)の豊富な運用経験と、実運用のオーナーシップ ・GPUクラスタやその他の高性能コンピューティング基盤(または同等に敏感なインフラ)の運用経験 ・Linux、ネットワーク、分散システムの障害モードにまたがる高いデバッグ能力 |
|---|---|
| 応募方法 | このページ内の「応募」ボタンよりご応募ください。 |
| 選考プロセス | - |
| 会社名称 | 株式会社Unsung Fields |
|---|---|
| 所在地 | 〒220-0012 神奈川県横浜市西区みなとみらい2-3-1 |
| 事業内容 | ■当社について: 当社は、ハードウェアの保守・運用だけでなく、 HPCサーバを利用するための独自のクラウドサービスを提供することでAI開発者のための究極の環境を提供しています。 日本とスリランカの技術を融合し、AI開発を加速させる最適な環境を提供することを目指しています ■事業内容: ・データセンター開発支援 ・データセンター保守、運用 ・データセンター向けクラウドサービス開発、運用 |
| 代表者 | - |
| URL | https://unsungfields.co.jp/ja/ |
| 設立 | 年2024年8月 |
| 資本金 | 3百万円 |
| 売上 | - |
| 従業員数 | 10名 |
| 平均年齢 | - |
| 主要取引先 | - |
転職したいけど、求人を探す時間がない人は、
ITエンジニア(SE・PG)未経験OK♪残業月20時間以下!スキル&キャリアアップを...
株式会社HNS
インフラ・NWエンジニア◆50代、60代活躍中◆平均残業月5時間未満◆約3300社と...
三松システムコンサルティング株式会社
SE■年休126日■残業月平均9時間以下■産育休取得実績有■賞与年2回■本社内に託児...
インフォテクノ株式会社
開発エンジニア(PG/SE)★国内最⼤級アプリ”マンガBANG”運営!フルリモ/家賃...
株式会社Amazia Link
ITエンジニア(SE・PG)★経験2年以上・ブランクOK!リモート◎残業月20h以内...
株式会社HNS
SE/PG◆資格取得報奨金は総額158万円!豊富な制度と福利厚生⇒実家でも受取可能な...
株式会社HomeGrowin
開発エンジニア◆平均残業月5時間未満◆面談対策も実施◆長期案件多数◆3300社以上と...
三松システムコンサルティング株式会社
開発エンジニア◆還元率75~85%◆前給保証・待機給与100%◆年収150万円UP社...
株式会社グッドワークス
【インフラ・クラウドエンジニア★国内最⼤級アプリ”マンガBANG”運営】フルリモ/家...
株式会社Amazia Link
Web開発エンジニア(自社製品開発)/年商3000億グループの安定基盤/残業月平均1...
株式会社ハイテックス
開発エンジニア|9割フルリモ|残業月10h|有給の完全消化可|大規模・長期案件メイン...
株式会社アンドフラッグ
自社製品の開発PM/年商3000億G×5名体制/寮社宅あり/家族手当あり/フルフレッ...
株式会社ハイテックスかんたん登録で、お仕事探しがらくらくスムーズになる
転職EXに会員登録しよう!
転職EXの会員登録をすると、以下の便利な機能がすぐにご利用になれます。ぜひご利用ください。
新規会員登録 (無料)気になるリストに保存できる件数は20件までです。
20件以上保存するにはログインが必要です。
ログイン後は、今までログイン中気になるリストに入っていた案件も見ることができます。