「ZOZO MLOps のチームリーディングとSRE(Engineering)」というタイトルで SRE Next 2020 に登壇しました
1/25(土) に開催された「SRE Next 2020」 という日本では初めて行われる SRE (Site Reliability Engineering) に関するカンファレンスに登壇しました。
2019年4月にチームを新規に発足してから、どのようにチームを率いて成果を上げ、社内の信頼を得てきたのか 、メンバーの成長を促してきたのか、について語りました。
https://docs.google.com/presentation/d/1zEkR9Dm_epg7fxOCFE-asBsUlHDozwObsBEGAILiqic/edit#slide=id.p1
[B6] ZOZO MLOps のチームリーディングとSRE(Engineering)
私は2019年4月にZOZOにMLOpsチームを作り、それから10ヶ月ほどチームをリードしてきました。 その10ヶ月の間にZOZOでは買収も含め色々なことがありましたが、MLOpsチームではZOZO画像検索のリリースを含め、数々のミッションを達成してきました。
本発表では、ミッションを達成できる良いチームを作るために、どのような指針をもって私がチームをリードしてきたのか話します。 また、MLOpsと通常のSRE(Engineer)に求められるスキルセットの違いについて述べ、実際に遭遇した問題を踏まえて、どのようにチームとしてSite Reliabilityを向上させてきたのか話します。
キーワード:
- システムのボトルネックを潰す
- プロジェクト進行上のボトルネックを潰す
- モチベーションコントロール
- 心理的安全性
- 当たり前のレベルを引き上げる
- 神は細部に宿る
- 仮説と検証のサイクル
リーダー自体は前職も含めて数年はやっていますが、今までは技術発表ばかりしてきたので、今回始めて言語化を試みた形になります。特に文化の下りについては、ルールなら明文化すると思うのですが、「文化」なので今まで明文化したことがなく、この機会に明文化してチームメンバーに伝えることができたのは副次的にも良かったと思っています。
また、今回の発表で話した通り「フェーズによってやり方を変える」のを信条としておりますので、フェーズが変わってチーム規模が変わってきたら、今回の発表とは違うやり方をし始めるかもしれません。その時はまたどこかで共有できたら良いと考えています。
いつもやってるような技術発表ではなかったので、実は資料作成に難航していたのですが、Twitter での反応を見る限りでは評判も上々だったようで安心しました。ご査証ください╭( ・ㅂ・)و ̑̑