構築中。

名古屋のITインフラお守り係です。ITイベントへの参加記録などを残していきます。

SRE NEXT 2020(1/25・ちょっとだけ寄り道あり)

「SRE 見習い」として参加してきました。

(SRE チーム立ち上げを画策して、1 年目は見事失敗、ただいま再挑戦中の身です。)

sre-next.dev


ちょっと遅めの開始時間だったので寄り道してきました。

(うっかり SRE NEXT 2020 本編で写真を撮り忘れたので、このブログ記事での写真はこれだけです…。)

新橋から豊洲まで、バス(業 10 系統)が出ていたので、バスに揺られて現地に到着。

ヨガが始まった直後に現地入りしました。


今回参加したセッションは以下のとおりです。

資料や当日のツイートが、すでにまとめられていました(ありがたや)。

いつものように実況ツイートしていましたので、ここでは手短に一言ずつ書きます。

  • 地理分散とネットワーク遅延と合意形成。Google SRE 本にも 1 章割いて Paxos が取り上げられてた(確か)とおりこれは重要な問題。
  • SRE に限らず、少人数組織で「1 人が先に走ってワザを身に着ける」スタイルでやっていくと、2 人目以降との「圧倒的な差」が「溝」となってかえってチーム化が難しくなる問題。これをどう解決するのか、自分の中では答えが出ていない(「放任しても勝手に伸びる人」が入ってくるのを待つしかないのか…)。
  • キャパシティプランニング、「推測より実測」のための仕組みづくりが素晴らしい(やってみたい)。
  • たとえ数年程度でも、ある程度「歴史」があって力量のあるメンバーがいると、その人たち頼みでトラブル対応がうまく回ってしまい、かえって仕組化が遅れる問題。↑で挙げた「2 人目がなかなか出て来ない」問題に通ずるものが。「結果だけ見ていてはいけない」典型例か。
  • 「数年」を超えてもっと歴史があるサービスに SRE を組み込む難しさ、すごくわかる(つらい)。
  • セキュリティも幅広い知見とサービス各層への関与が必要な分野なので、やっぱり SRE が取り組むべき、となってくるのかな…(なんとなく予感はしていた)。
  • ポストモーテム大事。そして、「人に原因を求めない」、大事。
  • デプロイ頻度、仕組みづくりとともに、組織風土や文化についてフォーカスした話も聞きたい。
  • 「SRE」もいろいろ。定義に縛られすぎないようにしたい。
  • 全体を通して振り返り。SLI/SLO とエラーバジェット(を導入する意味を組織の人たちに理解してもらうこと)はやっぱり大事だな、と実感。周囲に理解を得られるまでの道のりは険しい。

懇親会は、特に企画などのない純粋な「懇親会」だったので、かえって新鮮な感じがしました。これはこれで良いです。

ちょっと疲れましたが、いろいろ考えさせられながらも最後まで楽しんだ一日でした。