こちら↓の後、
#mysqr_jp 終了後、みなさんと食事して途中離脱、ただいま #yurusre 会場を目指して銀座線で移動中。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
(ちょっとタグを間違えていますが)移動して、こちら↓に参加しました。
当日の様子(togetter まとめ)
個人的な SRE の活動への興味・関心は?
実のところ、SLI/SLO を定めてエラーバジェットやバーンレートで管理して云々…というのは、信頼性と機能追加・改善のバランスを取ってサービスを進化させていく有効な手法ではあると思いますが、それが唯一のやり方だとは思っていないしそこに特にこだわりもありません。
個人的な興味はむしろ「現場で生じている問題にどう立ち向かってサービスの信頼性を確保しているのか?」だとか「機能追加・改善を大きな障害なく回しているのか?」のほうであり、理想形の話よりそちらに興味がありました。
そういう意味ではドンピシャな内容の勉強会に参加できました。
それぞれのセッションについての感想など
「家族アルバム みてね」を支える SRE のこれまでとこれから(伊東 宏起さん)
- SRE チームの立ち上げまでとその後の流れにイメージがつきやすかった
- これから取り組む場合の参考にしやすい
- ファイルアップロード・ダウンロードがキモになるサービスなので一般的な Web のサービスと比べて S3 周りのケアに注力している点がポイントに感じた
- サービスごとの特徴・特色に合わせた対応は大事
サービス開始が2015年4月、SRE組織立ち上げが2018年2月。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
それまでの間、インフラの問題は開発者が都度対応。#yurusre
SREは3名でスタート。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
開発者が開発に集中したい…さっきの説明の状況であればわかる。#yurusre
IaCもログ基盤も大事。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
ユーザー数もそうだしアプリケーション数や機能が増えても開発の難易度が上がる。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
クラウド移行による DevOps の実践 : アプリケーションエンジニアとインフラエンジニアの協働から SRE へ(渡辺ももさん)
- 「オンプレからの移行」の難しさを思い出した
- 自社も同じように 10 年 over モノのサービスをオンプレ→ AWS 移行したので
- 「Dev と Ops の壁」は自分自身では感じたことはないけれど、世の中的には良くあることだと思う
- 同じような課題を抱えているケースで参考になりそう
- 「越境文化」大事
リブセンス、思ったほど人が多くない。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
マッハバイトのクラウド移行。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
移行もマッハが求められそう(たぶん違う)。#yurusre
オンプレのサーバールームの移行をしようとすると電源も回線も床耐荷重も引越し時の動線も…とか考えることが多すぎて夜しか眠れない。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
「VM構築にn営業日」そういえば昔はよくあった光景だ(もう絶滅したとは言っていない)。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
モブプロが嫌いな人がまわりに結構多いので、うまく取り入れられる方法を知りたいな。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
AI の新時代:Azure OpenAI Service の運用ガイド(若松 晃洋さん)
- 「ゆるい勉強会のゆるくない話」
- 確かにスロットリングによる不意なサービスの停止とかキツい
- メニューにはあるがメニューどおり提供されていない機能があったりとかも
- まだ定まっていない部分が多い、進化(変化)の激しい LLM を使うが故の苦労
- いずれ落ち着いて利用しやすくなるはずだけど、早く取り組むことに意味がある
TPMとRPMの上限管理、頭が痛いやつ。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
(これもどこかの勉強会で最近聞いた)#yurusre
複数リージョン活用で上限を増やす策、リージョン間で利用できる機能のバージョンアップタイミングが違う場合運用が破綻しそう。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
「使えます(実は使えません)」#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
うっかり不正を疑われて誤banされたら詰む。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
海外保存できないデータとかあるとつらい。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
予期せぬアクセス急増、その謎に迫る:私たちの対応と解決策(Toshiya Kato さん)
- 「何もしていないのに急にエラーが」怖い
- 「急にエラーが出た」原因が Android の新機能
- 「正面から対処」以外にリスクを受容しつつ比較的容易な対処で済ませる手もある
- 頭の片隅に置いておきたい
DB Connection Error発生。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
不穏。#yurusre
Android 11の機能が予期せぬDDoSを起こす!#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
キャッシュなのかキューなのか。
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
…という以前のところでDBアクセス自体を削除した。#yurusre
リスク受容も一つの選択肢。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
ログ見るの大事。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
少人数開発チームで取り組む SRE(篠田 北斗さん)
- 「ISUCON いいぞ」の話
- 個人的には感想戦しかやってないのでいつかは…
- SadServer もいいぞ
土曜日のISUCON夏祭り、Security-JAWSと被って参加できなかった。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
身のまわりに一緒に参加しそうな人いないなー。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
SRE 夕会の効果(aboy さん)
- エラー調査、みんなで集まってやろう、の話
- やっているうちに技術的な知識だけでなくドメイン知識も付く
- わかる
「エラーを放置せずに」
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
割れ窓を作らないの大事!#yurusre
個人的に、たまには効率よく調査、ではなくて各々が調べて(たとえ調査対象に重複があっても)持ち寄るのも良いかもしれないと思ってる。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
「みんなで」「個々で」をうまく組み合わせるのが良さそう。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
Datadog 入れてみたら AWS の料金が爆発した話(ryuke さん)
- Datadog logs 単価高いからなー…と思ったら NAT Gateway
- あるある
- 会場の反応のシンクロ率の高さ
- 会場の共感度が最も高かった瞬間
監視強化のためにログを大量に吐き出すと…?#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
「NAT Gatewayを通って…」
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
会場「あ〜」#yurusre
コストについては「毎日見る」だけじゃなくて「毎朝消費金額をSlack通知する」という話を今朝聞いたような。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
SRE チームの定例、色々やってるのでアジェンダと確認ポイントをまとめて紹介(あんどぅさん)
(資料未確認)
- 安定の内容
- オチ不要
- こちらは夕会ではなくて朝会
- 異常検出や他チームの状況など
- 組織に合った方法でできればどちらも良さそう
今日はオチなし!#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
確かにこういうのは持ち回りだけじゃなくて一定のタイミングでみんな揃って見たほうが良さそうだなー。#yurusre
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
— hmatsu47(まつ) (@hmatsu47) 2023年8月28日
交流タイム
帰り(新幹線の終電)の時間を気にしながらだったので少し早めに帰ってしまいましたが、自社とは違う文化の組織で働く皆さんの話に良い刺激を受けました。
冒頭の話の繰り返しになりますが、理想論ではなく現実と向き合う話が多かったので、特にそう感じました。
(なお、先に会場を出たものの、建物の中で出口を探して迷ったのは内緒です)
勉強会の開催に関わられたみなさま、参加者のみなさま、ありがとうございました!