インフラ

Elastic Stack(ELK Stack)

Elasticsearch(検索エンジン)・Logstash(ログ集約)・Kibana(可視化)をセットで使う仕組み。ログを一元管理し、自由に検索・グラフ化する強力なシステム。世界中で使われるオープンソースの定番なので、構築コストを抑えられ...
インフラ

スプランク(Splunk)

ログを大量に集めて検索や可視化ができる商用ツール。グラフや警告設定も充実していて、大規模企業のログ運用で活躍している。工場の監視室でモニターいっぱい並べてるイメージ。トラブル時も原因を絞り込みやすいんだ。
インフラ

ログパース

大量のテキストログを分析しやすい形に変換すること。レシートの山をExcelにまとめるイメージ。日時やエラーコードなどを抜き出して、必要な部分だけテーブル化すると後で検索やグラフ化がしやすくなるんだ。
インフラ

ゼロダウンタイムデプロイ

ユーザーから見て一切の停止がないように新バージョンをリリースするやり方。学校で昼休みも授業を切り替えて続ける感じ。Blue/Greenデプロイやカナリーデプロイなどを活用して、古いのと新しいのをうまく切り替える。
インフラ

ダウンタイム

システムが止まっていて使えない時間。お店の閉店状態でお客さんが入れないのと同じ。できるだけダウンタイムを短くするために、Blue/Greenデプロイやフェイルオーバーを使う。休業ゼロで回せるのが理想だけど難しい場合もある。
インフラ

カットオーバー

新システムに切り替えて本番運用を開始すること。リハーサルを重ねたあと、「じゃあ今日から新しいシステムを使いましょう!」と行うタイミング。お店の新装開店みたいな大事な瞬間で、失敗しないよう前後の手順が重要なんだ。
インフラ

トイル(Toil)

SRE用語で「人間が繰り返しやってる、価値を生まない重労働」を指す。たとえば定期的なサーバー再起動など手動でやってると時間の無駄だから、自動化して解消しようという考え方。学校の水やりを自動スプリンクラーにするイメージ。
インフラ

オブザーバビリティツール

ログ・メトリクス・分散トレースなどを総合して可視化するソフト。試合中の選手の心拍数や走行距離をリアルタイムで見られる感じ。システムの中を覗き込み、問題の兆候をいち早く捉えるのに有効なんだ。
インフラ

DRテスト

災害時に切り替えがちゃんと動くか実際に試してみる演習。学校で避難訓練をするのと同じで、いざ災害が起きたとき正しくフェイルオーバーできるか確かめるためにやる。普段からやっておかないと、いきなり本番は不安だよ。
インフラ

OpenID Connect

SNSアカウントでログインする“ソーシャルログイン”なんかに使われる標準プロトコル。例えば「Googleでサインイン」すれば、Googleが「この人はちゃんとログイン済みです」とお店に証明してくれる。ユーザーにとってはIDが増えなくて便利だ...