Webシステムの信頼性は、いまや企業と組織の信頼性にも大きな影響を及ぼしています。そのシステムの信頼性を確保するのがSRE、つまり「サイトリライアビリティエンジニア」と呼ばれる職種、あるいは「サイトリライアビリティエンジニアリング」という技能、活動です。
本書は、自身もSRE/DevOps/システム管理の分野で40年のキャリアを持つ筆者による、個人がSREになるための、また組織がSREを導入し、発展させるための指針を平易かつコンパクトにまとめた書籍です。
「SREとはどのようなものか」「SREになるには何をすればよいのか」「SREを導入するにはどのように始めればいいのか」「するべきこと、避けるべきこと」といった、SREにまつわるさまざまなトピックを幅広く解説します。
SREという技能/概念をゼロから学びたい人、SREを目指すエンジニア、またSREを組織に導入することを検討している、導入したけれど思ったより上手く行っていない組織や企業にとって、多くの発見のある書籍となるでしょう。
「訳者まえがき」より
本書は “Becoming SRE: First Steps Toward Reliability for You and Your Organization” (2024年、O'Reilly Media、ISBN9781492090557)の日本語訳です。
日本では、『SRE サイトリライアビリティエンジニアリング』(2017年、オライリー・ジャパン、ISBN9784873117911)(以下、SRE本)が出版された頃から、「サイトリライアビリティエンジニアリング」(以下、SRE)が広く知られるようになりました。それから7年が経過し、日本においても多くの企業がSREの実践に取り組むようになりました。しかしながら一部では、SREという名称だけが独り歩きし、その実態が本来意図するところとは違った取り組み方になってしまっている事例も見受けられます。
SRE自体は、Google社内で2000年後半より発展し、そこから先の書籍の出版まで、およそ10年の期間を経てから初めて一揃いのプラクティスが公開されました。一方で、DevOpsが同様の期間にコミュニティで広く議論が交わされ、主に開発プロセスに注目した形で多くの共通認識が持たれるように成りました。結果として、SRE本が登場して、突然多くのプラクティスが公開され、これまでDevOpsを実践してきた人々に驚きや歓迎とともに混乱ももたらしました。特に混乱や誤解をもたらす理由となったのは、SREとして紹介されたプラクティスがDevOpsの文脈でも紹介されてきたことがあったことです。これにより、中には「要するにDevOpsを新しい呼び方をしただけのものであろう」という認識をされる人もいました。さらに裾野が広がると、運用全般を指してSREと呼ぶような事例も多く見かけるようになりました。
SREという言葉が定義され、その言葉が定着してるいうことには意味があります。SRE本では、Googleが意図するものを自社での事例をもって紹介していました。しかしその内容が読者の環境と大きく違うことから、Googleのような企業でなければ実践できないものとして誤解されてしまうこともありました。これは日本に限った話ではありません。訳者がSREの国際カンファレンスやコミュニティに関わる中でも、似たような状況が至る所で起きているのを多く目にしました。そういった背景と、SREの実践の敷居を下げるための資料が少ないことから、原著者は本書を書き下ろしました。原著者が編集した『SREの探求』もそうですが、原著者の需要を捉える嗅覚と、その需要を満たすための実行力には感服するばかりです。
訳者として本書が、類推からの早合点ではなく、皆さんが本来の意味でSREを理解し、咀嚼することの助けになることを願っています。そして、皆さん自身、さらに所属するの組織へのSREの適用が、本書によって促されることを期待しています。
クエリは流れ、ページャーは沈黙を守らんことを。