Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

SREに関するred_tanukiのブックマーク (22)

  • 「SREをはじめよう」を読んで正解がないことを知った

    はじめに 私は現在、ある会社でSREチームのマネージャーを務めています。SREに関する目標、戦略、戦術を考え、実践する立場にあると言えるでしょう。最近、私にとって非常にぴったりなが出版されたので、その感想を共有したいと思います。 このを一言で説明すると、 「正解がないこと(=自分で考える必要があること)とその向き合い方をやさしく教えてくれる」 です。 SREが行うこと SREについて学ぼうとした際、多くの人が最初に手に取るのが「SRE」だと思います。私もその一人で、最初に出会った時、この図を見て「これを実践すればSREができるんだ!」とワクワクしたのを覚えています。 「14章 Dickersonの信頼性の階層構造(良い出発点)」のコラム「Dickersonの信頼性の階層構造では不十分」では、この図を素晴らしいものだと褒め称えつつ、これがSREの全てではないと述べられています。 Di

    「SREをはじめよう」を読んで正解がないことを知った
  • SRE Kaigi 2025を彩る!声優・杉田智和さんがナレーションを担当! - SRE Kaigi スタッフブログ

    こんにちは! SRE Kaigi 2025 実行委員会 広報担当です。 今回は来年1月26日(日)当日について重大発表があります! 声優・杉田智和さんによるナレーション! 当日のナレーションは、なんと声優の杉田智和さんにご担当いただきます! SRE Kaigi 2025でナレーションをご担当いただく杉田智和さん agrs.co.jp 杉田さんは多くのアニメ作品やゲームで活躍されており、その独特のお声とユーモアセンスで多くのファンに愛される実力派声優です。 そんな杉田さんが今回のSRE Kaigiのためにナレーションを収録してくださいました! ナレーションは オープニング セッション紹介 スポンサー様紹介 クロージング など様々な場面で流れます。 カンファレンス全体を通じて、杉田さんの声が会場に響き渡ります。 当日はその特別感をぜひ会場で体感してください! 杉田さんにはお忙しいスケジュールの

    SRE Kaigi 2025を彩る!声優・杉田智和さんがナレーションを担当! - SRE Kaigi スタッフブログ
  • 「SREをはじめよう」を読んで世界が変わった話

    🌟 はじめに 記事は CyberAgent Group SRE Advent Calendar 2024 の13日目 の記事になります。 記事では SWE(Software Engineer)である私が 『SREをはじめよう―個人と組織による信頼性獲得への第一歩』 を読んで、SREについての理解を深めた経験を共有します。エンジニア・非エンジニア・社会人・学生など、さまざまなバックグラウンドを持つ方にとって「必ずどこか心に刺さる部分があるのではないか...!」と思い、是非皆さんにも読んで頂きたいというという思いを込めて執筆しました。 私は普段、SWE として働いていますが、以前から SRE に強い興味を抱いていました。 今年は SRE Next 2024 に足を運び実際に SRE の方々とお話しする機会を得たり、Cloud Native Days Winter 2024 の資料を拝見し

    「SREをはじめよう」を読んで世界が変わった話
  • New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3

    2024.11.19 New Relic User Group OKINAWA VOL.3 https://nrug-okinawa.connpass.com/event/329314/

    New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
  • SREの前に

    2024年11月06日(水) 18:00~19:00の予定に遅刻してしまい、大変申し訳ございませんでした。お詫びとして、当初非公開予定であった資料を公開させていただきます。元々、公開する予定ではなかったので補足が足りない部分などあると思いますのでご容赦下さい。 ブログなどで補足情報出すかもなので気…

    SREの前に
  • DevOps への投資に対するリターンを計算する方法

    DevOps や Platform Engineering, Developer Productivity など、開発活動の生産性を高める活動や分野を指す言葉が広く謳われるようになってきましたが、その活動を始めようと思っても効果について説明するのは難しいなと感じていました。 そんななか、Google Cloud による The ROI of DevOps Transformation という、DevOps 施策の ROI を計算する方法がいくつか紹介されている記事を見つけました。 この記事の内容がそのまま使えるかと言うと判断に困るのですが、面白かったので 1 つの計算方法として紹介していきたいと思います。 前提 Four Keys について DORA の研究によって、Four Keys 指標は組織のパフォーマンス(収益性、品質、顧客数、満足度など)に相関関係があることが分かっています。 F

    DevOps への投資に対するリターンを計算する方法
  • SRE NEXT 2025を開催します - SRE NEXT Staff Blog

    はじめに 開催概要 2025テーマ「Talk NEXT」 SRE NEXT とは Road to SRE NEXT さいごに はじめに こんにちは渡部です。SRE NEXT 2024でアナウンスがありましたが、SRE NEXT 2025の開催が正式に決定しました!!Co-Chairは私と岩堀さんになります。 2025年に開催されるSRE NEXTは、第5回目の開催となります。過去4回の開催を通じて、私たちは参加者からの貴重なフィードバックを元に、内容の充実と多様化を図ってきました。今年も、SREに関する最新のトピックスや、現場で活かせる具体的なプラクティスを共有する場として、さらなる成長を目指しています。 この記事では、SRE NEXT 2025の開催情報やテーマ、予定されているサブイベントについてご紹介します。 開催概要 SRE NEXT 2025は、東京・有明で開催されます。今年も昨年

    SRE NEXT 2025を開催します - SRE NEXT Staff Blog
  • 工学としてのSRE再訪 - SRE NEXT 2024登壇後記 - ゆううきブログ

    この記事では、2024年8月3-4日に開催されたSRE NEXT 2024 IN TOKYOでの自分の講演概要とパネルディスカッションに加えて、セッションでは語りきれなかった話と、登壇を終えての後記、最後にSRE NEXT全体の感想を記します。 SRE NEXT 2024では、公募セッション「工学としてのSRE再訪」と題して講演しました。それだけでなく、2日目のパネルディスカッション「SREの技術トレンド2024」にもお声がけいただき登壇しました。SRE NEXTの初回の基調講演から数えて4回目の登壇で皆勤賞を達成しました。 2024年8月16日追記:講演でベストスピーカー賞をいただきました。投票いただいた皆様ありがとうございました。 「工学としてのSRE再訪」 (表紙スライドの背景画像は京都のあるコーヒーショップのエスプレッソマシンを撮ったものです。コーヒーは技芸と工学の両者の側面があ

    工学としてのSRE再訪 - SRE NEXT 2024登壇後記 - ゆううきブログ
  • 大きな組織にSLOを導入し 運用するということ、その難しさ / SRE NEXT 2024

    SRE NEXT 2024の登壇資料になります。

    大きな組織にSLOを導入し 運用するということ、その難しさ / SRE NEXT 2024
  • SRE NEXT 2024 登壇&参加レポート その1 - エムスリーテックブログ

    こんにちは、SREチームの後藤です。 8月3日と4日の2日間、Abema Towersで開催されたSRE NEXT 2024にて登壇させて頂きました。 こちらに、自身の登壇についての話と印象に残ったセッションなど参加レポートとしてご紹介させて頂きます。 正答率80%でギリギリゲットした信頼性カレー SRE NEXT 2024について 自分の登壇について 印象に残ったセッション 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 プロダクトのスケールによって顕在化しうるリスクをどう管理するか? 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 まとめ We are Hiring! SRE NEXT 2024について 今年は、「Beyond NEXT」というテーマで2日間、オンラインとオフラインのハイブリッド開催でした。 私は両日とも現地で参加させ

    SRE NEXT 2024 登壇&参加レポート その1 - エムスリーテックブログ
  • SRE NEXT 2024@Abema Tower 登壇資料まとめ

    SRE NEXTに行ってきました SRE NEXT 2024に参加してきました!資料のまとめ集です。 メルカリさん、ランチごちそうさまです🍞 SRE NEXT 2024タイムスケジュール ※ユーザ名は敬称略です。 Day1 工学としてのSRE再訪 @yuuk1t 登壇者紹介リンク: https://x.com/yuuk1t/status/1819631327219798137 ※08/05 13:40ころまでリンクに誤りがありました。失礼いたしました。 DevSecOpsの内回りと外回りで考える持続可能なセキュリティ対策 @yamaguchi_tk 登壇者紹介リンク: https://x.com/yamaguchi_tk/status/1820376622715002885 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 @nari_ex 登壇者紹介リンク: https

    SRE NEXT 2024@Abema Tower 登壇資料まとめ
    red_tanuki
    red_tanuki 2024/08/06
    参加予定でしたがコロナ感染でできず。まとめ助かる
  • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 - SRE NEXT 2024

    2024年8月3,4日に開催された SRE NEXT 2024 での発表資料です。 「徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例」 https://sre-next.dev/2024/schedule/#sp007 発表では、数十のウェブサイトを限られた人数で構築・運用するため…

    徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 - SRE NEXT 2024
  • SRE文化の導入とプラットフォームの信頼性向上の取り組み | ドクセル

    プロフィール 岡麦 - 2022年度新卒入社 株式会社サイバーエージェン ト/株式会社 CAMへ出向 - 社内プラットフォームの運用・保守をメインとして活 動 @mugiokax #Kubernetes #Istio #Datadog @mugioka

    SRE文化の導入とプラットフォームの信頼性向上の取り組み | ドクセル
  • SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク

    1. はじめに こんにちは、「信頼性は可用性ではない」を標語にしているnwiizoです。 近年、サービスの信頼性向上に向けた取り組みとして、SLI(Service Level Indicator)、SLO(Service Level Objective)、エラーバジェットという概念が注目を集めています。これらは、Google発祥のSRE(Site Reliability Engineering)プラクティスの中核をなす考え方であり、多くの組織がこのアプローチを採用し始めています。また、関連するツールも成熟し始めており、実践的な導入がより容易になってきています。 ガイドでは、SLI、SLO、エラーバジェットを導入する前に知っておくべき重要なポイントについて詳細に解説します。各概念の定義から実践的な導入ステップ、さらには組織文化の変革まで、包括的な情報を提供します。 2. SREにおける基

    SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク
  • 2024-07-11 Mercari Hallo 立ち上げ時のSRE

    2022-03-26 TensorFlow Parameter Server Training紹介@機械学習の社会実装勉強会

    2024-07-11 Mercari Hallo 立ち上げ時のSRE
  • SRE Lounge #17 イベントレポートと SRE NEXT 2024 アンドパッドブースのご案内 - ANDPAD Tech Blog

    こんにちは。SREチームの吉澤です。 7/2(火)に開催されたSRE Lounge #17の会場として、秋葉原のアンドパッド社の9Fにあるイベントスペース「ANDPADコミュニティ」と懇親会用の飲物を提供させていただきました! 設営直後の会場の様子 面白い発表が多いイベントでしたので、今回はこのSRE Lounge #17のイベントレポートをお送りします。また記事の最後に、8/3(土)〜4(日)に開催されるSRE NEXT 2024でのアンドパッドブースも軽くご紹介します。 SRE Lounge #17のアーカイブ配信 アンドパッドのスポンサーセッション Xで頂いた質問 各セッションの紹介と感想 飲店のインフラサービス “ダイニー” のトラブル対応のすべて(dinii, inc. 唐澤さん) WAFでどのリクエストがBlockされたのか、ログを集計してSlackで簡単に見れるようにし

    SRE Lounge #17 イベントレポートと SRE NEXT 2024 アンドパッドブースのご案内 - ANDPAD Tech Blog
  • リリース品質を高めるポストモーテムとは / 開発者向けブログ・イベント | GMO Developers

    SREにおけるポストモーテムとは 近年、システムの複雑化と規模拡大に伴い、システム障害やインシデントの発生リスクが高まっています。こうした問題を未然に防ぎ、システムの信頼性を向上させるために、SRE(Site Reliability Engineering)では、ポストモーテムと呼ばれる取り組みが重要視されています。 ポストモーテムとは、システム障害やインシデントが発生した後に、その原因を徹底的に調査し、再発防止策を立案することで、システムの信頼性を向上させるための活動です。失敗を非難するのではなく、失敗から学び、組織全体の学習と成長を促進することを目的としています。 リリース管理でポストモーテムを行う理由 ポストモーテムは、サービスインパクトのあったシステム障害について実施することが一般的です。私たちはこれに加えて、リリース時に発生した問題についてもポストモーテムを行うことにしました。そ

    リリース品質を高めるポストモーテムとは / 開発者向けブログ・イベント | GMO Developers
  • 超入門 SRE

    re:Invent をおうちで楽しんでみた ~CloudWatch のオブザーバビリティ機能がスゴい!/ Enjoyed AWS re:Invent from Home and CloudWatch Observability Feature is Amazing!

    超入門 SRE
  • 分散トレーシングを使ってパフォーマンス改善をやってみたら、レスポンスタイムを2割近く改善できたお話 - Tabelog Tech Blog

    目次 目次 はじめに そもそもシステム運用改善チームとは何か? なぜアプリAPIのパフォーマンス改善が必要になったのか? どうやって改善箇所を見つけるのか? 分散トレーシングを使って、店舗詳細APIを細かく分析する 計測結果の見方 計測結果から分かったこと 計測結果から見つけたポイントに改善を実施していく コースに紐づくクーポンの取得 口コミを取得する処理と公開画像数のカウント ユーザーごとの公開口コミ投稿数の合計数カウント 全体での改善効果はどうだったか? パフォーマンス改善の影響 ユーザー体験が向上した 今後のべログ成長に備えたシステム上の余裕ができた べログの分散トレーシングを使って改善を実施してみてよかったこと おわりに はじめに こんにちは。べログ開発部 ウェブ開発1部 システム運用改善チームの @4palace です。 今回は、私の所属するシステム運用改善チームがべロ

    分散トレーシングを使ってパフォーマンス改善をやってみたら、レスポンスタイムを2割近く改善できたお話 - Tabelog Tech Blog
  • SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ

    はじめに SRE Kaigi 2025 実行委員会 委員長の井上(@syossan27)です。 この度、SRE KaigiというSite Reliability Engineering(SRE)に関するカンファレンスを立ち上げました。そして、来年の2025年にSRE Kaigi 2025を開催致します! 詳しい開催日は2025/01/26(日)で、会場は中野セントラルパーク カンファレンスにて開催いたします。開催形式についてはオフライン開催を考えておりまして、どのようなカンファレンスにするかは色々と思案中でございます。Twitter(現:X)や、当ブログでの続報をご期待ください! 何故、このようなカンファレンスを立ち上げたのか?などの経緯や、カンファレンスに対する想いを書いていきます。 何故立ち上げたのか? SREに関するカンファレンスといえばSRE NEXTという大きな先駆者がいます。

    SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ