タグ

システム障害に関するbull2のブックマーク (3)

  • Twitterが、Tumblrが、Gmailが・・・ 落ちるときには落ちるわけで:THE SHOW MUST GO ON:オルタナティブ・ブログ

    別にそれぞれ同期しているわけでは無いのですが、とりあえずワタシが日常使っているTwitter、Tumblr、そしてGmailが最近時々落ちます。さすがにそれぞれは独立したサービスですから一斉に落ちることは無いのですが、逆に言うと、たとえばTwitterが落ちるとTumblrに「Twitter落ちてる?」「Twitterアクセスできない」云々といったメッセージがガンガン上がることになります。たとえば8月に起きたtwitterのDDoS騒ぎの時にはワタシ自身もtumblrに悲鳴が山のように上がるのを見ました。 形あるもの全ては滅びる、なんて嘯いている場合ではありません。 最近不安定だよね、という日常会話 9月1日に起きたGmailの障害についての記事。人が組んだシステムですからどこかに穴がある。もちろんインフラとしての部分にかけるコストや手間は下手なイントラネットのシステムよりも強力ですから簡

    Twitterが、Tumblrが、Gmailが・・・ 落ちるときには落ちるわけで:THE SHOW MUST GO ON:オルタナティブ・ブログ
  • 三つの障害が連続発生、気象データ配信システムのダウンの経緯が判明

    2009年3月9日にダウンした気象データの配信システムが正常稼働までに17時間20分かかったのは、三つの障害が連続発生したからであることが分かった。ハードの二重化といった信頼性向上策を講じていたが、三つの障害が続いたことで、ダウンを回避できなかった。 一つめの障害は富士通製UNIXサーバー(OSはSolaris)のCPUボードの故障だ。電文形式データ配信システムでは、2台のサーバーによるホットスタンバイ構成を採用している。このうち番系サーバーが故障した。 すぐに待機系が稼働するはずが動かなかった。引き継ぎ情報を格納した制御系ファイルが壊れていた。これが二つめの障害だ。制御系ファイルは富士通製の共用ディスク上にあり、番系と待機系の双方からアクセスできる。サーバーの起動に不可欠だが壊れていたために引き継ぎ情報が読み込めなかった。 「電文形式データ配信システム」を管理する気象業務支援センター

    三つの障害が連続発生、気象データ配信システムのダウンの経緯が判明
    bull2
    bull2 2009/03/17
    三重苦
  • 「ヨドバシ・ドット・コム」がリニューアル直後から表示が遅すぎて激重になる大規模障害が発生、一体何が起きているのか?

    ヨドバシカメラの公式サイト「ヨドバシ・ドット・コム」が2008年10月21日(火)にリニューアルされました。個人的な感覚では「使いにくく、見にくく、お目当ての商品が探しにくく」なって改悪されたように感じられていたわけですが、それどころかあまりにも表示が遅すぎて激重になり、なんとお詫びページまで作られるほどになってしまいました。 そして既にリニューアルから1週間が経過したものの、いまだに改善されておらず、一体何がどうなっているのかよくわからない状態で、どれぐらいの損失が発生したのかが非常に気になります。何が起きているのでしょうか? 戦慄の実態は以下から。 まず発端は10月21日(火)。リニューアル直後から重くなり始め、ついにはタイムアウトを連発。たまたまこの日は前日にヨドバシ・ドット・コムから「ポイント残高失効のお知らせ」が届いていたため、ポイントでLANケーブルを買おうと思っていたのですが

    「ヨドバシ・ドット・コム」がリニューアル直後から表示が遅すぎて激重になる大規模障害が発生、一体何が起きているのか?
  • 1