パスワードを忘れた? アカウント作成
1665425 story
ネットワーク

auでメールの通信障害発生、原因は電源設備 50

ストーリー by hylom
タイミングが悪い 部門より
あるAnonymous Coward 曰く、

2月11日夜、auでメールが送受信しにくい状況が発生した。原因はネットワークセンター内の通信設備における電源設備の故障だという(KDDIの発表)。

ケータイWatchによると、この設備は冗長構成を取っていたが、障害発生当時はメンテナンス中で1系統のみで運用していたという。この状態でUPSが故障したため給電が止まり、サーバーが停止してしまったそうだ。1月末に発生したNTTドコモの障害のようにトラフィックが原因ではないとのこと。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by usay (8) on 2012年02月14日 9時13分 (#2098523) 日記

    バレンタイン前の週末なのにメールも電話もまったくこないなあと思ったら
    通信障害が発生していたのか。道理で。

    --
    May the source be with you... always.
    • by Anonymous Coward

      よく見るんだ。君の携帯はdocomoだ。auじゃない。

      • by Anonymous Coward

        ってことはdocomoも障害発生か。トラブルってのは続くもんだね。

        • by Anonymous Coward

          よく見るんだ。障害が起きたのはspモードメールで、君が使っているgmailじゃない。

          • by Anonymous Coward

            そうか、こっち側は問題ないんだな。
            なら相手がauを使ってるってことか、それなら仕方ないか。

            しかし復旧が長引いてるみたい。いまだに連絡こないよ。

            • by Anonymous Coward

              もっとよく見るんだ。君の相手はauじゃないawだ。

    • by Anonymous Coward

      人間関係の通信障害は早期に復旧しておいた方がいいぞ。
      いろんな意味で。

      • by Anonymous Coward

        初期不良なんだから、さっさと新品に交換したほうが・・・

  • 記事から受ける印象は、電力会社から受電した後の2系統の電源が落ちた、と解釈できる。
    ディーゼル発電機等を使用した非常用電源設備があるはずだが、起動しなかったのか?
    設備の基本仕様には、冗長構成の項目はあるが、冗長運転の仕様はなかったんだろうな。

    • by Anonymous Coward

      給電系と装置を繋いでるUPSが死んだんだから、給電元がディーゼルだろうがなんだろうが無意味。

  • by kogd9 (45248) on 2012年02月14日 9時30分 (#2098532) 日記
    UPSってあんまり故障するようなものじゃないと思うけど、基盤ごといっちゃったのかな?

    UPS通さずに直結してとりあえず復旧するのは、施設内の機器配置的に無理だったのかな?
    • by Anonymous Coward on 2012年02月14日 9時59分 (#2098553)

      あまり故障しないというか、故障していても気付かないこともある。
      停電時になって初めて故障していることに気付くとか。

      あと、故障ではないものの、一度停電した時にUPSが供給し、
      復電したときにUPSが充電モードに移行、その時にすぐ停電すると
      UPSは電力を供給しないという欠陥があるUPSとかあった。

      あれは大騒ぎになったなあ。

      ま、普通は2系統の電源(発電所・変電所)をひき、
      2系統のUPSやCVCFを用意し、サーバも2電源ユニット以上で
      それぞれ分けておくというのが冗長構成の理想像かもしれない。

      今回は数百万人に影響するポイントのサーバなのに、
      そういう電源冗長化はしていなかったということだね。

      親コメント
      • by Anonymous Coward

        まあ数百万人に影響すると言ってもプレスリリース出して謝罪すれば済む程度の話しだし。
        首都圏の電車なんて毎朝のようにどっか止まってるよ。人死にも出るし

    • by Anonymous Coward on 2012年02月14日 10時54分 (#2098623)

      この手の大規模な所だと一般的なUPS(サーバの近くにおいてあってそこから電源を取る)ではなく
      UPS室があってそこからサーバルームの電源の配線をしているんじゃないかなぁと思います。
      なので、UPS室からの回線が2系統あって1系統落としてメンテ中にもう1系統の方が壊れたということでは?

      そうしておかないとサーバだけUPSで動作を続けてもその他の機器が落ちたら意味がない。
      サービスが停止しないようにこの手のところはUPSを設置する物なので停電時に安全にシャットダウンできればいいとは目的が異なっているんですよ。

      親コメント
    • by Anonymous Coward

      管理わるいと、メンテナンスの時期(バッテリー交換とかね)をわすれたりする。
      そのぐらい管理がわるかったと思えば納得。

      • by miishika (12648) on 2012年02月14日 19時52分 (#2099041) 日記
        そういう管理のUPSに限って、予算削減のためバイパスボックスを設けていなかったりして、バッテリー交換のためにサーバを停止しなければならないものです。
        親コメント
      • by Anonymous Coward

        > 管理わるいと、メンテナンスの時期(バッテリー交換とかね)をわすれたりする。
        テプラ一枚で済むんですがねぇ
        格好を気にしないならマジックペンで直書きでも済むし
        #実際、車のバッテリは交換した日をマジックで書いているヨ

        • by Anonymous Coward on 2012年02月14日 11時33分 (#2098658)

          交換時期にならなくても へたってしまうバッテリーが偶にあるから困るんですよ。
          複数ある内の一台が逝っちまっただけで全体の給電がダメになりますからね。

          で、ウチの職場では「全部のバッテリーの内部抵抗をこまめに測ること」という通達が出てしまいました。
          やってられるか、っつの。

          # 面と向かって言えないのでACで。

          親コメント
        • by Anonymous Coward

          UPSには使用開始日の欄が何世代分もあって、そこに書き込めばいいし、それでいいのだが。
          それを定期的に見に行かないというのが「管理不行き届き」なのですよ。

          # 毎月見に行ってたらそれはそれで、なにさぼってるんだって言われるのがオチ

      • by Anonymous Coward

        バッテリーの寿命が来ると、「ビービービービービー」って
        警告音が鳴るんだけど、ひたすら鳴ってるのでラックの利用者に
        連絡したが、交換どころか見にも来ない。

        電源がブチって切れるまで問題ないと思っているらしい。

        そのまま三年が過ぎてもビービーなってる。

        放置して障害になるのは知ったこっちゃないが、このビービー
        耳障りな警告音を聴きながらずっと作業しているこっちの身に
        なってくれよって。

        • by sumeshi0206 (12305) on 2012年02月14日 15時54分 (#2098880) 日記

          本当にバッテリーのせいでピーピーいってます?
          元の電源が不安定だとピーピーなりやすいですよ。
          その場合、コンセントから直接電源とるのと、電力会社にチェックしてもらう。
          それでもだめなら、設定で感度下げればおとなしくなります。

          親コメント
        • by Anonymous Coward

          いいかげんバッテリが膨らんでないか?

        • by Anonymous Coward

          ほかの利用者の迷惑(異音が判らなくなるetc..)だから修理しろとはいえないの?
          カッコンカッコン言ってるドライブの発見が遅れたらタダじゃ済まないと思うんだけど。

    • by Anonymous Coward
      au規模になるとサーバーにUPSはつけてはいけないものだと思ってましたが。
      (UPSの故障点が増えるだけ)
      通常は電源ユニットを二重化してあってCVCFで供給のはず。
      データセンターとかじゃなかったのかな?
  • by Anonymous Coward on 2012年02月14日 7時23分 (#2098480)

    年に数回のメンテナンスで非冗長な時に限って障害が発生する
    試験時は問題なかったのに、カットオーバー直後にランダム発生のバグに当たる
    綿密に準備してから作業を計画すると、当日の朝に障害が発生してスケジュールが流れる

    • プリンタは納品直前に壊れる

      親コメント
      • by Anonymous Coward

        それは本当に壊れているとは限らないのでは。

      • by Anonymous Coward

        大量に印刷したい日に限ってインクが無くなる。
        # 白黒印刷したいのに赤が無いって止めるプリンタどうにかならないか。いくらインクで儲けているとは言え。

    • by Anonymous Coward on 2012年02月14日 7時35分 (#2098483)

      年に数回のメンテナンスで非冗長な時に限って掃除のおばちゃんが仕事を開始する
      試験時は問題なかったのに、カットオーバー直後にランダム発生の掃除のおばちゃんが仕事をする
      綿密に準備してから作業を計画すると、当日の朝に掃除のおばちゃんが仕事を始めてスケジュールが流れる

      親コメント
    • by SteppingWind (2654) on 2012年02月14日 8時59分 (#2098512)

      メンテナンスで1系統を止めることが最初から分かっているのなら, 普通は3重以上にするのが冗長化ってもんですよね.

      # けど電源系を3重以上にする構成って, 現物は見たことが無い

      親コメント
      • by Anonymous Coward

        医療系は正,副,予備の3系統が基本では?

      • by Anonymous Coward

        斜め上を目指して5台の電源による多数決を!

      • by Anonymous Coward

        MVSが動いているという話だったんですが、全国三箇所に分散設置してあって
        また、一つのシステムに、十基の電源ユニットが接続されていて
        その一つが壊れても…

        取替えというトラブル要因になる作業を行わず
        停止できる日まで、稼動し続け、二つ目が壊れてもまだ大丈夫。

        みたいな冗長性が与えられていると聞きました。

        当然、実物は見られませんでした。

        もしかしたら、銀行系という、年に一度は停止できる日があるシステムだから
        そこを落とし所として運用管理する設計だったのかもしれません。

  • by Anonymous Coward on 2012年02月14日 8時17分 (#2098496)

    UPS(現実にはCVCF?)の定期メンテナンスはしていたのだろうか?

    • by Anonymous Coward

      動作中ブザーはちゃんと鳴ってました。

  • by Anonymous Coward on 2012年02月14日 8時44分 (#2098504)

    規模の割には人数少ないし
    社員でも事前申請しておかないとなかなか入れないし
    こういう時って対策が打ちにくいね

    まぁ、テロとか恐れているんだろうけど

  • by Anonymous Coward on 2012年02月14日 8時50分 (#2098508)

    やっぱり、「11日」は何かやばいことが起こる日の定番になりつつあるね

typodupeerror

あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall

読み込み中...