in between days

表参道で働くシニアのブログ

はてなのネットワークとハードウェアは大丈夫なんだろうか?

いままさにこれを書いているまさに午前4時17分、はてなカウンターがまた落ちていて、アクセスできません。「また」というのはg:hatena:id:hatenacounterの障害情報を見ればわかるように、9月末から障害が頻発しているからです。

今回は「503 Service Temporarily Unavailable」とか「Proxy Error」なんて表示されますが、これは内部のASが落ちてるってことなのかな。この手のウェブサービスにはありがちでしょうが、フロントではなくバックエンドが落ちていてタイムアウトしちゃうようなパターンに見受けられます。

夏以降の障害のまとめ

上記にも書いたように、この秋口から障害が頻発しているような印象があります。そこで、g:hatenaid:hatenadiaryを「障害」で検索して、毎月どのくらい起きているのかをこの夏から振り返ってみました。

2006年7月
2006年8月
2006年9月
2006年10月

増えてるなあ

10月はまだ半分も過ぎていないことを考えると、この秋の障害は夏のころより間違いなく増えてると言ってもいいんじゃないでしょうか。感覚的にも10月にはいってからはてなを使っていて「また落ちてるよー」とガッカリすることが多いなあという気がしてたので、そういう実感にもマッチします。

最近の不具合の傾向としてコーディングのバグとか一部機能の動作障害といったものよりも、さきほど書いたようにバックエンドのASがタイムアウトしてるっぽい挙動とか、お知らせダイアリーでも「データベースサーバ」の「ハードウェア障害」とアナウンスされることが多いようにおもいます。

といってもはてなのようなサービスの場合、何か障害が起きるような複雑な機構はデータベースくらいでしょうから「データベースの障害」とアナウンスされることは不思議ではないのですが、こう頻繁に「ハードウェア障害」が起きているのは利用者として少し不安ではあります。それほどまでに過負荷なんでしょうか。

一時期ははてなよりもmixiの方が夜に頻繁に落ちたり重くなったりしてましたが、最近はIPOで調達した資金をハードウェア増強に回しているのか知りませんが、mixiはめっきり安定してしまったようです。確かmixiのネットワークは「さくらインターネット」が請け負っていたはずで、サーバも市販のいわゆる「1Uサーバ」を1日1台くらいのペースでガンガン補充しまくっているという話もどこかで読んだことがあります(ソースが出てこないので話半分に読んでください)。

一方のはてなは、自作の超軽量フレームPCに自前のネットワークで構築することで、柔軟なサーバ構成を実現しているというのが売りだったはず。しかしこうハードウェア障害が頻発されると、やはり「チープ革命」とはいえ安い自作PCを集めて大規模ウェブサービスを開発するのにはスケールメリット的に限界があるのでは、という懸念も沸いてきます。
もっとも僕個人はそういうDIYマンセーなところが、はてなの良いところであって、最大の利点であって、国内唯一無二のオモロイところだと思っているので、過負荷に負けないで毒虫状態を脱してくれることを願っております。って書いるうちにカウンター復旧してたよ! おつかれさまでした>中のひと