• Twitter
  • Facebook
  • Google+
  • RSS

APCの無停電電源装置をはてなサーバーエンジニアが試してみた



(※この記事は、株式会社エーピーシー・ジャパン提供によるPR記事です。)

「APCの中容量UPSを試してみない?」という話を聞いたのは2011年2月のある夕方のことでした。ハードウェアならほとんどなんでも大好きな筆者、しかも導入を検討したい気になる製品です。二つ返事で「是非!」と答えたあとは、仕事の合間にAPCのWebサイトを見ては、しっくりくる製品や便利そうな機能をチェックする日々を過ごしました。そうして過ごすこと数週間、いよいよAPCのオフィスにおじゃまして、中容量UPSを試せるこの日がやってきました。

はてな東京オフィスのサーバールームに設置しているサーバーの用途は、はてなスタッフの開発用、ファイルサーバー、ログ解析のためのHadoopサーバーなどです。これまで、ビルの電気設備の点検や、送電系統のトラブル、さらにはオフィスの消費電力が過大なことによるブレーカー落ちなどで、なんどか停電が発生していました。止まってもサービスの停止にいたるサーバーではありませんが、それでも不便です。とくにバックオフィス用や、開発オフィス用のサーバーは、だれがいつ動かしたかわからない、用途もすぐにはわからないプログラムがたくさん動作しています。これらは結構なくせ者です。停電で再起動すると「あれが使えない」「これが動かない」「というか起動しない」というような事態で、半日くらい辛い思いをします。

だからといって運用ルールを厳しくして、開発用サーバーでいろいろなことを試せなくなるのは本末転倒です。いつでも自由に使える、しかも安定している――そんな開発用サーバー環境を目指したい! 冒頭の東京オフィスのサーバールームにも「インテリジェントなUPS」を導入したいという欲望は、こんな気持ちから生まれたのでした。

いざAPCに試しに行くため、東京オフィスのラックからせっせとサーバーを外します。はてなのサーバーはほとんどが自作です。「金森」という旧型を4台、「marqs-60」という新型を4台、あわせて8台を外しては台車に積み込みます。あとはL2スイッチを1台、L3スイッチも1台持って行きましょうか。合計で8A、800Wくらいの消費電力です。本当はもっと持って行きたいところですが、車に載る程度で自重しておきます。

ワンポイント用語集

Hadoop - Googleの分散データ処理技術をオープンソースのソフトウェアとして実装したもの。大量のデータを解析する用途に向く。はてなは、ログの解析などにHadoopを利用している。
ブレーカー落ち - はてな東京オフィスで電力消費量が大きい装置は、炊飯器やコーヒーメーカーなど。予期せぬ同時稼働でブレーカーが落ちることがある。
ラック - サーバーやネットワーク機器を収容するためのたなや筐体のこと。EIA(アメリカの電子工業会)やJISにより規格化されていて、19インチ幅のものがよく用いられる。
金森 - Micro-ATX型マザーボードを搭載できる、はてなオリジナル筐体を利用した、自作サーバー。はてなが2003年に、増え続けるサーバーのスペース節約の目的で開発した。
marqs-60 - はてなの新型自作サーバー。はてなが利用するさくらインターネットのデータセンターに最適化して設計され、2009年から運用を開始した。
L2スイッチ - ネットワーク機器の一種で、ネットワークにおいて中継をおこなう機器。いわゆるスイッチング・ハブ。
L3スイッチ - ネットワーク機器の一種で、ネットワークにおいて中継をおこなう機器。OSI参照モデルにおけるネットワーク層(レイヤ3)を見て、データ転送処理を実行する。

■ APCのオフィスにはてなサーバーを導入(僕がUPSを試すだけという贅沢な目的で)

社用車にサーバーを積み込んで、都内を走ること30分、東京都港区芝公園にあるAPCのオフィスに到着しました。サーバーを満載した台車をゴロゴロと転がしながらAPCのエントランスを抜けると、APC製品でかっちり固められた社内システムが右手のガラス越しに見えてきました。機能美あふれた、素敵なラックです。本番環境ということで、残念ながら撮影はNGでした。

会議室が並ぶスペースの中央に、ショールームのような場所があり、ラックがそびえ立っています。APCといえばUPSと思う人も少なくないでしょうが、ラックや冷却システムの製品もとても充実しています。密閉と循環で熱を吸い出す「InRow冷却システム HACS」や、やたら高機能な大容量UPS「Symmetra PX 160kVA」など、カタログでしか見たことがない製品が、かっちりとまとまって実働状態で置いております。とてもカッコイイとしか表現できません。APCのエンジニア鈴木さんは、筆者を案内しながらブレーカをバッチンバッチンと投入して、UPSシステムに電源を供給していきます。その姿もまたカッコイイ。

おっと今日は、はてなのサーバーとAPCの中容量UPSの組み合わせを試しにきたのでした。鈴木さんの工具袋を借りて、はてなのサーバーをAPCのラックにラッキングしていきます。ラックの下には、今回の主役「Smart-UPS RT 5000」がででーんと鎮座しております。

APCのラックは高精度で、すいすいとラッキングが完了しました。続いてケーブリングに取り組みます。まずはEthernetの配線、続いて電源の配線です。電源は、Smart-UPS RT 5000から、ラック裏側のPDUに供給されています。PDUからサーバーへ、いつものケーブルでつないで完成です。

初めての環境とは思えないほど、ビューティフォーな仕上がりのラッキングとなりました。このラッキングのために、工具やアクセサリをたくさん貸していただいたAPCの鈴木さん、ありがとうございました!

ワンポイント用語集

Smart-UPS RT 5000 - 3500W / 5000 VAの最大出力容量を備えるAPCの中容量UPS。APC Smart-UPS RT 5000VA 200V
PDU - Power Distribution Unitの略。いわゆる電源タップ。データセンターのラックなどでは、背面の壁側に設置されていることが多い。温度や消費電力を測定したり、コンセントごとの電源のON/OFFができるなど、高機能化された製品もある。

■ 中容量UPSをインテリジェントに設定する

お借りしたラックにうまくおさまった様子を見て、しばし満足。出していただいたお茶をすすります。一息入れたらUPSの電源を投入してシステムの立ち上げです。問題なくすべての機器が動き始めました(パチパチ)。はてなのサーバーを、これまた大変カッコイイAPCのコンソールドロワーに接続して、見慣れたCentOSのブートメッセージを眺めます。

さて、いよいよインテリジェントな中容量UPSのスゴイところを試します。APCの「PowerChute」というソフトウェアを利用すると、任意の「イベント」を対象に、プログラムの実行や、UPSの制御などの「アクション」を設定できます。例えば、UPSがバッテリー駆動を開始したという“停電イベント”が発生したら、サーバーをシャットダウンしてからUPSを止めるというアクションを設定ができます。

停電から回復したときも、APC製のSwitched Rack-Mount PDUを利用していれば、電源投入時にアウトレットのON/OFFの順番を制御できます。例えば、ルーターなどのネットワーク機器の電源を先に入れておいて、ネットワーク環境が整ってから、サーバーを起動するといった運用が自動で可能になるわけです。便利!

PowerChuteが対応しているOSは、各種Windowsや、Mac OS、Red Hat Linux、Turbo Linuxなど。残念ながらはてなで利用しているCentOSはPowerChuteのサポート外でした。そこで、ちょっとだけハックすることにしました。

ワンポイント用語集

コンソールドロワー - 19インチラックに引き出し式におさまるPCのモニターやキーボードなどのセット。APCには「Rack LCD Consoles」という製品がある。とても格好いい。
CentOS - フリーのLinuxディストリビューション。http://www.centos.org/

■ サクサク進むPowerChuteによる設定

まず、Windows Server 2008がインストールされたPCサーバーをお借りして、サーバーにラッキングします。このサーバーにはPowerChuteがインストールされています。次に、Windowsの組み込みコマンドなどを利用して、任意のIPアドレスの指定したポートに、あるパケットを送るバッチファイルを記述します。パケットの送り先は、はてなのサーバー8台です。こちらは、TCP/IPであるポートにあるパケットを受け取ったらシャットダウンを実行するように設定します。これでAPCのPowerChuteから、はてなのサーバーをシャットダウンできるようになりました。ネットワークシャットダウン機能の完成です。

ここからは、APCの鈴木さんにPowerChuteの設定をお願いします。まずはシャットダウンの設定です。ユーザーインターフェースはWebでできていて、ポチポチと設定していきます。こういうたまにしか触らない設定項目は、グラフィカルなほうが使いやすいと思うのは筆者だけでしょうか。

「UPSがバッテリー駆動を開始」というイベントに、先ほど作った、はてなサーバーのシャットダウンするバッチファイルの実行というアクションを設定します。電源断からの時間を変えて、PowerChuteを実行しているWindowsサーバーのシャットダウンや、中容量UPS自体のシャットダウンも設定します。

電源が復帰したときの設定も同様にすすめます。PDUに接続されたコンセントのそれぞれで、まず1番をONにして、10秒待ってから2番をONにして、さらに60秒待ってから3番を……という感じです。これらの設定画面はよく作り込まれていて、使いやすそうです。あっという間に、設定が完了しました。

■ いざ停電をテスト

ほんとにサクサクと設定が終わったので、ちゃんと動くのかな……と思っていたそのとき、APCの鈴木さんはスタスタとラックの裏側に回り、30Aのごつい電源を「ブスッ」っと引っこ抜きました。UPSのアラーム音がピーピーと鳴り響き、バッテリー動作が始まります。うわー!

試している「Smart-UPS RT 5000」は常時インバーター方式です。普段からインバーターが動作していて、バッテリー給電に切り替わっても動作音があまり変化しないのが印象的です。筆者が自宅で使っているラインインタラクティブ方式ではバッテリー給電に切り替わるとインバーターがうなり、ファンも回転し始めて、いい感じに非常事態な雰囲気が出てカッコいい。この「Smart-UPS RT 5000」はそうでもありません。自身のバッテリーから、たんたんと電力を供給し続けます。これはこれで、非常事態でも動じないクールな感じでカッコいい。よく考えると非常事態やハードウェアにカッコよさを求める自分がおかしいんですかね……。

そんなことを考えている間に、「ピッ」という音とともにサーバーがシャットダウンを始めました。先ほどの設定がちゃんと機能しています。はてなのサーバー8台が、順番に静かになっていきます。すべて静かになったところで、PowerChuteが動くWindowsサーバーや、ネットワーク機器も止まっていきました。あまりの安定感、安心感で、感動する余裕すらありません。この信頼感がAPCならではでしょうか。

続いて復帰を試します。さきほど引き抜いた30Aのごついのを差し込み、中容量UPSの電源ボタンをポチッと押します。今回は自動復帰を設定していません。停電を繰り返す場合などに備えて、APCが推奨する復帰方法の一つだそうです。まさに停電を繰り返す環境下の自動復帰で痛い目にあったことがある筆者はなるほどー!と思いました。

感心している間に時間差をおいて電源投入する設定がちゃんと機能していて、ネットワーク機器、設定したサーバーの順で、順番に起動を始めました。次々とファンが音をたてていくその様子は、巨大なロボットが立ち上がるかのように、たいへんカッコいいものでございました。やっぱりカッコいい……。

このような感じで、つないで設定して検証する――という一連の流れを試すことができました。APCの機材にトラブルはまったくなく、繰り返しではありますが老舗ならではの、さすがの安定感だなあ、と思いました。

ワンポイント用語集

ラインインタラクティブ方式 - 常時商用方式に出力補正を追加したもの。

■ APCの鈴木さんにいろいろ聞いてみる

会議室に場所を移動して、検証を手伝っていただいたAPCの鈴木さんにいろいろと話を聞いてみます。実は筆者、会社ではない場所で、Smart-UPS 500を1台、同1500を1台、同RM3000を1台それぞれ愛用しています。UPSにまつわる、いろいろな疑問に答えていただきました。

■ より容量の大きいUPSへの統合

筆者のUPSに対する一番の不満は、バッテリーの交換が面倒なことです。管理しているUPSが4台あり、それぞれ導入時期もバラバラで、毎年のように交換をしています。鈴木さんに聞いてみると「容量の大きいものに集約する」とお薦めしていただきました。たしかに、UPSの台数が減れば、バッテリー交換の台数が減ります。

UPSを統合したときに真っ先に心配になるのが冗長度です。UPSは電源を供給しているという役割から明らかなように巨大なSPoFです。とはいえ、そもそもデータセンターに置くほどではないサーバーが、停電に巻き込まれたときの手間を減らすというのがUPS導入の動機だったります。そうすると、壊れる確率が十分低いUPSの障害に気を揉むのは筋違いな気持ちです。冷静に故障率を計算してみても同じことがいえます。

容量の大きいUPSに統合すると、交換の手間だけでなく交換するバッテリーのコストを抑えられるため、5年先のランニングコストまで見据えると、小柄なUPSを並べるよりも、より容量の大きな機種に統合したほうが、トータルコストを押さえられる場合が少なくないそうです。さらに、容量の大きいUPSは上位グレードだけあって、電圧変動などの「不安定な電源環境への耐性が確実に高い」(APCの鈴木さん)、SNMPに対応するなどほかにも便利なことがありますね。あら素敵。

ワンポイント用語集

SPoF - Single Point of Failureの略。日本語では単一障害点などと呼び、システム全体の機能を停止させうる場所のこと。
SNMP - ネットワーク上の各種機器を監視したり、制御したりするためのプロトコル。Simple Network Management Protocolの略。ネットワーク機器の管理や監視の自動化で広く利用される。

■ PDUの隠れた便利な使い方

筆者が今回初めて試した、APCのPDUの使いやすさを伝えたところ、鈴木さんが面白い使い方をいくつか教えてくれました。例えば、遠隔地の電源の再投入作業です。遠隔地にあるルーターやスイッチが不調になったとき、電源のON/OFFを制御できるPDUを利用していれば、Webブラウザから電源の再投入作業ができます。たしかに筆者も、お正月の人がいない時期に不調になったスイッチがあったため、データセンターに電源の再投入をする目的で、休日入館申請をお願いするのに苦労したことがありました。これは便利だなあ。

筆者が笑い転げたのは「掃除の人が掃除機をつないでサーバーを止める」という事故の例です。PDUで不要な出力に電源を供給しないように設定しておけば「勝手に掃除機をつながれて、設計外の電源容量を使用する」という事態を防げるわけですね。「そんなの絶対ありえない」と思ってしまいますが、実際の事例としてあったそうです。たしかに使いやすいところにコンセントがあったら、掃除機のプラグを差し込む……かも。判明するまでは「早朝の予期せぬ異常な電力消費」なので、トラブルシューティングがとても大変だったことでしょう。

このようなマニアックな事例に限らず、現実的に、PDUは便利な機械だと実感しました。ネットワーク機器を先に起動して、ネットワーク環境が整ったところでサーバーを起動するという起動順序を自動化できるだけで、障害復帰時のオペレーション・ミスは飛躍的に少なくなることでしょう。また、起動時に電力を大きく消費することが多い最近のサーバーの同時起動による電源容量超過も、PDUを制御して時間差で起動することで簡単に防げます。

■ 大変楽しいNetwork Management Card

Smart-UPSにはSNMPなどをサポートした「Network Management Card」があります。これは大変楽しいアイテムで、例えば自宅のサーバーの消費電力をグラフにするなんてのも、ちょちょいのちょいです。もっと面白い使い方はありませんか?と鈴木さんに聞いてみたところ、センサーユニットを追加して温度で制御するというお話をしてくれました。

筆者はある過去の障害をすぐに思い出しました。休日に短時間の停電があったあとに東京オフィスに出社してみたら、エアコンが停止して、サーバールームが異常な温度になっていました。小規模なサーバールームほど空調トラブルによる異常高温などは発生しがちです。ここでこの温度センサーがあると、大変よさそうです。

また、Network Management Cardは複数台のUPSを協調動作させるシンクロ機能という機能を備えているそうです。複数あるUPSのうち1台が停電を検出した場合に他のUPSも同期して停止させるといったことができます。複数の電源系統を利用するしかないような、制約がある場合は便利に使えそうですね。

電源電圧がすごく下がる場合や、電源周波数が変動する場合など、現実には考えにくいひねくれた質問をしても、鈴木さんは表情を変えずにたんたんと説明してくれました。ちなみに電圧変動はスライダックなどで、周波数変動は船橋にあるラボで、それぞれテストしているそうです。エンジニアさんも製品も、さすが安定感のあるAPCブランドという感じでございました。

■ まとめ

はてなのサーバーをAPCのオフィスに持ち込み、APCのUPSを中心としたシステムに組み込んで試験しました。設定や運用のしやすさを体験し、また信頼性の高さも実感しました。これはPR記事ですが、そんなことは関係なく、正直、欲しいです。常時インバーター方式の東京オフィスにしっくりくるのを1台あれば……とついつい妄想してみます。たぶん1台くれるような不思議な人はいないので、会社におねだりしてみましょう。

ここをお読みの皆さまには、APCさまのご提供で、ご家庭にしっくりくるUPSを3台プレゼントします。あまりに大容量で床が抜けるのは困るかと思い、個人向け製品からRSシリーズをプレゼントです。消費電力などを液晶パネルに表示できる、大変カッコいい代物です。USB接続による自動シャットダウンも標準で付いてきます。PCはもちろん、不意の停電がいろいろ怖いHDDレコーダや、自宅のルーター、電話機などに利用するのも面白いと思います。応募はすぐ下で。

知らないと危険!「IT管理の電源トラブル」あなたのすぐそばにある危機
UPSのバラバラ管理は危険!分散構成UPSの危険性を、4つのシーンでリアルに再現するサイト!

小型UPSと、サージ対策機能付き高機能電源タップをプレゼント

※キャンペーンは終了しました。たくさんのご応募、ありがとうございました。

電源タップ(SurgeArrest Essential 雷ガードタップ+ネットワーク回線保護)を抽選でプレゼントします。応募方法は、この記事をはてなブックマークに追加するだけ。

さらに、Twitter連携して記事への感想をお寄せいただいた方には、小型UPS(APC RS 550)が当たるチャンスも! 詳しくは、下の応募要項をご覧ください。

応募要項

  • 応募期間
    • 2011年3月23日(水)から2011年4月5日(火)24時まで
  • 賞品と当選人数
    • 電源タップを5名様、小型UPSを3名様
  • 応募方法
    • 電源タップ(SurgeArrest Essential 雷ガードタップ+ネットワーク回線保護)
      • この記事をはてなブックマークに追加
    • 小型UPS(APC RS 550)
      • ブックマークコメントにこの記事への感想を書いて、Twitter連携した上で、はてなブックマークに追加
    • ※プライベートモードでご利用の方は対象となりません
  • 当選発表
    • 厳正なる抽選の結果、当選された方は後日はてなブックマーク日記で発表いたします
  • 賞品発送
    • 当選発表後、はてなよりメールをお送りし、送付先情報(送付先住所、受取人氏名、電話番号)をお聞きします

文: 村松雄介