vForum2011でおもしろかったセッション

あとで資料をアップしてくれると聞いていたけど、まだアップされてないので。

VMware vSphereのよくあるトラブルトップ10 〜サポート現場の事例から〜

  • vCenter Server上でESXiが「応答なし」となるがすぐに復旧する

ESXiのxpxaデーモンがvCenter Serverに対して10秒ごとにUDPでハート日とを送信しつづけており、60秒間に1回も受信に成功しないと「応答なし」という状態になる。ネットワークが混雑していたり処理が遅れると発生するが、すぐに復旧するため、このようなことが(よく)起きる。すぐ復旧した場合は気にしなくて良い。

  • スナップショットへの誤解

スナップショットとは仮想マシンのメンテナンスの際に時間を戻してリストアするためのものであり、長時間保持するものではない。データはVMDKの外に保持するため、ディスクを圧迫するし、これを削除するのも困難になるので、長時間何回もスナップショットをとるのは推奨しません。
KB#1038295参照

  • vCenter Server Databaseのサイズ問題

データベースファイル/トランザクションファイルの肥大化でパフォーマンスエラーが頻発するところがよくある(だいたい半年くらいしてから発生するのが多い)。そのため、パフォーマンス統計情報、タスク及びイベントデータのメンテナンスをきちんとすること。vCenter Serverの設定画面で保持期間を設定できます。

  • HAエージェントエラーの問題

HAプロセスクラッシュ、ネットワークの問題、構成エラーなど様々な要因がある(4.xのころはAAMというモジュールが悪さをしてたり)。運用時のエラーのほとんどは自動で復旧します。構築時は「HAの再構成」を手動で実行して、AAMモジュールを作り直すことでたいてい直ります。
直らない場合はハードウェアに問題があるので早めの交換が必要。早めに交換するために、KB#1033174を参考に、応答しない状態を早めに検知する設定をしてください。

  • 健全性ステータス変更のアラーム

vCenter Server Statusにおいて「状態の変更」、イベントの発生を検知したときに起きる「灰色から灰色」など、ストレージ監視サービスの同期処理で起こる問題はvCenter Server 4.0 U3, 4.1 U2以降は修正されているので、パッチを当ててください。

中小企業向けのサービスです。デデュープストアのサイズにおいて、CIFSネットワークシェアが50GB、VMDKが1TBを超える場合はサポートしてません。大きすぎるとData Revoceryプロセスがクラッシュするので、月1回のアプライアンスのリブートを推奨しています。もしリストアポイントが破損したときは KB#1013387を参考に復旧してください。

  • 長時間起動しているとvSphere Clientがメモリを消費する

原因は調査中です(.Netコンポーネントが悪さしてる?)。vSphere Clientを再起動すると改善します。起動しっぱなしにしないでください。特に、サーバでは起動させないようにしてください。

  • vSphereのパッチの仕組みや情報源などが分かりづらい

パッチには、個別パッチとアップデートリリースがあり、アップデートリリースはそれまでの個別パッチすべてといくつかの追加機能などが含まれます。情報はMLかTwitterから取得してください。
ML: http://support.vmware.com/selfsupport/subscription/
Twitter: #VMwareKB
※TLのRSS: http://twitter.com/statuses/user_timeline/VMwareKB.rss

  • 製品アラートなどの最新の問題のチェック手段

上記以外に、サイトを確認。
http://kb.vmware.com/
画面右の[Additional Resources]内の[Alerts], [Support Insider Blog]を参照。