NetEyez 活用事例#6「Microsoft365サービス障害解析事例」のご紹介
Net Eyezシリーズ
平素より格別のご高配を賜り、厚く御礼申し上げます。
2023年1月25日 16時-17時頃、国内外の複数エリアにおいてMicrosoftのサービスの障害が発生しました。Microsoft365サービスを利用していたA社でも、Outlookメール、Teams会議、チャットなどのサービスが利用できなくなりました。本件が発生したときにどのように対応したか、情報システム部門の活動を皆さまにご紹介します。
NetEyez活用事例
NetEyezを用いたMicrosoft365サービス障害解析
Microsoftサービスが使えないという社員からの知らせを受け、A社情報システム部門にて原因の調査を開始しようとした矢先、マイクロソフト社による障害アナウンスがありました。
各メディアのニュースサイトにも障害情報が掲載され、担当者は社員に対して障害の通知を行いました。 当時はMicrosoft365サービスが全般に使用できず、メールが利用できないユーザもいたため、メール通知に加え館内アナウンスも実施しました。 並行してNetEyezを用いて社内のネットワークトラフィックの解析を開始しました。
NetEyez活用ポイント
<ステップ1>対象時間のネットワークをパフォーマンス解析でざっくり確認する
これはNetEyezのパフォーマンス解析画面で応答時間統計を示した画面です。
・障害が発生していた16時頃、サーバー平均応答時間が大きく増加している
・同時間帯のネットワークトラフィック(使用率)には目立った変化は無し
<ステップ2>対象時間を絞って、もう少し詳しく確認する
さらに対象時間を絞って詳しく見ていきます
・応答時間の大きい時間帯15:45-17:15にズームイン
・サーバの平均応答時間が特に大きいアプリケーションは、Microsoft365とTeamsと判明
<ステップ3>今度は対象時間をアプリケーションの状況から解析する
パフォーマンス解析画面でMicrosoftアプリケーションの状況を確認します。
・同じ時間帯(15:45-17:15)のMicrosoftアプリケーション平均応答時間統計
・Microsoftアプリケーション全般の遅延が増加している
※NetEyezにおけるMirosoftアプリケーション定義について
【Micosoft365】Microsoft Office製品(Word、Excel、PowerPoint ファイル共有など)
【Microsoft】上記Microsoft365以外のサービス、例えばmsn.com、microsoft.com、windows.net、bing.comvisualstudio.com"など。ただしTeamsやOneDriveなど独立して表示されるものは除く。
【Skype Teams、Skype Call】SkypeサービスのどのURLにアクセスしたかにより細分化して表示されているが、基本的にはSkypeサービス全般を指す。
まとめ
NetEyezによる、今回のMicrosoftのサービスの障害時間帯の通信トラフィック解析から、以下の内容が判明しました。
・障害はサーバー応答時間の増加として観測された。
・障害発生時間帯においてクライアント応答時間とネットワーク応答時間については目立った変化なし
⇒問題はサーバー(サービス)側と考えられる。
・応答時間の遅延とネットワークトラフィック量との相関は確認できなかった。
⇒ネットワークトラフィックに起因するものではない
・応答時間遅延はMicrosoftのアプリケーション全般にわたって発生していた。
A社の情報システム部門担当者は、障害をいち早く察知できるよう、サーバ/アプリケーション応答時間の急激な増加をNetEyezで検知し管理者に通知する機能を東陽テクニカに対してリクエストしました。現在東陽テクニカでは、ソリューションを検討中です。
現在NetEyezではご希望の方に30分のショートデモをおこなっています。お申し込みはこちらまで (neteyez-sales-marketing@toyo.co.jp)
【参考情報】
NetEyez活用事例#1(新ネットワーク移行漏れの機器を防ぐ!)(別ウィンドウ・外部リンク)
NetEyez活用事例#2(無線LAN通信が遅い?)(別ウィンドウ・外部リンク)
NetEyez活用事例#3(夜間の大量トラフィック)(別ウィンドウ・外部リンク)
NetEyez 活用事例#4「Teamsが使えない!」のご紹介(別ウィンドウ・外部リンク)
NetEyez 活用事例#5「社内システムにアクセスできない」のご紹介(別ウィンドウ・外部リンク)