PagerDuty始めました。インシデントの可視化を行うPagerDutyのレポート機能【cloudpack 大阪 BLOG】

cloudpack大阪のメンバーのBLOGが続々と公開されました。

<a href="http://pict3.hatenablog.com/entry/2015/08/31/163809" data-mce-href="http://pict3.hatenablog.com/entry/2015/08/31/163809">fluctでお手軽！EC2レスなAWS（API Gateway + Lambda）〜導入編【cloudpack 大阪 BLOG】 - pict3の日記</a>

<a href="http://muranonushi.hatenablog.jp/entry/2015/08/31/200022" data-mce-href="http://muranonushi.hatenablog.jp/entry/2015/08/31/200022">Datadog agentの設定方法【cloudpack 大阪 BLOG】 - J.A.R.V.I.S.を作りたい</a>

<a href="http://cloudfish.hatenablog.com/entry/2015/08/30/184458" data-mce-href="http://cloudfish.hatenablog.com/entry/2015/08/30/184458">ELBとHTTPSとリダイレクトループ【cloudpack 大阪 BLOG】 - cloudfishのブログ</a>元開発メンバー3名・インフラエンジニアからの異色のチームですが

元開発メンバーはどんどんインフラ力を吸収し(cloudpackでの時間は

通常の三倍以上と言われています)、日々成長していますw

※本音は元開発メンバーでも全員技術&リーダーも出来るので、

※短期的な事を考えると、開発で月30人月ぐらい回すほうがありかなと思ったりもしますw

で、今回はPgaerDutyのReoprts機能です。

PgaerDutyのReoprts機能ですが、導入初期に関してはうーんあまり使わないなーって感じで考えていました・・・が

f:id:unioce:20150901160420p:plain

こんな画面で、System/Team/User/Alerts/Incidentsタブで観点(画面)を変更し、

Report by:でService/Escalation Policyを選択(cloudpackのMSPな使い方だと

Service)、

Day/Week/Month/期間設定で表示範囲を指定、

ViewでNumber of Incidents/Mean Time to Acknowledge/Median Time to Acknowledge/90th Percentile Time to Acknowledge/Mean Time to Resolve/Median Time to Resolve/90th Percentile Time to Resolveを指定します。

ざっくりとインシデントの総数やMTTA(Acknowledge(着手)するまでの平均時間)やMTTR(Resolve(解決)するまでの平均時間)などを見て、

各監視対象に対しての客観的な判断が可能となります。

また詳細に関してはIncidents TABを選択し、

f:id:unioce:20150901162943p:plain