平均値を鵜吞みにしない | 製造業のWebマーケティング | 宮本 栄治
2013年10月23日水曜日

平均値を鵜吞みにしない

アクセス解析データを見るときに平均値はとても便利な指標です。しかし、平均値では見つけることの出来ない異常や問題点、気が付くことの出来ない変化があるのでアクセス解析の中級レベルを目指すならば平均値を鵜吞みしないことが大切です。

平均値を鵜吞みにしない


アクセスデータは分布でとらえる

直帰率や滞在時間、訪問別ページビューなどアクセスデータは平均値だけでなく分布でとらえる必要があります。例えば滞在時間で見てみましょう。平均値に注目すると滞在時間は6分8秒です。直帰率と訪問別ページビューはやや低めの数字です。平均値だけではこのサイトの問題を見逃してしまう恐れがあります。

アクセス解析は平均値を鵜吞みにしない


しかし、下のグラフをよく見てみると少し違和感を感じるはずです。1月11日の訪問時間が1時間38分17秒と非常に長くなっており、その異常値が滞在時間の平均値を押し上げたことが分かります。その日以外の滞在時間は非常に短い可能性があります。平均値よりも大切なのは全データの分布傾向なのです。だからグラフで分布を観察することが大切です。




3種類の平均を使い分ける

通常使う平均値は「算術平均」とも言われます。全データの合計を標本数で割った平均値のことです。算術平均値は計算がしやすくとても便利なので最も使われてますが、デメリットもあります。データに異常や偏りがあると実態とかい離した数値になってしまうことです。

平均値には3種類あります。算術平均、最頻値、中央値です。最頻値とはデータを一定の基準で分けた時にもっとも標本の集中する数値を指します。大多数の訪問者の実態に近いデータと考えてもいいのです。また中央値は全データの中でちょうど真ん中の順位にあたる標本の数値を指します。



このデータの場合最頻値は0-10秒で過半数以上がこのゾーンに入ります。(直帰率が62.68%なので当然ですが・・・)そして、中央値も0-10秒なのです。通常の平均値だとなんとなく見逃してしまうかもしれませんが、最頻値や中央値をみればこのサイトはほとんどページが読まれていないことが分かります。普段使う平均値はデータの分布によっては非常に偏りが大きく実態とかけ離れた数値になるケースがあるので注意が必要なのです。
 中央値と最頻値をチェックして平均値に現れない異常に気付けたらも少しデータを詳しく見て原因を特定します。

平均値に隠された異常値やデータの偏りに騙されない

このように平均値を鵜吞みにすると簡単な異常にさえ気が付かないこともあり得るのです。アクセスデータは平均値、最頻値、中央値という3つの物差しと分布グラフを見て全体像をつかむ必要があります。また各種統計データも平均値には注意が必要です。データの分布を意識して偏りや異常値に注意をすること製品値や中央値を使ってより実態や実感に近いデータを読み取らなくてはなりません。



この記事もおすすめ
生産財1,704サイトのアクセス解析導入率調査
直帰率だけで判断しない
アクセス解析が上手くいかない理由

このブログを検索

このエントリーをはてなブックマークに追加