ブラウザの使用率シェアのバイアス

以前に「ブラウザの使用シェア統計はどれが正確か?」という書き込みをしました。ブラウザの使用率統計としてしばしば引用されるNetMarketShareStatCounterのどっちが信用できるかについての内容でした。

NetMarketShareもStatCounterもアクセスログ分析ツールです。Google Analyticsと同じようなものです。そしてNetMarketShareやStatCounterのツールが導入されているウェブサイトのすべてからデータを集めて、ブラウザの使用シェア統計を算出しています。

しかしここが大きな問題です。ウェブに関わっている人は一人残らずGoogle Analyticsのことを知っていますが、NetMarketShareにしてもStatCounterにしても、全く聞いたことがない人が多いのではないでしょうか。

それもそのはずです。Wappalyzerというブラウザ拡張機能を使って調査されたデータを見る限り、68%のウェブサイトはGoogle Analyticsを導入しているものの、StatCounterはわずか2%のサイトしか導入していないのです。NetMarketShareはこれよりもさらに導入数が少なくなっています。つまりStatCounterおよびNetMarketShareはウェブ全体から見ると極小さい標本サイズしかなく、なおかつ標本の中にバイアスがある可能性が高いからです。

したがったこのような統計を使う場合は、そういうことを心にとめる必要があります。私は以下のように注意しています。

  1. シェア(何%)の絶対値は信用しません。例えば2013年12月時点でInternet Explorerのシェアが57.91%というのは基本的に信用できません。またChromeの16.22%も絶対値として信用しません。原則として傾向だけを見ます。
  2. 複数の国を合算した数値は信用しません。国によって標本サイズが違うからです。StatCounterはこのあたりを公開していて、例えばトルコの標本サイズが異常に高いことがわかります。したがって合算した数値よりは、個々の国の数値の方が意味を持ちます。それでも個々の国を見るのではなく、複数の国を見て傾向を判断することが必要です。
  3. 時系列の変化はある程度信用できますが、実際にグラフを見てみると不思議な挙動が起こることが頻繁にあります。したがって時系列の変化も鵜呑みにできません。

一方でこのようなバイアスを全く考えないで記事を書いているブロガーが非常に多いので、そういう記事は眉唾ものだと思って良いでしょう。