みちのえきまにあ

SC59 CBR1000RRで道の駅巡りをしているまったりツーリングライダーのブログ

Twitter
Instagram
Youtube
Qiita
Github
About

ブログの掲載順位、表示回数、クリック数、CTRの相関関係について調べてみました

ブログを書いてる方は、その程度に差はあったとしても、どうせなら多くの人に読んでもらいたいと思っているかと思います。
そのためには、SNSで拡散されたり、Google検索などで上位に表示されたりする必要があります。
今回は検索流入について、掲載順位表示回数クリック数CTRのそれぞれの関係について調べてみたので、その話です。

調べたこと

調べたことは、掲載順位表示回数クリック数CTRの4つの値に対して、2つの組み合わせてそれぞれに相関関係があるのか ということを調べました。
この手の内容はググればたくさん出てくるのですが、実際に自分のブログのデータではどうなってるのか気になったので調べて(計算して)みました。

値としては4つなので、調べる関係性は以下の6通りです。

  • 掲載順位 x 表示回数
  • 掲載順位 x クリック数
  • 掲載順位 x CTR
  • 表示回数 x クリック数
  • クリック数 x CTR
  • 表示回数 x CTR

正直、関係性を調べる必要がないような組み合わせもありますが、ついでに見ておきます。
中でも 掲載順位 x クリック数の組み合わせはイメージしやすいかと思います。なんとなく、掲載順位が上位(値が小さく)なればクリック数が多くなる という負の相関がありそうです。

ちなみにこの4つの値はGoogle Search Consoleの検索アナリティクスで確認できるもので、今回はそれをCSVでダウンロードしてごにょごにょ計算しました。

対象にしたデータは、2017/08/12〜2017/09/08(過去28日間)です。

用語の説明

今回は色々な用語が出てくるので、ざっくりと、簡単にその用語の説明を書いておきます。

  • 掲載順位 ・・・ Google検索など検索されたされた際に表示される位置。10位くらいまでは検索結果の1ページに表示されます。
  • 表示回数 ・・・ 検索結果に実際に表示された回数。
  • クリック数 ・・・ 検索結果に表示され、実際にクリックされた回数。
  • CTR ・・・ 「Click Through Rate」の略で、クリック数表示回数 で割った値。クリック率。
  • 相関係数 ・・・ 2つのデータについて、その関係性を表す値。 -1 〜 1 の範囲で値をとります。正負、それぞれ-11に近くなるほど相関関係が強いことを示していて、0に近いと相関関係が弱いことになります。
    具体的な指標はありませんが、相関係数の絶対値が0.2未満はほぼ関係なし、0.2〜0.4は弱い相関あり、0.4〜0.7は相関あり、0.7〜1で強い相関あり といったクラス分けをすることが多いようです。
  • 相関関係 ・・・ 2つのデータの関係性。相関係数が負の値の場合、一方が増えるともう一方が減る という 負の相関、相関係数が正の場合、一方が増えるともう一方も増える 正の相関 がある という表現をします。

調べ方・計算方法

※細かい計算方法の話なので、結果だけが知りたい方は事項へ飛んでください

相関関係を調べるためには、相関係数を計算によって求める必要があります。それが以下の式になります。

f:id:michimani:20170911171042p:plain

上の式に出てくる値は次のようになります。

  • s_{xy} ・・・ xyの共分散
  • s_xs_y ・・・ それぞれ xyの標準偏差
  • n ・・・ 2つのデータ(x, y)の総数
  • x_iy_i ・・・ 2つのデータそれぞれの個々の値
  • \bar{x}\bar{y} ・・・ 2つのデータそれぞれの平均値

記法はTeXでの記法で書いてます。
ちなみに、上の数式をTeXで書くと下記のようになります。

¥begin{eqnarray*}
r &=& ¥frac{s_{xy}}{s_xs_y} ¥¥
  &=& ¥frac{¥frac{1}{n}¥sum_{i=1}^n (x_i - ¥bar{x})(y_i - ¥bar{y})}{¥sqrt{¥frac{1}{n}¥sum_{i=1}^n(x_i - ¥bar{x})^2}¥sqrt{¥frac{1}{n}¥sum_{i=1}^n(y_i - ¥bar{y})^2}}
¥end{eqnarray*}

※TeXが何なのかはここでは詳しく書きませんが、上のように美しい数式を記述(描画?)することができます。

相関係数を求めるにあたって必要になる値が、標準偏差共分散です。 そして、標準偏差共分散を求めるためには 平均偏差分散、の値が必要です。

平均 は俗に言う平均、偏差平均との差分散偏差の二乗の平均標準偏差分散の正の平方根共分散偏差の積の平均 となりますが、正直これらを手で計算するのはしんどいので、Excel先生におまかせします。

ExcelにはCORREL()という関数が用意されており、引数として相関関係を調べたいデータがある列を指定するだけで、相関係数を出力してくれます。
例えば、A列に掲載順位、B列に表示回数、それぞれ1から30行目までデータが入っているとすると、=CORREL(A1:A30, B1:B30) という記述になります。簡単ですね。

調べた結果

では、実際に調べた結果を。

掲載順位 x 表示回数

相関係数:-0.1367310・・・非常に弱い負の相関(ほぼ相関はない)
一見、掲載順位が高い(値が小さい)と表示回数は増えるので、もう少し負の相関が強めに出るかなと思いましたが、実際はかなり弱い相関関係となりました。これは検索キーワードの性質によるものだと思われます。ニッチなキーワードだと掲載順位は高くなるかもしれませんが、そもそもそのキーワードでの検索が少ないため表示回数としては多くなりません。よりメジャーなキーワードで上位表示されるようなブログだと、ここはもっと強い負の相関が出ると思います。

掲載順位 x クリック数

相関係数:-0.1950356・・・非常に弱い負の相関
この組み合わせについても、掲載順位が高い(値が小さい)とクリック数は増えそうですが、結果は弱い相関関係となりました。これは掲載順位 x 表示回数と同様にキーワードの性質によるものと、あとはブログ記事のタイトルにも影響されます。例えば、掲載順位は1位だったとしても、同じページ内に表示されているであろう2位、3位、4位..あたりの記事のほうが魅力的なタイトルだった場合、実際にクリックされるのは1位の記事ではなくそれ以下の順位の記事となります。逆に言うと、順位が6,7位くらいのちょっと低めだったとしても、記事のタイトル次第ではめちゃくちゃクリックされるということも言えます。

掲載順位 x CTR

相関係数:-0.2625464・・・弱い負の相関
掲載順位との相関については、それぞれ負の相関が出るものだと思っていましたが、上記2つの組み合わせでは望む結果は出ませんでした。CTRとの相関についても同様に弱い相関となりましたが、上記2つに比べると強い相関となりました。やはり クリック となると上位表示されているもののほうが高くなるようです。これは、検索した際にとりあえず上からクリックしてみる という行動を起こしがちであるからだと考えられます。 打率(CTR)が高いのであれば、あとは打席に立つ数(表示回数)を増やせば、全体的なアクセス数の増加に繋がりそうです。

表示回数 x クリック数

相関係数:0.7921067・・・強い正の相関
俗に言う「数撃ちゃ当たる」というやつですね。この結果は、表示される回数が増えればクリックされる回数も増えるということを表しているので、クリック数を増やすためには表示回数を増やす必要がある、そのためには順位を上げる必要があるということになります。僕のブログの場合、「表示回数が少ないとクリック数が少ない」という方向でのデータが多かったので、悪い意味での強い正の相関が出ている気がします。

クリック数 x CTR

相関係数:0.1471738・・・非常に弱い負の相関(ほぼ相関はない)
この相関については指標として考えることはほぼないと思います。たくさんヒットを打っているから打率が高いかというと、そうとは限りません。 なので、おまけ程度の感覚です。

表示回数 x CTR

相関係数:0.0000884・・・まったく関係ない
これについても、クリック数 x CTR同様におまけ程度の感覚です。たくさん打席に立っているからと言って、打率が高くなるわけではありません。

まとめ

結果としては正直微妙な結果ではありましたが、実際に自分のブログを数値化してみると色々見えてくるので面白かったです。 今回はExcelで計算をしましたが、GoogleスプレッドシートでもCORREL()関数は使用できるので、ぜひ計算してみてください。

ちなみに、結果の項で野球に例えている部分がありますが、野球は一切やったことがありません。