Iruca Log

読者です 読者をやめる 読者になる 読者になる

Iruca Log

東京に住むWeb系エンジニアによるデータ分析ブログ

SNSでフォローする!

人気ブログ記事タイトルに最もよく使われる数字は「1」だった [はてブHotEntry分析]

こんにちは、イルカです。

最近趣味ではてなブックマークのホットエントリ入りしたデータを分析しています。
データを分析していて思うのが、「人気記事のタイトルにはほんっとによく数字が現れる」ということ。

今回は、はてなブックマークのHot Entryに入るような人気エントリの記事タイトルに現れる「数字」について詳細を分析しました。

最後まで読むのが面倒な方のためのまとめ

はてなHot Entryに入るような人気記事のタイトルでは、

  • 1桁の数字を使う人が多い
  • もっともよく使われる数字は「1」
  • 半角数字の方が好んで使われる。その傾向は2桁以上の数字になると顕著
  • 数字をタイトルに使った人気記事は年々増加傾向

という事を下記で分析しています。

人気記事のタイトルに数字が含まれる割合

たとえばこの記事を書いている前日の2017年4月28日のはてな人気エントリを調べるだけで、
実に30%の人気エントリのタイトルに数字が含まれていることが分かります。
1日の人気エントリ50件のうち、15件のタイトルに数字が含まれています。

f:id:iruca21:20170430131835p:plain

例をあげると以下のような記事たちです。
www.taiyaki-oyako.com
miurayoshitaka.hatenablog.com


「2017」といった年度や「14億」といった文字も数字として計算しています。

数字をタイトルに入れることのメリット

ブログ記事のタイトルを付ける際に、「数字を入れた方がよい」というのは1つの定説となっています。

Webライターなら知っておくべき「読まれる」記事タイトルの付け方7選 | 【Webライター・編集者】最初の一歩
10個の実例から学ぶ!読まれるブログ記事タイトルの6つのルール
ブログ記事タイトルのつけ方に悩むあなたへ贈る4つのアドバイス

上記はブログの記事タイトルには数字を入れた方がよいよ、というアドバイスのほんの一例です。そのアドバイス記事自体のタイトルにもちゃんと数字が入ってますねー。

成功する人の習慣」と「成功する人の7つの習慣」というタイトルでは、確かに後者の方が情報の量が具体的にされて、説得力が増す感じがするのでクリックしたくなります。
2017年4月28日のはてな人気エントリを見るだけで、「39度の熱」「4000億円の赤字」「14年ぶりの」といった数字が入ることで定量的になり、データの真実味が増していてもっと詳しくみてみようかと思わせる効果があるとのこと。


ちなみに人気エントリ以外で私がランダムにピックアップしたブログ記事50件中では、数字が含まれるタイトルは「7件」(14%) でした。
やはり人気エントリとそれ以外のエントリとを比べると、人気エントリの方が数字がタイトルに入っている割合が高いようです。

今考えると、AKB48というグループ名も「どうして48なの?」と数字の意味を調べさせることで話題性があがり、アイドルの存在が定着しやすくなることに効果があったのかもしれませんね。

タイトルに最もよく使われる数字

次に気になるのは、「じゃあ何の数字がいちばん使われてるの?」ということですよね。
データ分析が趣味ということもあって血が騒いだので調べてきました。

使用したデータと方法

こういうページを使って、はてな人気エントリ3年分53652件の人気エントリのタイトル文字列をかき集めました。

使用したデータは下記に公開しています。この3年間の人気記事を片っ端から集めた53652件のタイトル文字列です。
6MBあるテキストファイルなのでパケット代が気になる方はうっかり開かないように注意!
見たい人は下記URLの頭に「h」を足してブラウザで開いてください。

人気記事入りした事がある人は、自分の書いた記事のタイトルも入っているかもしれません。



ttp://waraeru.tk/hot_entries/hot_entries.txt


集めたこのタイトル文字列に含まれる数字だけを抽出し、出現した回数などの視点からデータを分析しました。

結果

タイトルの文字列を分析した結果、まず「1桁の数字が圧倒的に多く使われる」ことが分かりました。
これは、「10,000」 という数字の使い方はせずに「1万」という書き方をする人が居ることも影響していると思われます。

そして0~10までの数字の使用頻度は以下のようになります。

f:id:iruca21:20170430131944p:plain

最もよく使われる数字は「1」ということが分かりました。そこから数字が大きくなるごとに少しずつ使用頻度が下がってきます。
10という数字はキリがよいみたいで使用頻度が少し高くなりますが、そこから11, 12...となるたびにやはり使用頻度が下がってきます。

面白いのは、なだらかに使用頻度が下がってくる中でも「4」と「6」という数字が若干敬遠されていることです。
死を連想させる「4」と、悪魔の数字と言われる「6」は縁起が悪いので、ブログ記事のタイトルにする場合でもライターが避けている数字であるのだと思われます。

半角数字と全角数字

タイトルには全角数字も半角数字もどちらも現れます。
その割合はどちらが多いのでしょうか?次のグラフを見てください。

f:id:iruca21:20170430131127p:plain

2倍以上半角を使う人が多いという結果です。
こちらのグラフでは「1」のことしか書いていませんが、他の数字も同じ傾向です。

面白いのは「2桁以上の数字を使うときは半角数字を使う人が圧倒的に多い」ということ。
グラフにするまでもないほどの差で、例えば今年のことを書くときに「2017」と書くよりも「2017」と書く人がほとんどです。
タイトルが表示される貴重なスペースの中で、数字が占める割合をあまり大きくしたくないという意思が表れていそうです。

経年変化

年を経過するごとに「数字をタイトルに使った」人気記事の割合は上がっています。
いつまでも増えるとは思いませんが、やはり数字をタイトルに使う人は増えているのですね。

まとめ

はてなHot Entryに入るような人気記事のタイトルでは、

  • 1桁の数字を使う人が多い
  • もっともよく使われる数字は「1」
  • 半角数字の方が好んで使われる。その傾向は2桁以上の数字になると顕著
  • 数字をタイトルに使った人気記事は年々増加傾向

ボヤき

  • 漢数字やローマ数字などその他の数字表現は調べてません、ごめんなさい…。
  • ブログを書くときに大切な0個のこと」っていう記事を中身空っぽで作ったら、クリックする人どれくらい居るかなあ。
  • 半角数字と全角数字使ってる人がいるせいで分析が厄介だったからみんな半角数字に統一しましょう!笑