はてなダイアリーキーワードー誤爆回避

id:herecy8:20060515#p2 で誤爆回避専用キーワードがどのくらい効果があるのか測定するというようなことを考えて、試しにといくつか調べてみました。えらくメンドくて始めてすぐ後悔したけど。

なっち

キーワード 含む日記件数 逆進誤爆 改善率
(合計) 2,466 - -
なっち(正解) 272 - -
なっち誤爆 12 89.0% -
なっちゃ 2,032 37.3% 51.6%
なっちま 126 11.7% 25.6%
なっちょ 10 8.7% 3.0%
なっちゅ 7 6.5% 2.2%
なっちった 7 4.2% 2.3%
なっちってる 0 4.2% 0.0%

期間:5月14日〜5月19日
逆進誤爆率は、誤爆回避語を一つ登録するごとに下がっていく誤爆率を示します。「なっち」だけの場合の誤爆率は89.0%、「なっちゃ」を登録するとそれが37.3%にまで下がります。更に「なっちま」を加えると誤爆率は11.7%まで下がります。回避効果はこの二つが劇的に大きいと言えるでしょう。逆に、これ以上追加しても、さほどの効果は期待できなさそうです。
わずか5日半の調査ですが、キーワード統計グラフを見れば基本的な傾向は期間を広げてみてもそう変わらないようです。回避しきれていない誤爆がどのくらいかはグラフからでは読み取れませんが。
5日ちょっとで二千の日記を集める「なっちゃ」のリストに積極的な意味がないということをどう考えるかという問題は残りますが、「なっちゃ」「なっちま」の回避効果が高いことは明らかです。

さゆ

キーワード 含む日記件数 逆進誤爆 改善率
(合計) 256 - -
さゆ(正解) 224 - -
さゆ誤爆 6 12.5% -
さゆえ 26 2.6% 9.9%

期間:5月14日〜5月19日
対象期間で偏りがあるのかもしれませんが、「さゆ」はもともと誤爆率は低いようです。「なっち」系の回避語に比べると少ないですが、「さゆえ」は10%程度の回避効果があるようです。

調査対象期間が短いので予備調査の域は出ていないと思いますが、とりあえず誤爆率の改善が10%というのは一つのメルクマールになるのではないでしょうか。>id:n_kakka, id:naka64