キーワードと誤爆

誤爆」が主に日記作者の側から問題にされる以上、最も広く「作者の意図に反して発生するキーワードリンク」と定義されることになるのは自然な成り行きではあるでしょう。ただ、ここではとりあえず単語の一部や複数の単語にまたがる等の狭義の誤爆と、「あまりに一般的すぎる単語」が日記作者の意図にそぐわないリンクを発生させる広義の誤爆とは、別の問題として分けて考えてみることにします。
「一般的すぎる単語による意図せざるキーワードリンク」では長くてくどいので、以下ではとりあえずノイズリンクと呼びます。狭義の誤爆は、キーワードと日記の文章とで文字列は一致しても単語が一致していないケース、ノイズリンクは単語も意味も一致しているケース。そうすると当てはまらないのが、単語が一致しても意味は一致していないケースです。意味違いの誤爆は、ノイズリンクと表裏をなしている問題ではないかと思います。つまり、キーワードが一般的でない、単語の限定された用法に着目して登録されれば、より一般的な使い方をした日記に「誤爆」(意味違いのリンク生成)するし、その回避策として一般的な用法の単語を登録すれば今度はそれがノイズリンクとなる可能性があるからです。まあこれは狭義の誤爆に対する回避策としての防爆ワード登録においても生じる問題ですけれども。
結局なにが言いたいのかというと、狭義の誤爆については対処の仕方も整理できるけれど、それ以外のノイズリンク・意味違いの誤爆については、回避策が新たな問題を生むなど、整理しづらいので分けて考えましょうということです。狭義の誤爆以外については、「リンクが生じない/捕捉もされない」が理想だけれど、意味が違うキーワードにリンクされるよりは、意味の一致してるキーワードへのリンクの方がまだまし」というのは合意されるのか確認する必要がありそうだけれど。

「意味」とか「当然」とかの典型的なノイズリンクについては、モデレーションがうまく機能してるけど、それ以外では「リンクしたくないキーワード」と「防爆キーワード」と日記の閾値のパズルになって、かえって手間がかかるようになった気がする。前は全部リンクさせて、「そういうもんだ」と思ってたので気は楽だった。気にしだすととたんにあれもこれも気になって。