なんのはなしかというと、コレです。
ということで事例が1つしか挙がってないのですが、これはほかに事例はあるのかな?
見出しに[はてな夢日記]と書いた際に、「はてな夢日記」よりも「[はてな」が優先されてリンクされてしまう
この例からいうと、キーワード誤爆系の中でもけっこう面倒な感じの「セクションカテゴリ捕捉用キーワード」が誤爆するというケースということですよね。本文のキーワードなら [[ と ]] を使って*1ある程度はコントロールできるけど、セクションカテゴリのところだけでは [ と ] が意味を持つので、これが使えない。それ故に問題になっている(ということでいいんだよね?)
それならセクションカテゴリの問題として解決したほうがいいんじゃないのだろうか?
つまりキーワードマッチを調べる際に、セクションカテゴリの部分だけは本文と別処理として、
- セクションカテゴリの一部にキーワードがマッチするのを止める。
- つまり必ずセクションカテゴリ全体がキーワードと比較される。
- [ と ] を含むか除くかでバリエーションが考えられる。
- つまり必ずセクションカテゴリ全体がキーワードと比較される。
- セクションカテゴリでキーワードマッチするときには [ と ] を除外する。
- 現行のいくつかの捕捉用キーワードが無意味になるという弊害がある?
- いっそのことセクションカテゴリをキーワードマッチさせるのを止めてしまう。
- 代わりに別の仕組みを用意する。
くらいの案があるんじゃないかと思いました(もっとあるかもしれない)。
今回のはてなの質問は、負荷が高いのでキーワードマッチのアルゴリズムを変更したいという応急処置的なところから来ているから、上の解はどれも「負荷の軽減」という意味では逆効果なのかもしれない。けども、そういう見方もあっていいのではと思ったので書いてみました。
ついでなんで完全にタグ化するってのはどうだろう?
もし上の中でどれかを本当に検討するっていうことになったら、個人的には3番目を推したい。
セクションカテゴリはダイアリーの中でも特別な部分なんだから、キーワードマッチングとかさせない。そもそもセクションカテゴリからはカテゴリアーカイブへのリンクが貼られていて、キーワードリンクも作られないんだから、キーワードに捕捉されてキーワードのほうからだけリンクが張られるというのもなんか変。
その代わりに、セクションカテゴリは完全にタグ化させる。
http://d.hatena.ne.jp/t/はてなへの要望
てな感じのURLにアクセスすると、[はてなへの要望] セクションカテゴリ(タグ)を含むダイアリーの一覧が見れる、みたいなそういう実装にすると、Web 2.0系企業として……ってなんかこれって以前も書いた気がするけど、面白いんじゃないかなあとは思うんですが、どうでしょうね。
*1:【おしえて】いまここのカギ括弧を表示させるのに数値実体参照を使ってるんだけど、カギ括弧のキーワードリンク機能をエスケープさせて表示させるすることってできましたっけ?【えらいひと】