#256 全文検索を多用しない理由   13 years ago (minakaji) Document
何が問題になるのかと改めて考えてみると、やはりタグの数が増えていくに従って全体を把握できなくなり、結果的にタグでの検索を利用しなくなる、結局のところ全文検索だけを使うという状態になることでしょうね。こうならないためにはやはりタグで何を表現したいのか、何のためにタグ付けするのかを意識する必要があるのではないかと思っていて、それが「キーワードとタグを混同しない」というルールにつながったりしています。
少なくとも私にとってはキーワード=タグですね。全文検索はあるはずの情報が出てこないとき、いわば非常時にしか使いません。
<理由>
  1. 検索キーワードには揺れが生じるから(「こうもり問題」を「コウモリ問題」で検索しても出てこない)
  2. 検索して抽出したフラグメントのグループは刹那的だから(グループが構造化されていない、キーワードの揺れ・失念によって再び同じグループが目の前に出てくるとは限らない→自分の記憶に固定するのに利用しにくい)
  3. ファイルフラグメントの中身は検索できない
ですのでシングルユーザ環境では必ずタグを付けます。しかもあまり悩まないでできれば複数つけます。それが将来どう整理されていくのかフラグメント作成段階では予想がつきにくいから。
そういう使い方をすると、ご指摘のようにタグによる全体把握が難しくなり、タグでの検索が煩雑になり、使われないタグも生じます。それは自分で整理するしかありません。しかし、#253でも申し上げたように、Piggydbの場合はそれが比較的低コストで実現でき、自分の頭の整理になります。
最初から入力するフラグメントコンテンツがある程度予想がつく場合、またはマルチユーザの場合のようにコンテンツの完全なコントロールはできないがownerが取り出したい(整理したい)話題がある程度決まっているようなときには、美しく一貫性のあるタグツリーを設計することは可能かもしれません。
 
  • → + #258 タグとつながりの使い分け   13 years ago (owner) Document