- 2008-03-13 (Thu) 22:13
- Algorithm
タグをまったく活用してないので、自動タギングとかできないものかと思ったりしてます。
まず、これまでのすべての投稿について、文節に切って、品詞分解して、固有名詞、名詞、動詞あたりに分類する。そして分類した各単語をカウントしてみて、一定の閾値を越えると、タグ付けするようにしてみるとか。でも、これだと閾値を越えると過去の投稿に対してもタグ付けしなおさないといけなくなるので、賢くないなぁ。
では、閾値を設けずに過去の投稿に対して、あまりに一般的な単語以外を、とりあえずすべてタグ付けしておいて、表示の段階(タグクラウドとか)で、間引くようにするほうがいいのかな。これだとタグのデータ量が増えすぎる気もするけど。
形態素解析を試してみたのですが、解析データからいかにゴミを除くのかを考えないといけないようです。簡単ではないので、結構いろいろやってみる価値はありそうです。
thatspingの方法はシンプルだけど面白いですね。
Comments:0
Trackbacks:0
- Trackback URL for this entry
- http://ma38su.org/2008/03/13/299/trackback/
- Listed below are links to weblogs that reference
- Auto Tagging Function from ma38su.org