Home > Algorithm > Auto Tagging Function

Auto Tagging Function

タグをまったく活用してないので、自動タギングとかできないものかと思ったりしてます。

まず、これまでのすべての投稿について、文節に切って、品詞分解して、固有名詞、名詞、動詞あたりに分類する。そして分類した各単語をカウントしてみて、一定の閾値を越えると、タグ付けするようにしてみるとか。でも、これだと閾値を越えると過去の投稿に対してもタグ付けしなおさないといけなくなるので、賢くないなぁ。

では、閾値を設けずに過去の投稿に対して、あまりに一般的な単語以外を、とりあえずすべてタグ付けしておいて、表示の段階(タグクラウドとか)で、間引くようにするほうがいいのかな。これだとタグのデータ量が増えすぎる気もするけど。

形態素解析を試してみたのですが、解析データからいかにゴミを除くのかを考えないといけないようです。簡単ではないので、結構いろいろやってみる価値はありそうです。

thatspingの方法はシンプルだけど面白いですね。

Comments:0

Comment Form
Remember personal info

Trackbacks:0

Trackback URL for this entry
http://ma38su.org/2008/03/13/299/trackback/
Listed below are links to weblogs that reference
Auto Tagging Function from ma38su.org

Home > Algorithm > Auto Tagging Function

Feed

feeds

Meta

Return to page top