何か作らないと #
コード書かないと、どんどん世の流れから取り残されていくような気がするので、構想だけでも。
- 指定した URL のコンテンツをゲットして
- 本文? を取り出して
- 形態素解析してタグづけ
- 保存して
- 検索
これで俺ブックマーク完成
実現方法は
- 指定 URL からゲットするのは LWP::Simple でいいかな?
- 本文を取り出す部分は、HTML::Parser とか HTML::TokeParser とか思いつくが、使ったことないので HTML::TreeBuilder 使ってみようかな。。。と思ってたら、HTML::Selector::XPath というのが激しく便利そうだ
- 形態素解析は Text::MeCab で
- タグは HTML::TagCloud か WWW::CloudCreator でタグクラウド表示しよかな
- 今回は使わないと思うが、HTML::Scrubber というのを見つけたのでメモ
。。。と書いておけば、部分的にはコード書くだろ、きっと。