Hpricotでやってみたいこと

  • サーバで動かして自分専用ごった煮RSS
    • RSS配信してないページとかをごにょごにょしちゃう。ありがちだな。
  • cronでまわしていろんなサイトを定点監視>グラフ化(なんとなく。)
  • h1.style1みたいな適当なルール作って最後に正しいマークアップに一括置換。
  • サイト構造を記述したxlsと連携して正しいローカルナビゲーションを自動挿入。
  • サイト内の全ファイルからタイトルとリンクを取得して正しいローカルナビゲーションを自動挿入。
  • javascriptで後付してたアイコンとかクラスをちゃんとHTMLに書き込む
    • a.new a.pdf a.external li.last-child とかとか。
    • 画像右、テキスト左なモジュールに画像のサイズを指定しておいてあとからテキストな要素にstyle="width: npx"を挿入