Greasemonkeyも触ってみた
とりあえず、あちこちでURLの後ろにくっついてる「ref=rss」とか、ITproの「ST=何とか」の類がうざいのでカットしてみた。
var allLinks = document.evaluate('//a[@href]', document, null, XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE, null); for (var i = 0; i < allLinks.snapshotLength; i++) { var thisLink = allLinks.snapshotItem(i); if (thisLink.href.match(/^(.*)[\?&]ref=(rss|rssall)$/)) { thisLink.href = RegExp.$1; } if (thisLink.href.match(/^(http:\/\/itpro\.nikkeibp\.co\.jp\/.*)\?ST=[a-z]+$/i)) { thisLink.href = RegExp.$1; } }
あと残るはCNET JapanのRSSだが、こいつはちょっと一筋縄ではいきそうにない。記事のURLとまったく関連性のない別のURLが並んでて、そこからリダイレクトしてるようだ。てことは、いったんフィードを読み込んで、それから並んでる各URLへアクセスしてリダイレクト先URLを受け取り、それを加工せにゃならんのか。
こういうときにPlaggerってのが使えるのかな? どうもローカルにサーバーを立てるようだと受け取ってるんで、*1 だとすると結果をはてなRSSに渡そうとか思うと、外部から家のサーバーへのアクセスを許さにゃならんことになるんで敷居が高そう。あと、Yahoo! Pipesでもいけるのかも。こっちのほうが(日本語の解説があれば)敷居は低そう。
*1:間違ってます? よく分からん。