Greasemonkeyも触ってみた - 副長日誌

　とりあえず、あちこちでURLの後ろにくっついてる「ref=rss」とか、ITproの「ST=何とか」の類がうざいのでカットしてみた。

var allLinks = document.evaluate('//a[@href]', document, null, XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE, null);
for (var i = 0; i < allLinks.snapshotLength; i++) {
	var thisLink = allLinks.snapshotItem(i);
	
	if (thisLink.href.match(/^(.*)[\?&]ref=(rss|rssall)$/)) {
		thisLink.href = RegExp.$1;
	}
	if (thisLink.href.match(/^(http:\/\/itpro\.nikkeibp\.co\.jp\/.*)\?ST=[a-z]+$/i)) {
		thisLink.href = RegExp.$1;
	}
}

　あと残るはCNET JapanのRSSだが、こいつはちょっと一筋縄ではいきそうにない。記事のURLとまったく関連性のない別のURLが並んでて、そこからリダイレクトしてるようだ。てことは、いったんフィードを読み込んで、それから並んでる各URLへアクセスしてリダイレクト先URLを受け取り、それを加工せにゃならんのか。
　こういうときにPlaggerってのが使えるのかな? どうもローカルにサーバーを立てるようだと受け取ってるんで、*1 だとすると結果をはてなRSSに渡そうとか思うと、外部から家のサーバーへのアクセスを許さにゃならんことになるんで敷居が高そう。あと、Yahoo! Pipesでもいけるのかも。こっちのほうが(日本語の解説があれば)敷居は低そう。

*1:間違ってます? よく分からん。