今天发现我用的RSS阅读器Firefox扩展Newsfox更新了,发现增加一个很重要的功能,过滤网页。

曾经看过老肥博客的《RSS feed 不输出全文?一样搞定你》,用一个Greasemonkey扩展的一个脚本google reader full feed changer来搞定那些不支持全文输出的feed,感觉很爽,于是切换到Google Reader。用了一段时间,不习惯,换回Newsfox了,我用的是宽屏,还是3栏式界面好。这次更新支持了XPath过滤网页,爽翻了。

使用方法
先不用任何设置,当你看到某些文章出现令人不爽的“点击阅读全文”的时候,在标题面板选中文章,按一下“W”键,那么应该出现文章的全文了,再按一下就切换回来摘要。不过不是所有feed都行的,显示也不一定是全文,也可能是显示了一些多余段落。如果Newsfox不能默认识别,那么就要自己添加规则了。

Newsfox过滤网页对话窗口

在feed的选项窗口多了个“网页过滤”标签,支持3个网页过滤方式

  • RegExp:正则表达式,太难写了。默认就是“<p.*?<\/p>”,也就是显示标签<p>之间的内容,一般能对付部分feed了。
  • JavaScript:不会。
  • XPath:还是XPath最方便,跟google reader full feed changer使用的规则一样。

自定义规则方法如下

  1. 选中过滤规则为“XPath”,在输入框输入XPath表达式,但是多个表达式跟google reader full feed changer不同,直接用“|”符号连成一行就行了。
  2. 然后偷懒点都选“覆盖字符集”为“+”号,自动检测搞定。
  3. 这里有一个“下载后过滤所有新文章后的网页”,勾选它就自动过滤新文章,如果不选,那么在阅读的时候要在标题栏点一下过滤按钮(在标题栏右上角那个按钮选中后才显示)才后过滤,也可以按快捷键“W”。

编写规则
至于规则怎么写,可以参考另一个扩展——Autopager,也是用XPATH做过滤规则用,用它的自动翻页工作室来调试是很方便的。参考(《AutoPager简明攻略三-创建规则》,把自动翻页工作室里的规则复制出来就行啦。更多辅助工具也可看《AutoPager简明攻略四-辅助工具》

其它用途
有了这个功能真实省时间啊,即使feed已经输出了全文连接,不过也可以作为切换为评论内容,比如小众软件煎蛋,每篇文章都有不少人评论,以前看到那句“猛击这里评论,已经有XX人登录火星”总有点冲动点击,现在点击一下“W”键即可显示评论了,爽啊。

规则分享
贴几个常看的网站的XPATH,不过Newsfox还是不支持Cnbeta的重定向(真可恶)。不少博客也不输出全文的,避免得罪人,这里不贴国内个人博客,各位看官自己写吧。

软件更新类
DistroWatch显示更新提要和中文介绍

//table[@class="News1"]/tbody/tr[4] | //table[@class="Info" and position()=2]

Firefox扩展显示介绍和更新信息

//div[@id="addon-summary"] | //div[@id="addon-advanced"]

技巧blog类

小众软件评论
//h6[@class="comments"] | //div[@id="commentlist"]

HowtoForge

//div[@class="node"]/div[@class="content"]

Ubuntugeek

//div[@class="entrytext"]

IT新闻类
LUPA开源社区

//div[@id="articlebody"]

驱动之家新闻

//td[@class="f14_black"]

其它类
新浪体育国际足坛

//div[@id='artibody']

煎蛋评论

//h3[@id="comments"] | //li[contains(@id,"comment")]/div