A-A+

巧用Feed43生成任意网页的RSS订阅源(Feed)

2014年04月12日 电脑网络

一直关注某个网站,却发现该网站没有输出Feed,还能用RSS阅读器订阅吗?

如果你现在看一下三好公民的RSS阅读器,你会发现订阅的网站五花八门,甚至包括微博,并且有些只是订阅了网站的某一个栏目或页面,而这些栏目和页面是没有提供RSS订阅源的,也没有输出Feed。那么三好公民是如何订阅的呢?

这就需要借助在线工具Feed43,通过Feed43理论上说可以生成任意网页的RSS订阅源(Feed),从而实现订阅任意网页。下面三好公民就用自己的一个订阅做例子来示范一下:

例如三好公民一直关注中关村在线软件频道的技巧应用页面,但是该页面没有提供RSS订阅,每天都要单独打开该网页才能查看有没有更新文章,很是麻烦。现在我们使用Feed43来自行为该页面生成RSS订阅源(Feed)。

首先访问Feed43网站,点击“Create your own feed”链接打开新建Feed页面。

步骤一:指定源页面地址

在地址框中输入中关村在线软件频道技巧应用页面的网址。如图:

巧用Feed43生成任意网页的RSS订阅源(Feed)

后面的Encoding框中填写网页编辑类型,通过查看网页源文件头部的<meta charset="***">代码能够看到,该网页是 gbk 。然后点击“Reload”按钮即可在下面的文本框中显示当前负面的源代码。

步骤二:定义提取规则

我们先观察一下网页的源代码,从中找到需要订阅的文章列表部分的代码,然后发现其中的规律,再总结成符合Feed43要求的提取规则。例如该网页的文章列表部分每一篇文章条目的代码为:

1
2
3
4
5
6
7
8
9
10
11
12
		  <div class="news_list">
			<dl class="nl_con1 clearfix">
			  			  <dt><a href="http://soft.zol.com.cn/446/4466341.html"><img src="http://2e.zol-img.com.cn/product/132_200x150/24/cei5IS3lHETTg.png"  alt="学长教你升级XP Win8.1系统安装指南"/></a></dt>
			  			  <dd ><h4 class="nlc_tit"><a href="http://soft.zol.com.cn/446/4466341.html">学长教你升级XP Win8.1系统安装指南</a></h4><p class="nlc_time">2014年04月12日 05:42    作者:<em><a href="http://service.zol.com.cn/doclist_231_3_1_%C2%ED%C8%D9.html">马荣</a> 【原创】</em></p>
			  <p class="nlc_info">XP已经在几天前正式退休了,所以经常找学长帮忙的重装电脑的学弟学妹们也要犯愁了。其实完全没有必要,因为我们干脆直接升级到Win8.1就能解决所有的问题了。现在作为一个大学长,我们现在就教大... [<a href="http://soft.zol.com.cn/446/4466341.html">详细</a>]</p>
                                      <br />
                    <span class="nl_tag">
                       标签:<a href="/detail_10036/">最新</a>&nbsp; | &nbsp;<a href="/detail_10038/">应用技巧</a>&nbsp; | &nbsp;<a href="/detail_11633/">win8应用</a>&nbsp; | &nbsp;<a href="/detail_11942/">桌面软件</a>                    </span>
                            </dd>
			</dl>
			<div class="nl_feed"><span class="v_c"><a class="view" href="http://soft.zol.com.cn/446/4466341.html">查看全文</a><a class="comm" href="http://soft.zol.com.cn/446/4466341.html#add_comment">我要评论(4)</a></span>http://soft.zol.com.cn/446/4466341.html</div>
		  </div>

其中对我们订阅有用的无外乎文章标题和链接,最多再加上发布时间。那么根据Feed43的提取规则,我们把其中需要的部分用 {%} 表示,不需要的部分则用  {*} 表示。从而总结出如下提取规则输入到“Item (repeatable) Search Pattern”框中。

1
<dl class="nl_con1 clearfix">{*}<dd ><h4 class="nlc_tit"><a href="{%}">{%}</a></h4><p class="nlc_time">{%}<em>{*}</em></p>{*}</dl>

如图:

巧用Feed43生成任意网页的RSS订阅源(Feed)

有朋友会问,上面还有一个“Global Search Pattern”设置框没有填写呢?其实该框可以空着,要么就填写一个文章列表部分开头和结果的代码,中间加上 {%},例如:

1
<div class="nlc_wrap" data="data110">{%}</div>

然后点击“Extract”按钮即可预览到根据你定义的提取规则所抓取的Feed内容。

步骤三:定义输出格式

Feed43会自动生成该页面Feed的标题名称、链接地址和描述,而Feed的内容格式就需要你自己定义了,根据步骤二中预览到的Feed内容,填写相应的条目代码即可。如图:

巧用Feed43生成任意网页的RSS订阅源(Feed)

最后点击“Preview”按钮,即可预览到已经定义好了格式的Feed内容了。

步骤四:获得RSS feed订阅源

现在已经大功告成了,你已经可以看到生成的xml格式的RSS订阅源文件了。如图:

巧用Feed43生成任意网页的RSS订阅源(Feed)

复制该xml文件链接地址,然后就可以在RSS阅读器中添加订阅了。添加后订阅效果如图:

巧用Feed43生成任意网页的RSS订阅源(Feed)

最后提醒一点,虽然三好公民没有验证,但为了保证你新建的Feed能够正常更新,最好注册一下Feed43帐户,然后在你刚才创建Feed的页面底部点击“Add this feed to my account”,把刚刚创建的Feed添加到你的账户中。也可以登录Feed43帐户后,点击窗口顶部的“My Feeds”,然后点击“Add feeds to your account / Undelete feeds”,“Feed Name”就填写本例中的xml后缀前的那串数字“7086365652112806”即可。不过免费用户的Feed更新频率是6小时,升级为付费用户后可以提高到1小时一更新。

微信扫码
支付宝扫码
请打赏,这是对本文作者最实在的帮助和鼓励!