采集外推内容【火车头采集-轻松做外推】

jack 发表于 2012-11-9 分类 SEO | 浏览:

照例,先提供懒人包:http://www.mrlian.com/blog/chajian/采集内容.ljobx

前面两篇文章都是些如何采集外推长尾词采集搜搜问问长尾词【火车头采集-轻松做外推】采集QQYY平台长尾词【火车头采集-轻松做外推】

做外推有了标题接着就是需要内容,一般医疗行业外推人员发外推的文章都是一篇一篇的找。

第一步:添加采集地址

开启软件,找到要采集文章的列表页

http://www.5g91.com/bike/biyan/list_30_1.html

http://www.5g91.com/bike/biyan/list_30_2.html

…..等等

设置获取这些列表页内的内容链接,获取多级地址那设置,(见下图)

写入开始采集区域的和结束区域中的提取网站的头尾标签

第二步:采集内容规则

这里我们需要设置采集的有标题和内容

标题采集规则,我这里的标题前后的标签是<h1></h1>

这里不那么多废话了,前面也看了很多遍了

采集内容规则:跟采集标题都差不多,也是头尾标签,唯一不同的地方在于采集的内容里面会有多余的很多html标签,我们需要把它门过滤掉或者替换掉。

第三步

采集外推内容最难的步骤是第二步,这里只要保存,然后跟前面火车头采集标题长尾词一样,保存发布,运行任务就好了