采集外推内容【火车头采集-轻松做外推】

jack 发表于 2012-11-9 分类 SEO | 浏览:

照例,先提供懒人包:http://www.mrlian.com/blog/chajian/采集内容.ljobx

前面两篇文章都是些如何采集外推长尾词采集搜搜问问长尾词【火车头采集-轻松做外推】采集QQYY平台长尾词【火车头采集-轻松做外推】

做外推有了标题接着就是需要内容,一般医疗行业外推人员发外推的文章都是一篇一篇的找。

第一步:添加采集地址

开启软件,找到要采集文章的列表页

http://www.5g91.com/bike/biyan/list_30_1.html

http://www.5g91.com/bike/biyan/list_30_2.html

…..等等

设置获取这些列表页内的内容链接,获取多级地址那设置,(见下图)

写入开始采集区域的和结束区域中的提取网站的头尾标签

第二步:采集内容规则

这里我们需要设置采集的有标题和内容

标题采集规则,我这里的标题前后的标签是<h1></h1>

这里不那么多废话了,前面也看了很多遍了

采集内容规则:跟采集标题都差不多,也是头尾标签,唯一不同的地方在于采集的内容里面会有多余的很多html标签,我们需要把它门过滤掉或者替换掉。

第三步

采集外推内容最难的步骤是第二步,这里只要保存,然后跟前面火车头采集标题长尾词一样,保存发布,运行任务就好了

采集QQYY平台长尾词【火车头采集-轻松做外推】

jack 发表于 2012-11-9 分类 SEO | 浏览:

懒人包:http://www.mrlian.com/blog/chajian/QQYY平台采集.ljobx

采集其他平台标题的方法跟 采集搜搜问问长尾词 方法是一样的。

第一步:采集地址

开启火车头软件,找到相应的地址。

http://hospital.qqyy.com/h26598/zixun/index_1.html

….至最后一页的全部地址

把地址导入采集网址规则当中

第二步:采集规则

掐头掐尾,中间就是我们需要的内容,所以我们需要告诉软件,头尾的标签中间这个是内容


第三步:发布内容设置

所采集网页的编码,保存位置,保存方式,文本编码,选择一下。

 

第四步

点击保存

第五步

点击运行任务—采集成功

 

采集搜搜问问长尾词【火车头采集-轻松做外推】

jack 发表于 2012-11-9 分类 SEO | 浏览:

懒人包:http://www.mrlian.com/blog/chajian/搜搜长尾词采集.ljobx

第一步。

开启火车头软件,我是用v7版本的

第二步。

打开http://wenwen.soso.com 搜索你要的关键词,我的是【福州脑瘫】

http://wenwen.soso.com/z/Search.e?sp=福州脑瘫&sci=0&pg=0 这个是第一页的地址

http://wenwen.soso.com/z/Search.e?sp=福州脑瘫&sci=0&pg=1 这个是第二页的地址

至最后一页

第三步。

查看源代码,这一段就是我们需要的标题长尾词了。

截取标题前后的标签,把标题中包含的标签<em></em>替换掉

第四步。

选择抓取网页的编码。选择导出文本的编码。选择存放位置等信息

第五步。

最后一步,保存,开始运行任务。采集好后,软件会自动导出文档到你设置好的存放位置。