采集外推内容【火车头采集-轻松做外推】
照例,先提供懒人包:http://www.mrlian.com/blog/chajian/采集内容.ljobx
前面两篇文章都是些如何采集外推长尾词的采集搜搜问问长尾词【火车头采集-轻松做外推】和采集QQYY平台长尾词【火车头采集-轻松做外推】。
做外推有了标题接着就是需要内容,一般医疗行业外推人员发外推的文章都是一篇一篇的找。
第一步:添加采集地址
开启软件,找到要采集文章的列表页
http://www.5g91.com/bike/biyan/list_30_1.html
http://www.5g91.com/bike/biyan/list_30_2.html
…..等等
设置获取这些列表页内的内容链接,获取多级地址那设置,(见下图)
写入开始采集区域的和结束区域中的提取网站的头尾标签
第二步:采集内容规则
这里我们需要设置采集的有标题和内容
标题采集规则,我这里的标题前后的标签是<h1></h1>
这里不那么多废话了,前面也看了很多遍了
采集内容规则:跟采集标题都差不多,也是头尾标签,唯一不同的地方在于采集的内容里面会有多余的很多html标签,我们需要把它门过滤掉或者替换掉。
第三步
采集外推内容最难的步骤是第二步,这里只要保存,然后跟前面火车头采集标题长尾词一样,保存发布,运行任务就好了