其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

火车头采集器自动发布设置-免费自动采集发布教程

GG网络技术分享 2025-03-18 16:14 0


大家好,这里是关于[火车头采集器图片采集上传设置],[火车头采集器自动发布设置-免费自动采集发布教程]问题的解答,希望对您有所帮助。如果你还想了解更多这方面的信息,请关注本站其他相关内容,共同学习吧!

火车头采集器图片采集上传设置

教程大全火车头,火车头采集图片,火车头采集教程

火车头采集器图片采集上传设置

前面我们写了基础的标题和文章采集,下面介绍下图片的采集。

图片采集不是必须的,但是图片可以丰富网站的内容,具体我也不清楚对网站的SEO有什么影响。我测试采集图片和不采集图片收录没区别,我见到的一些采集站,大部分也是不采集图片的!

如果采集数据量比较大的话可以选择不采集图片。

正文开始

首先是火车头采集器上的设置。

我们以这个文章为例:https://server.zzidc.com/serverhosting/3117.html

这个里面有一张图片,并且也是前面我们教程里用做示范的网站。

声明:本人目前没使用任何景安的产品(以前用过),也对他产品印象不好。仅做教程示例,没有推荐他产品的意思。

我们直接打开前面教程创建的那个火车头采集任务。

在内容采集规则-内容-文件下载里面

选择:将相对地址补全为绝对地址、下载图片

文件地址必须包含:uploads/allimg

这个必须包含是根据不同网站来设置的,比如本文教程里文章图片地址是:

https://server.zzidc.com/uploads/allimg/191015/1-191015150925U2.png

那么除掉前面他网站域名和后面会产生变化的文件名日期格式的目录名之外剩余的基本就是我们想要的内容,所以我这里让图片文件地址必须包含uploads/allimg。

为什么这么做?

因为他有可能在文章里加入图片广告,图片广告为了便于修改,大部分都是采用单独目录内放图片广告的方式。这样以后该广告比较容易。新老文章都能一次修改掉。

文件保存目录:i\\m\\g/yyyyMMdd

这个目录是你采集器的本地电脑和服务器里面要创建的目录,先存到本地然后上传到服务器里。

目录里面的\\斜杠是因为默认img里面m和g会被火车头识别为内置函数(字母颜色会变绿),没办法正常解析,所以加上斜杠。正常的话是img/yyyyMMdd这样的

含义:表示保存到网站的/img目录下,然后根据年月日自动创建对应的目录。

然后是在内容的-HTML标签排除里面,我们去掉图像<img这个标签的排除。因为排除后我们发布后文章内就没有调用图片,自然不会显示图片内容。

然后我们进行图片的上传设置,我们采集时候顺序是,先将图片下载到本地,然后传到服务器这样一个步骤。

通过FTP的方式来上传。

先在宝塔面板上传建一个FTP账户,FTP默认目录要设置在我们网站跟目录。

采集器会根据我们上面的设置自己创建对应的目录。

注意:FTP使用的端口记得打开!21、20、39000-40000不打开端口你图片自然传不了。放行20和39000到40000这些端口是因为宝塔的FTP经常出现FTP连接错误的情况,这是另一个问题。这里不给大家解释了,不然篇幅太长了。

打开火车头采集器:其他设置、FTP文件上传、FTP上传

服务器:填写你的服务器IP地址

用户名/密码:刚才创建的FTP账户和密码

端口:默认21

文件上传根目录:/

次序:先发布数据

文件上传成功后删除本地文件:是

这里也可以选择否,选择是的话可以减少采集器所在机器磁盘的占用,而且上传成功的图片,也没必要在保留了。

设置好了之后我们点一下上传测试文件:

看下下面的框里显示的信息,有没有成功上传,并且打开网站目录内也看下有没有测试文件Test.zip被上传。

测试OK的话保存一下设置,我们测试下看看采集效果

https://server.zzidc.com/serverhosting/3117.html

把这个网址填入到网址采集规则里

因为我们测试的直接是一个内容页网址,所以网址采集规则下面我们要点一下:起始网址就是内容页网址

保存,然后清空任务采集数据

运行任务

看运行日志没问题,我们到网站上看看有没有发布上

文章正确进行了发布,4个图片都正常显示了

文章里开头我写的采集网址是/serverhosting/3117.html这个文章地址,后面截图里面的文章地址是fwqjc/2018/1203/2825.html这个。

没有影响,主要我写文章中间中断了一次去做其他事了。。

火车头采集器自动发布设置-免费自动采集发布教程

火车头采集器发布设置,要更好的使用火车头采集器软件,必须需要有基本的HTML基础,能看得懂网页源码,网页结构。 同时如果用到web发布或数据库发布,则对自己文章系统及数据存储结构要非常了解。当然对HTML和数据库不是很了解可以使用采集发布软件吗?当然不是,我们可以使用更简单的免费采集发布软件各大网站发布详细如下图

各大网站自动发布:无须花费大量时间学习软件操作,一分钟即可实现自动采集→内容处理→发布到网站。提供全自动系统化管理网站,无须人工干涉,设定任务自动执行,一个人维护成百上千网站也不是问题。



1、CMS发布:目前是市面上唯一同时支持帝国、易优、ZBLOG、织梦、WordPress、苹果CMS、人人CMS、米拓CMS、云优CMS、小旋风站群蜘蛛池、Thinkcmf、PHPCMS、Pboot、Fadmin、Destoon、海洋CMS、极致CMS、Emlog、Emlogpro、Typecho、TWCMS、WordPress社区版本、迅睿CMS、WXYCM、DZ论坛等各大CMS,并且可同时批量管理并发布的工具

2、对应栏目:相应文章可发布对应栏目(支持多栏目随机发布文章)

3、定时发布:可控制发布间隔/单日总发布数量

4、监控数据:软件上直接监控已发布、待发布、是否伪原创、发布状态、网址、程序、发布时间、全网搜索引擎推送收录等



指定网站采集:任意网站的数据都可以抓取,所见即所得的操作方式,只要点点鼠标就能轻松获得自己想要的数据,支持多任务同时采集!



输入关键词采集文章:同时创建多个采集任务(一个任务可支持上传1000个关键词,软件同时还配备了关键词挖掘功能)



监控采集: 能够定时的对目标网站进行采集,频率可以选择10分钟、20分钟、根据用户需求自定义设置监控采集(自动过滤重复,监控新增文章)。



标题处理设置: 根据标题或关键词自动生成标题(不管是双标题还是三标题都可以自由生成,间隔符号自定义填写,自建标题库生成,自媒体标题党生成,标题替换等等)



图片处理设置:图片加标题水印/图片加关键词水印/自定义图片水印/自定义图片库替换。不仅可以保护图片的版权,同时还能防止图片被盗,图片加上水印后就形成了一张全新的原创图片。



内容自动伪原创设置:伪原创是指把一篇互联网上其它文章进行加工,使其让搜索引擎认为是一篇原创文章,从而提高网站权重,从此再也不用担心网站没有内容更新!



关键词优化设置:内链有助于提高搜索引擎对网站的爬行索引效率,更利于网站的收录。再搭配自动敏感词过滤避免被搜索引擎降权,让网站拥有更好的收录与排名。


火车头发布发布模块制作教程(WEB发布模块不一样,每个需要自行制作)

网站自动登录:设置网站登录信息的数据 获取栏目列表:设置发布的栏目列表

网页随机获取:设置post数据内的随机值

内容发布参数:设置发布页面POST数据包

高级功能:文件上传设置以及数据构造

打开fiddler(注意,如果有乱七八糟的数据流,请先Ctlr+X 清空数据流)分析fiddler里的数据包,将fiddler点击 ①➯ ② ,依次点击数据流列表⑤ 找到POST类型的数据流⑥, 然后点击⑦ 以文本的形式查看

根据上面的数据包得出: 网站编码是:utf-8 (可以在您的网站右击查看源代码,查找charset字段值,具体看编码)

网站地址是: 网站地址可以根据POST 和Referer字段自定义,一般我们用网站域名做网站地址,也可以找其他的2个设置的共同部分做网站地址。

cookie是: menuitems=1_1%2C2_1%2C3_1; PHPSESSID=f21a42f70199c81955f3219623343735; DedeUserID=1; DedeUserID__ckMd5=91a12e3e1eae3a4d; DedeLoginTime=1444806848; DedeLoginTime__ckMd5=65d5fa4845a7ec00; ENV_GOBACK_URL=%2Fdede%2Fdede%2Fcontent_list.php%3Fchannelid%3D1

user-agent是: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.124 Safari/537.36

然后我们把发布POST数据 里的值 替换成标签。双击选中表单值,然后鼠标悬停在 标签按钮上,对应选择要替换成的标签名即可,可选系统标签,常用标签,时间标签。

标题,来源,内容,时间 很方便确认识别。

在这里给大家讲解下“[分类ID]” 系统标签。

此标签是用于接下来我们的获取栏目列表设置做铺垫的。

那么如何确定 哪个表单名 就是 [分类ID]呢?

标签: 帝国 苹果CMS

提交需求或反馈

Demand feedback