火车头采集教程之一个简单的文章规则制作

建站教程
21年7月29日
编辑

森西发现好东西

一个简单的文章规则制作

通过采集faq为例来说明采集器采集的原理和过程。
本例以 http://faq.locoy.com/qc-12.html 演示地址。

（1）新建个采集规则
选择一个分组上右击，选择“新建任务”，如下图：

火车头采集教程之一个简单的文章规则制作

（2）添加起始网址
在这里我需要采集 5页数据。

分析网址变量规律
第一页地址：http://faq.locoy.com/qc-12.html?p=1

第二页地址：http://faq.locoy.com/qc-12.html?p=2

第三页地址：http://faq.locoy.com/qc-12.html?p=3

由此我们可以推算出p=后的数字就是分页的意思，我们用[地址参数]表示：

所以设置如下:

火车头采集教程之一个简单的文章规则制作

地址格式：把变化的分页数字用[地址参数]表示。

数字变化：从1开始，即第一页；每次递增1，即每次分页的变化规律数字；共5项，即一共采集5页。

预览：采集器会按照上面设置的生成一部分网址，让你来判读添加的是否正确。

然后确定即可

（3）[常规模式]获取内容网址
常规模式：该模式默认抓取一级地址，即从起始页源代码中获取到内容页A链接。

在这里给大家演示用自动获取地址链接 +设置区域的方式来获取。

查看页面源代码找到文章地址所在的区域：

火车头采集教程之一个简单的文章规则制作

设置如下：

注：更详细的分析说明可以参考本手册：

操作指南 > 软件操作 > 网址采集规则 > 获取内容网址

火车头采集教程之一个简单的文章规则制作

点击网址采集测试，看看测试效果

火车头采集教程之一个简单的文章规则制作

（3）内容采集网址
以 http://faq.locoy.com/q-1184.html 为例讲解标签采集

注：更详细的分析说明可以参考本手册

操作指南 > 软件操作 > 内容采集规则 > 标签编辑

我们首先查看它的页面源代码，找到我们“标题”所在位置的代码：

<title>导入Excle是跳出对话框~打开Excle出错 - 火车采集器帮助中心</title>

分析得出：开头字符串为：<title>
结尾字符串为：</title>
数据处理——内容替换/排除：需要把- 火车采集器帮助中心 给替换为空

火车头采集教程之一个简单的文章规则制作

内容标签的设置原理也是类似的，找到内容所在源码中的位置

火车头采集教程之一个简单的文章规则制作

分析得出：开头字符串为：<div id="cmsContent">
结尾字符串为：</div>
数据处理——HTML标签排除：把不需要的A链接等过滤

火车头采集教程之一个简单的文章规则制作

再设置个“来源”字段

火车头采集教程之一个简单的文章规则制作

这样一个简单的文章采集规则就做好了。

建站到底是用二级域名还是二级目录？

2020-5-25 12:04:40

幻想ACG-幻想素材收集站

2023-11-21 10:07:29

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

文章

评论

关注

粉丝

{{userData.task+'%'}}

嗨！朋友

所有的伟大，都源于一个勇敢的开始

公告：

没有公告

TOP1

资讯 bang.thnn
4月4日
TOP2

资讯 #林允怎敌她千娇百媚# 林允早期芭蕾写真
4月4日
TOP3

资讯 saizneko_2
4月4日
资讯 inkyung97
6月9日
No.8076 美七 [82张+1P]㊙️完整写真合集今日分享：@秀人图
3月23日
资讯 la_vie_enrose_
3月26日
资讯 loveyu_ju 真爱粉专属
4月1日
抖娘利世Rize 感谢领导的栽培～每天上班的乐趣就是和领导
3月25日
抖娘利世Rize 海中月是天上月，眼前人是心上人
3月25日
抖娘利世Rize 祝我们都能在琐碎里找到闪闪的快乐✨ @是
3月25日
资讯 hi__821821
3月26日
资讯 _oxo00_s2 真爱粉专属
4月1日
资讯 yeonyuneko
3月26日
抖娘利世Rize 趁天气好的气候去野餐吧收起旋转
3月25日
轩子巨2兔女仆装我买了好多，这件最满意
3月22日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_¥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部