
我们网站使用wordpress等程序的话在文章中加上合适的tag标签还是有挺多好处的。之前教程没有写过这个文章,前几天遇到了这个问题咨询了其他大佬解决了。下面给大家分享一下操作教程。
教程总目录:火车头采集器使用教程
操作教程
本次教程就仅仅贴出有关tag标签的原文代码段了。代码如下
这里是正文</p></div> <div class=“tags” data-v-99fc881e><a href=“/tag/whitepaper” data-v-99fc881e>白皮书</a><a href=“/tag/huobi” data-v-99fc881e>火币</a><a href=“/tag/binance” data-v-99fc881e>币安</a><a href=“/tag/DeFi” data-v-99fc881e>DeFi</a></div> <!—-> <!—->后面是相关文章
这段代码是在正文和相关文章之内。
我们先看一下他的结构。
<div class=“tags” data-v-99fc881e><a href=“/tag/whitepaper” data-v-99fc881e>白皮书</a><a href=“/tag/huobi” data-v-99fc881e>火币</a><a href=“/tag/binance” data-v-99fc881e>币安</a><a href=“/tag/DeFi” data-v-99fc881e>DeFi</a></div>
这是这段tag的整段代码。
我们要提取其中的:白皮书、火币、币安、DeFi,这四个标签。
所以采集规则可以这样写:
前后截取:
<div class=“tags” data-v-(*)>
后面到:
</a></div> <!—->
这样火车头获取到的就是:
<a href=“/tag/whitepaper” data-v-99fc881e>白皮书</a><a href=“/tag/huobi” data-v-99fc881e>火币</a><a href=“/tag/binance” data-v-99fc881e>币安</a><a href=“/tag/DeFi” data-v-99fc881e>DeFi
火车头发布到wordpress时每一个tag之间使用英文”,”分号来作为间隔。那么我们就可以将这一段内容做一下替换
<a href=”(*)” data-v-(*)>替换为空值
</a>替换成英文分号”,”
这样得到的结果就是:白皮书,火币,币安,DeFi
提示
代码中有星号代替的内容,比如<a href=”/tag/whitepaper” data-v-99fc881e>这一段我使用了<a href=”(*)” data-v-(*)>代替。
这是因为/tag/whitepaper这个链接地址是随机的,他不同的标签链接的地址不同,99fc881e是他网站隔段时间就会生成不同的样式,这里也是变化的,所以必须使用星号来替换掉。不然采集没多久就会采集失败。
操作思路
1.确定tag代码段
2.分析每个tag标签之间的相同字符,并将其替换成分号分隔符
截图如下
声明:本站所有文章,如无特殊说明或标注,均为用户转载互联网发布本平台。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可文章底部留言48小时处理。