当前位置:首页 > 文章 > 帝国CMS > 正文内容

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

3年前 (2022-10-22)帝国CMS7450

在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

 

可以到下载地址有的是相对地址

 <ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>

有的是绝对地址:

<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>

 

我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断。

首先新建标签  下载地址1,如图:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

 

然后新建标签下载地址2:获取

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

数据处理里新建同义词替换:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

然后新建标签下载地址,组合下载地址2+下载地址1即可。

 

参考规则附上:生活休闲

目标站地址:

http://www.2265.com/game/267030.html

下载地址typeID路径:

http://www.2265.com/inc/SoftLinkType.js

扫描二维码推送至手机访问。

版权声明:本文由蓝博发布,如需转载请注明出处。

本文链接:https://blueboss.cn/p/703.shtml

“火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程” 的相关文章

帝国cms伪静态

帝国cms伪静态

帝国cms伪静态 nginxrewrite ^([^\.]*)/listinfo-(.+?)-(.+?)\.html$ $1/e/action/ListInfo/index.php?classid=$1&page=$2 last; rewrite ^...

帝国cms内容页正文附件下载的调用代码

帝国cms内容页正文附件下载的调用代码

帝国cms内容页正文附件下载的调用代码 [e:loop={"select * from phome_enewsfile_1 where classid='$navinfor[classid]' and id='$navinfor[id]' order by id desc",0,24,0,'','...

帝国cms模板内容页SQl调用当前TAG标签

帝国cms模板内容页SQl调用当前TAG标签

帝国cms内容页SQl方式调用当前TAG标签的方式 具体调用代码如下: <?php $fr=$empire->fetch1("select infotags from {$dbtbpre}ecms_news_data_{$navinfor[stb]} where id='$navinf...

帝国cms模板内容页灵动标签调用当前栏目文章排除当前文章

帝国cms模板内容页灵动标签调用当前栏目文章排除当前文章

解决方法:调用当前栏目信息,栏目ID用:'selfinfo',排除当前信息标签附加sql条件参数用:"id<>'$navinfor[id]'" 举例: [e:loop={'selfinfo',10,0,0,"id<>'$navinfor[id]'"}] <a href...

帝国CMS更新内容提示Table#039;www_**_com.***_ecms_news_data_#039;doesn#039;texist...

帝国CMS更新内容提示Table#039;www_**_com.***_ecms_news_data_#039;doesn#039;texist...

帝国CMS更新整站内容提示:Table 'www_123_com.***_ecms_news_data_' doesn't exist...的解决办法! 相信很多使用帝国cms模板建站的朋友,都有遇到过类似的问题,那么这个是什么问题呢?其实这个是我们后台:871 文章id为871的文章删除了,但是表...

帝国CMS灵动标签从第二条信息开始

帝国CMS灵动标签从第二条信息开始

正常调用文章信息,是从第一条信息开始调用的,或者是逐条调用,那么,假如我们需要从第二条信息开始调用  [e:loop={栏目ID/专题ID,显示条数,操作类型,只显示有标题图片,附加SQL条件,显示排序}] [e:loop={栏目ID/专题ID,'1,2',操作类型,只显示有标题图片,附加SQL条件...