觅风论坛

标题: 怎么用易语言制作一个采集器?20觅币悬赏源码 [打印本页]

作者: 天空仍鸟飞    时间: 2021-1-7 16:08
标题: 怎么用易语言制作一个采集器?20觅币悬赏源码
怎么用易语言制作一个采集器?20觅币悬赏源码

作者: X2.    时间: 2021-3-10 20:11
爬虫爬虫爬虫爬虫爬虫可以  联系我
作者: 季限网络    时间: 2021-3-15 03:33

爬虫爬虫爬虫爬虫爬虫可以  联系我
作者: xhx1346619697    时间: 2021-3-25 20:23
eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee
作者: 599816128    时间: 2021-3-26 18:33
回复看积分
作者: 黑鲨    时间: 2021-4-4 18:37
等待大佬教学指导谢谢
作者: 心止皆寂    时间: 2021-4-11 20:56
爬虫爬虫爬虫爬虫爬
作者: 阿信    时间: 2021-5-19 23:51
等待大佬教学指导谢谢
作者: pyhhwb    时间: 2021-6-20 18:45
爬虫爬虫爬虫爬虫爬虫可以 采集采集采集
作者: oshell    时间: 2021-6-23 23:44
怎么用易语言制作一个采集器?20觅币悬赏源码
作者: 破破忠诚    时间: 2021-6-28 09:14
什么事采集器????

作者: 1018412219    时间: 2023-6-24 18:04
.版本 2
.支持库 spec

.子程序 采集图片
.局部变量 网址, 文本型
.局部变量 返回文本1, 文本型
.局部变量 正则表达式, 正则表达式类
.局部变量 文件夹数量, 整数型
.局部变量 计次1, 整数型
.局部变量 文件夹名, 文本型
.局部变量 文件夹位置, 文本型
.局部变量 图片地址, 文本型
.局部变量 图片数量, 整数型
.局部变量 计次2, 整数型
.局部变量 图片, 字节集
.局部变量 addr_temp, 文本型

网址 = “https://www.meitulu.com/guochan/
.如果 (组合框1.内容 ≠ “1”)
    网址 = 网址 + 组合框1.内容 + “.html”
.否则

.如果结束

返回文本1 = 编码_utf8到gb2312 (到文本 (网页_访问_对象 (网址, 1, , , , , , , , , , , , , , , , , )))
调试输出 (返回文本1)
正则表达式.创建 (#正则, 返回文本1)
文件夹数量 = 正则表达式.取匹配数量 ()
.计次循环首 (文件夹数量, 计次1)
    图片地址 = 正则表达式.取子匹配文本 (计次1, 1, )
    文件夹名 = 正则表达式.取子匹配文本 (计次1, 2, )
    图片数量 = 到整数 (正则表达式.取子匹配文本 (计次1, 3, ))
    文件夹位置 = 保存位置 + “\” + 文件夹名
    目录_创建 (文件夹位置)
    .计次循环首 (图片数量, 计次2)
        addr_temp = 子文本替换 (图片地址, “0.jpg”, 到文本 (计次2) + “.jpg”, , , 真)
        图片 = 网页_访问 (addr_temp, , , , , “Referer: https://www.meitulu.com/guochan/”, , , , , , , , )
        写到文件 (文件夹位置 + “\” + 到文本 (计次2) + “.jpg”, 图片)
    .计次循环尾 ()
.计次循环尾 ()
提示框 (“采集成功!”)
[code][/code]
作者: 承易    时间: 2023-7-27 17:10
爬哪个网 什么内容
作者: liang670181916    时间: 2023-8-20 08:30
爬虫爬虫爬虫爬虫爬虫爬虫爬虫




欢迎光临 觅风论坛 (https://www.eyyba.com/) Powered by Discuz! X3.4