|
|

10精币
https://sobooks.cc/ 怎么制作这个电子书网站下载链接的爬取 | 窗口程序集名 | 保 留 | 保 留 | 备 注 | | 窗口程序集_启动窗口 | | | | | 变量名 | 类 型 | 数组 | 备 注 | | 程序集_页数 | 整数型 | | | 程序集_标题正则 | 正则表达式类 | | | 程序集_网盘地址 | 正则表达式类 | | | 程序集_文件号 | 整数型 | | | 程序集_错误地址 | 文本型 | 0 |
| 变量名 | 类 型 | 静态 | 数组 | 备 注 | | 网页源代码 | 文本型 | | | | k | 整数型 | | | | 子网页源代码 | 文本型 | | 0 | | j | 整数型 | | | | q | 整数型 | | |
精易Web浏览器1. 浏览网页 (编辑框_网址前缀.内容 + 到文本 (程序集_页数 ) + “.html”)网页源代码 = 编码_utf8到gb2312 (精易Web浏览器1. 取网页源码 ()) 程序集_标题正则. 创建 ( #常量_标题, 网页源代码, , , , ) 如果 (程序集_标题正则. 取子匹配文本 (1, 1, ) ≠ “未找到页面 by epub,mobi,azw3格式Kindle电子书免费下载 - SoBooks”) 程序集_网盘地址. 创建 ( #常量_网盘地址, 网页源代码, , , , ) 如果 (程序集_网盘地址. 取子匹配文本 (1, 2, ) ≠ “”) 输出调试文本 (程序集_网盘地址. 取子匹配文本 (1, 2, ))  输出调试文本 (“城通网盘(备用)未找到:” + 编辑框_网址前缀.内容 + 到文本 (程序集_页数 ) + “.html”)  输出调试文本 (“未找到页面:” + 编辑框_网址前缀.内容 + 到文本 (程序集_页数 ) + “.html”) | 变量名 | 类 型 | 静态 | 数组 | 备 注 | | 开始页数 | 整数型 | | | | 结束页数 | 整数型 | | | | i | 整数型 | | | | k | 整数型 | | |
开始页数 = 到整数 (编辑框_从.内容 )结束页数 = 到整数 (编辑框_到.内容 ) 计次循环首 (结束页数 - 开始页数 + 1, i ) 程序集_页数 = 开始页数 - 1 + i  状态条1. 置文本 (0, “第” + 到文本 (开始页数 - 1 + i ) + “页开始”) 子程序_搜索 () 计次循环尾 (). . .  状态条1. 置文本 (0, “完成”)| 变量名 | 类 型 | 静态 | 数组 | 备 注 | | 时间 | 日期时间型 | | | | 月 | 文本型 | | | | 日 | 文本型 | | | | 小时 | 文本型 | | | | 分钟 | 文本型 | | | | 秒 | 文本型 | | |
时间 = 取现行时间 () 如果 (取月份 (时间 ) < 10 ) 月 = “0” + 到文本 (取月份 (时间 ))  月 = 到文本 (取月份 (时间 ))  如果 (取日 (时间 ) < 10 ) 日 = “0” + 到文本 (取日 (时间 ))  日 = 到文本 (取日 (时间 ))  如果 (取小时 (时间 ) < 10 ) 小时 = “0” + 到文本 (取小时 (时间 ))  小时 = 到文本 (取小时 (时间 ))  如果 (取分钟 (时间 ) < 10 ) 分钟 = “0” + 到文本 (取分钟 (时间 ))  分钟 = 到文本 (取分钟 (时间 ))  如果 (取秒 (时间 ) < 10 ) 秒 = “0” + 到文本 (取秒 (时间 ))  秒 = 到文本 (取秒 (时间 )) 返回 (到文本 (取年份 (时间 )) + 月 + 日 + 小时 + 分钟 + 秒 )
其中
#常量_标题=<h3> <a href="(.*?)" title="(.*?)"
#常量_网盘地址=百度网盘</a><a href="(.*?)?url=(.*?)" rel="nofollow">城通网盘(备用)</
|
回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。 友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。 快捷通道:申请荣誉值 →
|