Web
965 词
无聊的前言前几天溜阿松有点多,心血来潮想到一个有意思的炒作点子。但要实现需要几十个视频封面,虽然F12找图片直链很容易,但一个一个下实在有点麻烦,刚好在学python的requests库,就想写个爬虫全爬下来。 爬虫基本思路爬虫有很多写法,Java,JavaScript,Python都可以,但python的requests库很方便,最常用的明显是python爬虫。在具体代码实现层面,大多数爬虫都有非常相似的结构: 分析网页结构,找出有规律的接口 利用requests库发起请求 这两个过程是通用的,但对下面的操作,静态网页与动态网页不同: 对静态网页,利用beautifulsoup库解析页面抓取内容对动态网页,利用json库解析得到的json数据静态网页即在浏览网页过程中没有浏览器与服务器交互的网页,此时Ctrl+u与F12审查元素得到的源码相同,直接发起请求,再用bs4库解析网页源码内容即可. bs4库也是非常好用的python解析库,对于爬虫,找到需要爬取部分的网页源码,然后注意其周围唯一的元素名或class名再用find_all()具体解析即可。 例如: 12345678...
Web
1.8k 词
引言前几天复习C语言,摸鱼了几天之后准备去学校的考试平台上做个题练练手,结果太久没登忘记密码了😓结果发现重置密码只需身份证号,而身份证号这种信息在同学之间几乎完全可见,忍不住想到有意思的事。 不过有个问题,重置之后受害者发现登陆不了,只需要重新重置一次不就可以了?那重置似乎也没什么意义……又想了想,如果我能写个脚本,不断重置密码,在受害者重置完到输入密码登录的间隔中又重置了一次密码,岂不就可以做到始终让受害者卡在登录和重置页面了吗?听起来有意思,刚好最近我又在鼓捣**curl** ,对用shell发起请求比较熟悉,就着手试着写了下。 注:因为我在楼下的二手书店里淘来的Linux教程写shell编程用的bash,以下基于bash语法。 简单的实现如上所述,不断发起请求需要用到循环,就去查了下shell脚本中循环的语法: 12345for((i=0;;i++))do echo "hello world!" pwddone 因为for循环的第二个遍历条件为空,故如上的脚本将无限循环输出hello world和当前目录(pwd)。 下一步就是如何发起修...