0X00 前言
快開學了,看到空間里面各種求填寫調查問卷的,我才想起來貌似我也還沒做。對于這種無意義的問卷,我是不怎么感冒的,所以我打算使用”特技”來完成,也就是python,順便重新復習一下python,真的好久沒用了。下面,表演開始……
0X01代碼編寫思路
首先先創建一份問卷
我們隨便填寫一個問卷并提交,在提交之前開啟Burpsuite截獲數據包
對于截獲的數據包進行分析,有的被url編碼了不利于分析,可以使用Burpsuite編碼模塊解碼替換,這樣就好分析了
通過觀察可以發現,post了一串奇怪的數據submitdata=1$2}2$3}3$3}4$4}5$3}6$2}7$4}8$2}9$3}10$3。仔細分析可看出數據大概是這個意思submitdata=題號$選項號}題號$選項號}題號$選項號}……..
利用這些信息就可以開始編寫python程序了
運行結果如下
貌似網站還有其他反爬蟲機制,在連續提交幾個表單之后,就出現了驗證碼。難道此時我們還要給程序添加上識別驗證碼的功能?其實不必,我們可以先分析一下剛剛Burpsuite截獲的header信息,來看看到底網站是通過什么方式,識別出我們是用爬蟲來提交問卷的。
通過一番測試,我發現當我連續提交3份問卷,再換一個IP提交3個問卷,也就是連續提交了6份問卷,并沒有觸發網站的反爬蟲機制。所以我們可以猜測對方基于IP提交問卷的頻率來識別爬蟲程序的。看到這里,大家可能會想,我們可以通過網上的免費代理來提交問卷。例如這些
那是不是意味著我們還要往python代碼中添加提取免費代理IP的功能呢?NO NO NO!換個思路,在CTF比賽中會遇到一種題目,例如你的IP是來自德國的才可以拿到flag。所以,我們的思路就是進行數據包頭欺騙,偽造我們的IP,騙過服務器。下面來說說偽造IP的幾種方式。
X-Client-IP:1.1.1.1 X-Remote-IP:2.2.2.2 X-Remote-Addr:3.3.3.3 X-Originating-IP:4.4.4.4 X-Forwarded-For:5.5.5.5
我們每個都嘗試一下,然后在后臺統計那里可以看到我們的問卷來源
這里我們發現用X-Forwarded-For可以繞過,按我們就用這種方法在header信息中添加X-Forwarded-For字段,所以修改后的腳本如下
運行結果如下
再到后臺看看統計信息
至此,我們算是完美的解決任務了。如果大家想去掉調查問卷中國外的IP地址,可以收集一下中國的IP地址段,然后添加進程序,處理一下即可。
0X02總結
大家平常可以把學到的東西用到實際生活中,遇到困難的時候不要慌,多思考,找到最優的解決方法。例如上面,我并沒有在代碼中添加驗證碼識別模塊,也沒有通過走代理的方式來繞過網站的反爬蟲機制,而是通過分析網站的反爬蟲機制,并且使用所學的安全知識(HTTP頭欺騙)輕松解決問題,使用最短的代碼完美完成任務。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
