30行python代碼爬取歷年雙色球

系統 2019-09-27 17:47:57 1939 0

當年學爬蟲的第一個想法就是想把雙色球的數據爬下來，然后看能不能用什么牛叉的算法，或者數據分析把后面的雙色球概率算出來；
知道現在才抽空寫了這幾行代碼爬取了雙色球的數據，我也真是夠懶的；
也算是閑來無事，練手的爬蟲吧；
好了，多余的就不說了，直接上代碼吧，代碼注釋已經很清楚了；

            
              import sys
import requests
from lxml import etree

def get_url(url):       #請求url的方法，返回html
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36',
    }
    response = requests.get(url,headers=headers)        #獲取請求的返回數據
    response.encoding = 'utf-8'         #定義編碼，不然中文輸出會亂碼；
    if response.status_code == 200:     #如果請求成功，則返回；
        return response.text
    return None

for q in range(1,125):      #for循環，一共124頁；
    url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list_%s.html' % (q)   #定義請求的鏈接
    html = get_url(url)         #請求url獲取返回代碼
    xpath_html = etree.HTML(html)       #xpath初始化html代碼

    dates = xpath_html.xpath('//table[@class="wqhgt"]//tr//td[1]//text()')      #獲取開獎日期
    result = xpath_html.xpath('//table[@class="wqhgt"]//tr//em//text()')        #獲取上色球號
    issues = xpath_html.xpath('//table[@class="wqhgt"]//tr//td[2]//text()')     #獲取期號
    # print(result)       #輸出所有雙色球的列
    # print(len(result)//7)    #輸出有幾組雙色球
    # print(dates)
    # print(issues)
    sta = 0
    end = 7
    for n in range(len(result)//7):     #雙色球7個號一組，
        print("開獎日期:" + str(dates[n]) + " --- " + "期號:" + str(issues[n]) + " --- " + str(result[sta:end]))
        sta = sta + 7
        end = end + 7

python版本用的3.7，開發工具用的pycharm；
爬取的結果可以根據自己需求進行調整，后面怎么用這些數據就不說了哈；具體根據自己需求進行分析吧；

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

發表我的評論

最新評論總共0條評論