黄色网页视频 I 影音先锋日日狠狠久久 I 秋霞午夜毛片 I 秋霞一二三区 I 国产成人片无码视频 I 国产 精品 自在自线 I av免费观看网站 I 日本精品久久久久中文字幕5 I 91看视频 I 看全色黄大色黄女片18 I 精品不卡一区 I 亚洲最新精品 I 欧美 激情 在线 I 人妻少妇精品久久 I 国产99视频精品免费专区 I 欧美影院 I 欧美精品在欧美一区二区少妇 I av大片网站 I 国产精品黄色片 I 888久久 I 狠狠干最新 I 看看黄色一级片 I 黄色精品久久 I 三级av在线 I 69色综合 I 国产日韩欧美91 I 亚洲精品偷拍 I 激情小说亚洲图片 I 久久国产视频精品 I 国产综合精品一区二区三区 I 色婷婷国产 I 最新成人av在线 I 国产私拍精品 I 日韩成人影音 I 日日夜夜天天综合

python 下載小說

系統 1913 0

使用beautifulsoup 爬取小說,并整合到txt中。

            
              """
======================
@Auther:CacheYu
@Time:2019/9/16:16:09
======================
"""
# -*- coding:utf-8 -*-
import urllib.request
import urllib.error
import bs4
from bs4 import BeautifulSoup

def readdown(url):
    soup = BeautifulSoup(urllib.request.urlopen(url), 'html.parser')
    fixed_html = soup.prettify()
    table = soup.find('table', attrs={'id': 'tabletxt'})
    # # if isinstance(table, bs4.element.Tag):
    # tds = table.find_all('td')
    i = table.find('i').string
    print(i)
    div = table.find_all('div', attrs={'class': 'txt'})
    content = div[0].get_text().strip()
    couple = i + '\n' + content
    return couple

page_url = 'https://www.dushiyanqing.net/book/90/90659/index.html'
book = r'E:\story\誰把風聲聽成離別歌.txt'

soup = BeautifulSoup(urllib.request.urlopen(page_url), 'html.parser')
fixed_html = soup.prettify()

table = soup.find('table')
if isinstance(table, bs4.element.Tag):
    tds = table.find_all('td', attrs={'class': 'k4'})
    default_encode = 'utf-8'

    print('開始寫入,請稍等……')
    with open(book, 'r+', encoding=default_encode) as target_file_writer:
        for td in tds:
            a = td.find('a')
            if a is not None:
                 + a.get('href')
                # print(href)
                target_file_writer.write(readdown(href))
                # time.sleep(random.randint(5, 10))
    print('已完成!\n目錄地址為:', book)
            
          

?


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論