欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

Python爬蟲 批量爬取下載抖音視頻代碼實例

系統 1939 0

這篇文章主要為大家詳細介紹了python批量爬取下載抖音視頻,具有一定的參考價值,感興趣的小伙伴們可以參考一下

Python爬蟲 批量爬取下載抖音視頻代碼實例_第1張圖片

項目源碼展示:

            
'''
在學習過程中有什么不懂得可以加我的
python學習交流扣扣qun,934109170
群里有不錯的學習教程、開發工具與電子書籍。
與你分享python企業當下人才需求及怎么從零基礎學習好python,和學習什么內容。
'''
# -*- coding:utf-8 -*-
from contextlib import closing
import requests, json, re, os, sys, random
from ipaddress import ip_address
from subprocess import Popen, PIPE
import urllib
class DouYin(object):
 def __init__(self, width = 500, height = 300):
 """
 抖音App視頻下載
 """
 rip = ip_address('0.0.0.0')
 while rip.is_private:
 rip = ip_address('.'.join(map(str, (random.randint(0, 255) for _ in range(4)))))
 self.headers = {
 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
 'accept-encoding': 'gzip, deflate, br',
 'accept-language': 'zh-CN,zh;q=0.9',
 'pragma': 'no-cache',
 'cache-control': 'no-cache',
 'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Linux; U; Android 5.1.1; zh-cn; MI 4S Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.146 Mobile Safari/537.36 XiaoMi/MiuiBrowser/9.1.3',
 'X-Real-IP': str(rip),
 'X-Forwarded-For': str(rip),
 }
 def get_video_urls(self, user_id, type_flag='f'):
 """
 獲得視頻播放地址
 Parameters:
 user_id:查詢的用戶UID
 Returns:
 video_names: 視頻名字列表
 video_urls: 視頻鏈接列表
 nickname: 用戶昵稱
 """
 video_names = []
 video_urls = []
 share_urls = []
 max_cursor = 0
 has_more = 1
 i = 0
 share_user_url = 'https://www.douyin.com/share/user/%s' % user_id
 share_user = requests.get(share_user_url, headers=self.headers)
 while share_user.status_code != 200:
 share_user = requests.get(share_user_url, headers=self.headers)
 _dytk_re = re.compile(r"dytk\s*:\s*'(.+)'")
 dytk = _dytk_re.search(share_user.text).group(1)
 _nickname_re = re.compile(r'
            

(.+?)<\/p>') nickname = _nickname_re.search(share_user.text).group(1) urllib.request.urlretrieve('https://raw.githubusercontent.com/Jack-Cherish/python-spider/master/douyin/fuck-byted-acrawler.js', 'fuck-byted-acrawler.js') try: Popen(['node', '-v'], stdout=PIPE, stderr=PIPE).communicate() except (OSError, IOError) as err: print('請先安裝 node.js: https://nodejs.org/') sys.exit() user_url_prefix = 'https://www.douyin.com/aweme/v1/aweme/favorite' if type_flag == 'f' else 'https://www.douyin.com/aweme/v1/aweme/post' print('解析視頻鏈接中') while has_more != 0: process = Popen(['node', 'fuck-byted-acrawler.js', str(user_id)], stdout=PIPE, stderr=PIPE) _sign = process.communicate()[0].decode().strip('\n').strip('\r') user_url = user_url_prefix + '/?user_id=%s&max_cursor=%s&count=21&aid=1128&_signature=%s&dytk=%s' % (user_id, max_cursor, _sign, dytk) req = requests.get(user_url, headers=self.headers) while req.status_code != 200: req = requests.get(user_url, headers=self.headers) html = json.loads(req.text) try: while html['aweme_list'] == []: i = i + 1 sys.stdout.write('已重新鏈接' + str(i) + '次 (若超過100次,請ctrl+c強制停止再重來)' + '\r') sys.stdout.flush() process = Popen(['node', 'fuck-byted-acrawler.js', str(user_id)], stdout=PIPE, stderr=PIPE) _sign = process.communicate()[0].decode().strip('\n').strip('\r') user_url = user_url_prefix + '/?user_id=%s&max_cursor=%s&count=21&aid=1128&_signature=%s&dytk=%s' % (user_id, max_cursor, _sign, dytk) req = requests.get(user_url, headers=self.headers) while req.status_code != 200: req = requests.get(user_url, headers=self.headers) html = json.loads(req.text) except: pass i = 0 for each in html['aweme_list']: try: url = 'https://aweme.snssdk.com/aweme/v1/play/?video_id=%s&line=0&ratio=720p&media_type=4&vr_type=0&test_cdn=None&improve_bitrate=0' uri = each['video']['play_addr']['uri'] video_url = url % uri except: continue share_desc = each['share_info']['share_desc'] if os.name == 'nt': for c in r'\/:*?"<>|': nickname = nickname.replace(c, '').strip().strip('\.') share_desc = share_desc.replace(c, '').strip() share_id = each['aweme_id'] if share_desc in ['抖音-原創音樂短視頻社區', 'TikTok', '']: video_names.append(share_id + '.mp4') else: video_names.append(share_id + '-' + share_desc + '.mp4') share_urls.append(each['share_info']['share_url']) video_urls.append(video_url) max_cursor = html['max_cursor'] has_more = html['has_more'] return video_names, video_urls, share_urls, nickname def get_download_url(self, video_url, watermark_flag): """ 獲得帶水印的視頻播放地址 Parameters: video_url:帶水印的視頻播放地址 Returns: download_url: 帶水印的視頻下載地址 """ # 帶水印視頻 if watermark_flag == True: download_url = video_url.replace('/play/', '/playwm/') # 無水印視頻 else: download_url = video_url.replace('/playwm/', '/play/') return download_url def video_downloader(self, video_url, video_name, watermark_flag=False): """ 視頻下載 Parameters: video_url: 帶水印的視頻地址 video_name: 視頻名 watermark_flag: 是否下載帶水印的視頻 Returns: 無 """ size = 0 video_url = self.get_download_url(video_url, watermark_flag=watermark_flag) with closing(requests.get(video_url, headers=self.headers, stream=True)) as response: chunk_size = 1024 content_size = int(response.headers['content-length']) if response.status_code == 200: sys.stdout.write(' [文件大小]:%0.2f MB\n' % (content_size / chunk_size / 1024)) with open(video_name, 'wb') as file: for data in response.iter_content(chunk_size = chunk_size): file.write(data) size += len(data) file.flush() sys.stdout.write(' [下載進度]:%.2f%%' % float(size / content_size * 100) + '\r') sys.stdout.flush() def run(self): """ 運行函數 Parameters: None Returns: None """ self.hello() print('搜索api需要登錄,暫時使用UID下載\n分享用戶頁面,用瀏覽器打開短鏈接,原始鏈接中/share/user/后的數字即是UID') user_id = input('請輸入ID (例如95006183):') user_id = user_id if user_id else '95006183' watermark_flag = input('是否下載帶水印的視頻 (0-否(默認), 1-是):') watermark_flag = watermark_flag if watermark_flag!='' else '0' watermark_flag = bool(int(watermark_flag)) type_flag = input('f-收藏的(默認), p-上傳的:') type_flag = type_flag if type_flag!='' else 'f' save_dir = input('保存路徑 (例如"E:/Download/", 默認"./Download/"):') save_dir = save_dir if save_dir else "./Download/" video_names, video_urls, share_urls, nickname = self.get_video_urls(user_id, type_flag) nickname_dir = os.path.join(save_dir, nickname) if not os.path.exists(save_dir): os.makedirs(save_dir) if nickname not in os.listdir(save_dir): os.mkdir(nickname_dir) if type_flag == 'f': if 'favorite' not in os.listdir(nickname_dir): os.mkdir(os.path.join(nickname_dir, 'favorite')) print('視頻下載中:共有%d個作品!\n' % len(video_urls)) for num in range(len(video_urls)): print(' 解析第%d個視頻鏈接 [%s] 中,請稍后!\n' % (num + 1, share_urls[num])) if '\\' in video_names[num]: video_name = video_names[num].replace('\\', '') elif '/' in video_names[num]: video_name = video_names[num].replace('/', '') else: video_name = video_names[num] video_path = os.path.join(nickname_dir, video_name) if type_flag!='f' else os.path.join(nickname_dir, 'favorite', video_name) if os.path.isfile(video_path): print('視頻已存在') else: self.video_downloader(video_urls[num], video_path, watermark_flag) print('\n') print('下載完成!') def hello(self): """ 打印歡迎界面 Parameters: None Returns: None """ print('*' * 100) print('\t\t\t\t抖音App視頻下載小助手') print('\t\t作者:Jack Cui、steven7851') print('*' * 100) if __name__ == '__main__': douyin = DouYin() douyin.run()

運行結果:

Python爬蟲 批量爬取下載抖音視頻代碼實例_第2張圖片

爬取結果截圖

Python爬蟲 批量爬取下載抖音視頻代碼實例_第3張圖片

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 成人av在线网 | 亚洲一区二区三区视频 | 天天草夜夜操 | a毛片久久免费观看 | 成人av在线播放 | 特黄特黄的视频 | 999久久久 | 成人精品视频在线观看 | 久久er热在这里只有精品85 | 美女视频黄a视频免费全过程 | 国产成人精品一区二区三区电影 | 欧美日韩在线视频一区 | yeyelu| 毛片少妇爽到高潮特黄A片 六月色播 | 激情一区二区三区成人 | 亚洲毛片无码专区亚洲A片 日本高清www午色夜黄 | 久久久久在线观看 | 亚洲欧美在线播放 | 蜜臀AV性色A片在线观看 | 亚洲精品第一页 | 国产视频一区二区在线观看 | 波多在线 | 天天夜夜操操 | 欧美 亚洲 一区 | 免费高清成人啪啪网站 | 香蕉18xxoo欧美夜视频 | 色成人亚洲 | 中文字幕在线电影观看 | 性夜影院爽黄e爽痛轻点www | 国亚洲欧美日韩精品 | 91麻豆精品国产91久久久更新时间 | 天天操天天操天天 | 成人在线视频网站 | 日韩极品视频 | av一区二区三区 | 成人黄色免费网站 | 日韩一区二区三区在线视频 | 99久久精品国产片久人 | 12av毛片| 色中色在线视频 | 在线播放国产一区二区三区 |