欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

詳解pyppeteer(python版puppeteer)基本使用

系統 1769 0

一、前言

以前使用selenium的無頭瀏覽器,自從phantomjs2016后慢慢不更新了之后,selenium也開始找下家,這時候谷歌的chrome率先搞出來無頭瀏覽器并開放了各種api,隨后firefox也開始做。

現在selenium的測試也都支持這兩個瀏覽器的無頭模式了,只需要在引入的時候配置一下就可以了。之所以要采用谷歌chrome官方無頭框架puppeteer的python版本pyppeteer,是因為有些網頁是可以檢測到是否是使用了selenium。并且selenium所謂的保護機制不允許跨域cookies保存以及登錄的時候必須先打開網頁然后后加載cookies再刷新的方式很不友好。

二、pyppeteer

github地址:https://miyakogi.github.io/pyppeteer/

pyppeteer這個項目是非官方的,是基于谷歌官方puppeteer的python版本。

注意:本來chrome就問題多多,puppeteer也是各種坑,加上pyppeteer是基于前者的改編python版本,也就是產生了只要前兩個有一個有bug,那么pyppeteer就會原封不動的繼承下來,本來這沒什么,但是現在遇到的問題就是pyppeteer這個項目從18年9月份之后就沒更新過了,前兩者都在不斷的更新迭代,而pyppeteer一直不更新,導致很多bug根本沒人修復。

遇到的錯誤:

1)pyppeteer.errors.NetworkError: Protocol error Network.getCookies: Target close
控制訪問指定url之后await page.goto(url),會遇到上面的錯誤,如果這時候使用了sleep之類的延時也會出現這個錯誤或者類似的time out。

這個問題是puppeteer的bug,但是對方已經修復了,而pyppeteer遲遲沒更新,就只能靠自己了,搜了很多人的文章,例如:https://github.com/miyakogi/pyppeteer/issues/171 ,但是我按照這個并沒有成功。
也有人增加一個函數,但調用這個參數依然沒解決問題。

            
async def scroll_page(page):
  cur_dist = 0
  height = await page.evaluate("() => document.body.scrollHeight")
  while True:
    if cur_dist < height:
      await page.evaluate("window.scrollBy(0, 500);")
      await asyncio.sleep(0.1)
      cur_dist += 500
    else:
      break
          

可以把python第三方庫websockets版本7.0改為6.0就可以了,親測可用。

            
pip uninstall websockets #卸載websockets
pip install websockets==6.0 #指定安裝6.0版本
          

2)chromium瀏覽器多開頁面卡死問題
解決這個問題的方法就是瀏覽器初始化的時候添加'dumpio':True。

3)瀏覽器窗口很大,內容顯示很小

上面的問題是需要設置瀏覽器顯示大小,默認就是無法正常顯示。可以看到頁面左側右側都是空白,網站內容并沒有完整鋪滿chrome.

            
browser = await launch({'headless': False,'dumpio':True, 'autoClose':False,'args': ['--no-sandbox', '--window-size=1366,850']})
await page.setViewport({'width':1366,'height':768})
          

通過上面設置Windows-size和Viewport大小來實現網頁完整顯示。

但是對于那種向下無限加載的長網頁這種情況如果瀏覽器是可見狀態會顯示不全,針對這種情況的解決方法就是復制當前網頁新開一個標簽頁粘貼進去就正常了

詳解pyppeteer(python版puppeteer)基本使用_第1張圖片

三、實際項目示例

            
import asyncio
from pyppeteer import launch
import time

async def main():exepath = 'C:/Users/tester02/AppData/Local/Google/Chrome/Application/chrome.exe'
  browser = await launch({'executablePath': exepath, 'headless': False, 'slowMo': 30})
  page = await browser.newPage()
  await page.setViewport({'width': 1366, 'height': 768})
  await page.goto('http://192.168.2.66')
  await page.type("#Login_Name_Input", "test02")
  await page.type("#Login_Password_Input", "12345678", )
  await page.waitFor(1000)
  await page.click("#Login_Login_Btn")
  await page.waitFor(3000)
  await browser.close()

asyncio.get_event_loop().run_until_complete(main())
          
            
import asyncio
import time
from pyppeteer import launch


async def gmailLogin(username, password, url):
  #'headless': False如果想要瀏覽器隱藏更改False為True
  # 127.0.0.1:1080為代理ip和端口,這個根據自己的本地代理進行更改,如果是vps里或者全局模式可以刪除掉'--proxy-server=127.0.0.1:1080'
  browser = await launch({'headless': False, 'args': ['--no-sandbox', '--proxy-server=127.0.0.1:1080']})
  page = await browser.newPage()
  await page.setUserAgent(
    'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36')

  await page.goto(url)

  # 輸入Gmail
  await page.type('#identifierId', username)
  # 點擊下一步
  await page.click('#identifierNext > content')
  page.mouse # 模擬真實點擊
  time.sleep(10)
  # 輸入password
  await page.type('#password input', password)
  # 點擊下一步
  await page.click('#passwordNext > content > span')
  page.mouse # 模擬真實點擊
  time.sleep(10)
  # 點擊安全檢測頁面的DONE
  # await page.click('div > content > span')#如果本機之前登錄過,并且page.setUserAgent設置為之前登錄成功的瀏覽器user-agent了,
  # 就不會出現安全檢測頁面,這里如果有需要的自己根據需求進行更改,但是還是推薦先用常用瀏覽器登錄成功后再用python程序進行登錄。

  # 登錄成功截圖
  await page.screenshot({'path': './gmail-login.png', 'quality': 100, 'fullPage': True})
  #打開谷歌全家桶跳轉,以Youtube為例
  await page.goto('https://www.youtube.com')
  time.sleep(10)


if __name__ == '__main__':
  username = '你的gmail包含@gmail.com'
  password = r'你的gmail密碼'
  url = 'https://gmail.com'
  loop = asyncio.get_event_loop()
  loop.run_until_complete(gmailLogin(username, password, url))
# 代碼由三分醉編寫,網址www.sanfenzui.com,參考如下文章:
# https://blog.csdn.net/Chen_chong__/article/details/82950968
          

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 奇米影视亚洲四色8888 | 九九精品久久久久久噜噜 | 久久久久久久久淑女av国产精品 | 精品一区二区三区四区五区六区 | 美女网站黄在线观看 | 国产精品尤物在线 | 成人性生交A片免费看麻豆 色倩网站 | 天堂网果冻传媒 | 蜜桃视频在线播放 | 精品免费视频 | 精品一区精品二区 | 久久精品国产999大香线焦 | 国产九九精品 | 午夜剧场在线免费观看 | 大伊香蕉在线精品不卡视频 | 一级少妇女片 | 成年男女男免费视频网站不卡 | 国产亚洲精品久久久久久无码网站 | 免费观看成人毛片A片2008 | 久久夜夜操| 久草电影天堂 | 一区二区三区毛片 | 中文字幕av一区二区三区 | 国产精品国产亚洲精品不卡 | 婷婷久久综合九色综合九七 | 午夜电影一区 | 亚洲精品久久久一区二区三区 | www欧美 | 色网站视频 | 成人片网址 | 精品视频网站 | 日本成人一二三区 | 国产精品第9页 | 色综合久久天天综合网 | 久久婷五月综合 | 视频一区二区不卡 | 亚洲成人一区 | 亚洲综合精品一区二区三区中文 | 久久免费视频一区 | 日韩精品一区二区三区中文字幕 | 亚洲精品国产电影 |