點擊上方“ 碼農突圍 ”,馬上關注,每天早上 8:50 準時推送
真愛,請置頂或星標
摘要 :分享個 Python 神工具。
長時間使用瀏覽器會積累大量瀏覽器歷史記錄,這些是很隱私的數據,里面甚至可能有一些不可描述的網站或者搜索記錄不想讓別人知道。不過,我們自己可能會感興趣,天天都在上網,想知道長期下來是都在摸魚還是有認真工作。
其次,了解下自己每天打開多少次網頁、哪些網站上的最多、常搜哪些關鍵詞,這些也很有趣。
下面就來給大家介紹一款 Python 編寫的神工具,可以一鍵分析你的上網行為。我用了后發現了很多不可思議的結論。
比如訪問次數最多的網站居然是微信公眾號,7000 多次,看來弄自媒體占了大量上網時間。

看到了每天打開網站的次數,平均都有好幾百次,8 月 8 號那天發生了什么,竟打開了 1600 多次!

然后又統計了停留時間最長的網頁頁面,在 http://md.aclickall.com/ 這個網站居然停留了 660 小時,這是個文章排版網站,因為經常要排版所以把該頁面固定了起來。

然后統計出了搜索最多的十個關鍵詞,python 居然是第一位!前十中基本都是數據編程相關的,沒想到自己這么愛學習。

最后統計出了各大搜索引擎的使用率。google 的使用率達到了 97.3%,而百度只有不到 3%,大概是偶爾無法科學上網的時候用了下百度。

怎么樣是不是挺有意思?下面就來說說怎么用這款工具,讓你也可以分分鐘了解自己的上網行為,非常簡單。
這款 Python 工具其實就是分析瀏覽器的歷史記錄數據庫文件然后可視化。這里的瀏覽器只支持 Chrome 和以 Chrome 為內核的瀏覽器,比如 Centbrower 、360極速瀏覽器等,其他瀏覽器比如 ie、Firefox 不支持。如果有登陸賬號,桌面端和電腦端會一起分析,更全面。
第一步,打開網站:(公眾號后臺回復 813 得到)

接著上傳你的瀏覽器歷史記錄文件,這個歷史記錄文件怎么獲得呢?
新建一個標簽頁,輸入
chrome://version/
回車,可以打開你的瀏覽器詳細信息:

復制「個人資料路徑」到資源管理器打開,然后找到 history 文件復制一份到桌面。

接著就在剛才的網站中上傳該文件(我的文件有 15MB 大),稍等片刻就可以得到上門的那些可視化分析結果。
你可能會擔心上傳瀏覽器歷史記錄是否安全,盡管放心,這個程序是開源的。
下面再簡單說下如何用 python 一步步實現的這個程序功能的,這是一個很棒的 python 練手項目,涉及到了前后端的知識,整個程序包含多個文件:
Code
├─?app_callback.py??????????????????????????回調函數,實現后臺功能
├─?app_configuration.py?????????????????????web服務器配置
├─?app_layout.py????????????????????????????web前端頁面配置
├─?app_plot.py??????????????????????????????web圖表繪制
├─?app.py???????????????????????????????????web服務器的啟動
├─?assets???????????????????????????????????web所需的一些靜態資源文件
│??├─?css???????????????????????????????????web前端元素布局文件
│??│??├─?custum-styles_phyloapp.css
│??│??└─?stylesheet.css
│??├─?image?????????????????????????????????web前端logo圖標
│??│??├─?GitHub-Mark-Light.png
│??└─?static????????????????????????????????web前端幫助頁面
│??│??├─?help.html
│??│??└─?help.md
├─?history_data.py??????????????????????????解析chrome歷史記錄文件
└─?requirement.txt??????????????????????????程序所需依賴庫
每個程序實現的功能:

具體實現思路大致分為下面幾點:
-
解析歷史記錄文件數據
歷史記錄 history 是一個 sqllite 數據庫文件,連接數據庫查詢然后調用數據庫中的信息并存儲。
-
配置 web 服務器和前端頁面
-
可視化繪圖函數
可視化圖形使用的是可交互式的 plotly 庫。
小結
上網記錄是很重要的隱私數據,平常自己可能無法從中直接發現什么,使用 Python 簡單一分析就可以發現很多東西,所以平時盡量注重隱私保護。
全部源碼 上傳到文末公號,回復「? 上網記錄 」即可獲得 。
推 薦閱讀:
向Excel說再見,神級編輯器統一表格與Python
東半球最強Python新手100天學習計劃開源,這次再學不會算我輸!
如何從海量抖音視頻上找高顏值小姐姐,難嗎!直到我發現了這個Python庫
我用Python爬了點你們需要的電影,這些電影真的很不錯~
再推薦23個Python爬蟲開源項目代碼:微信、淘寶、豆瓣、知乎、微博(已開源)
深夜,我用python爬取了整個斗圖網站,不服來斗
Python爬蟲44萬條數據揭秘:如何成為網易云音樂評論區的網紅段子手
18個Python爬蟲實戰案例(已開源)
更多爬蟲,關注下面公號,后臺回復: “ 爬蟲實戰 ” ,獲取獨家整理的一份爬蟲匯總。
好文和好朋友一起看~
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
