來源 | 高級農民工(ID:Mocun6)
責編 | 胡巍巍
長時間使用瀏覽器會積累大量瀏覽器歷史記錄,這些是很隱私的數據,里面甚至可能有一些不可描述的網站或者搜索記錄不想讓別人知道。不過,我們自己可能會感興趣,天天都在上網,想知道長期下來是都在摸魚還是有認真工作。
其次,了解下自己每天打開多少次網頁、哪些網站上的最多、常搜哪些關鍵詞,這些也很有趣。
下面就來給大家介紹一款 Python 編寫的神工具,可以一鍵分析你的上網行為。我用了后發現了很多不可思議的結論。
比如訪問次數最多的網站居然是微信公眾號,7000 多次,看來弄自媒體占了大量上網時間。
瀏覽次數最多的十個網站
看到了每天打開網站的次數,平均都有好幾百次,8 月 8 號那天發生了什么,竟打開了 1600 多次!
每日訪問網站次數
然后又統計了停留時間最長的網頁頁面,在 http://md.aclickall.com/ 這個網站居然停留了 660 小時,這是個文章排版網站,因為經常要排版所以把該頁面固定了起來。
停留時間最長的 URL 排名
然后統計出了搜索最多的十個關鍵詞,python 居然是第一位!前十中基本都是數據編程相關的,沒想到自己這么愛學習。
搜索最多的十個關鍵詞
最后統計出了各大搜索引擎的使用率。google 的使用率達到了 97.3%,而百度只有不到 3%,大概是偶爾無法科學上網的時候用了下百度。
各搜索引擎使用占比
怎么樣是不是挺有意思?下面就來說說怎么用這款工具,讓你也可以分分鐘了解自己的上網行為,非常簡單。
這款 Python 工具其實就是分析瀏覽器的歷史記錄數據庫文件然后可視化。這里的瀏覽器只支持 Chrome 和以 Chrome 為內核的瀏覽器,比如 Centbrower 、360極速瀏覽器等,其他瀏覽器比如 ie、Firefox 不支持。如果有登陸賬號,桌面端和電腦端會一起分析,更全面。
第一步,打開網站:(公眾號后臺回復 813得到)
接著上傳你的瀏覽器歷史記錄文件,這個歷史記錄文件怎么獲得呢?
新建一個標簽頁,輸入 chrome://version/?回車,可以打開你的瀏覽器詳細信息:
復制「個人資料路徑」到資源管理器打開,然后找到 history 文件復制一份到桌面。
接著就在剛才的網站中上傳該文件(我的文件有 15MB 大),稍等片刻就可以得到上門的那些可視化分析結果。
你可能會擔心上傳瀏覽器歷史記錄是否安全,盡管放心,這個程序是開源的。
下面再簡單說下如何用 python 一步步實現的這個程序功能的,這是一個很棒的 python 練手項目,涉及到了前后端的知識,整個程序包含多個文件:
每個程序實現的功能:
具體實現思路大致分為下面幾點:
- 解析歷史記錄文件數據
歷史記錄 history 是一個 sqllite 數據庫文件,連接數據庫查詢然后調用數據庫中的信息并存儲。
- 配置 web 服務器和前端頁面
- 可視化繪圖函數
可視化圖形使用的是可交互式的 plotly 庫。
作者簡介:高級農民工( 蘇克 ),985 碩士轉行 Python,熱愛爬蟲、數據分析和挖掘,本文首發于個人公眾號「mocun6」。
1.國產嵌入式操作系統技術與產業發展論壇暨嵌入式系統聯誼會主題討論會嘉賓揭曉!
2.
編程語言趨勢預測:Rust 將成為主流,React 繼續統治編程世界
3. 教你如何使用TouchGFX之快速創建滑動應用
4 .如今的FPGA走錯路了嗎?
5. 華為手機到底用了多少美國芯?
6. 10.3mmx11.5mm的Arduino,見過嗎?
免責聲明:本文系網絡轉載,版權歸原作者所有。如涉及作品版權問題,請與我們聯系,我們將根據您提供的版權證 明材料確認版權并支付稿酬或者刪除內容。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
