python爬蟲1《1》什么是爬蟲網絡爬蟲?網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。《2》爬蟲的基本原理:我們把互聯網比喻為一張大網,網絡爬蟲我們想象為網上的蜘蛛,網頁與網頁之間的連接我們理解為節點,爬蟲就相當于是訪問網頁,獲取網頁的信息,又通過節點可以爬取另一個網站,然后不停的通過一個個節點即訪問一個個網頁,這樣網站的數據就可以被我們獲取下來了。《3》爬蟲的分類:網絡爬蟲可分為通用爬蟲和聚焦爬蟲
系統 2019-09-27 17:50:05 2240
python爬蟲基本告一段落,琢磨搞點其他的,正好在網上看到一個帖子,一個外國13歲小朋友用python寫的下棋程序,內容詳細,也有意思,拿來練手。13歲啊。。我這年紀還在敲dir啥的吧想到原先玩跑跑卡丁車時看到歐酷有個4歲熊孩子玩的完美漂移錄像,深受打擊,從此退出車壇。。。廢話不多說,記錄一下這幾天的游戲編程折騰史游戲規則:6*6的方格棋盤,兩個人輪流點擊棋盤畫橫線或豎線,誰成功圍成一個格子,這個格子算作此人的積分。游戲架構:客戶端和服務端。先來看下游戲
系統 2019-09-27 17:49:17 2240
花了兩周時間,利用工作間隙時間,開發了一個基于Django的項目任務管理Web應用。項目計劃的實時動態,可以方便地被項目成員查看(^_^又重復發明輪子了)。從前臺到后臺,好好折騰了一把,用到:HTML、CSS、JavaScript、Apache、Python、mod_wsgi、Django。好久不用CSS和JavaScript了,感到有點生疏了,查了無數次手冊。后臺Django開發環境的搭建也花了不少時間和精力。記錄下來,免得以后走彎路。同時給大家推薦一下
系統 2019-09-27 17:38:44 2240
點擊這里使用RSS訂閱本Blog:
系統 2019-08-29 23:44:22 2240
面對Java反射機制,會有種令人敬畏而又好奇的感覺,覺得非常強大,深不可測!呵,其實是懶惰的表現,總是找借口和理由不去深入學習這些東西,覺得實際開發中很少會用到,能混就混混吧。真該死。下面就來淺談下反射,也總結下這幾天學習的心得,僅供個人總結,不足之處請大家看在小弟能力有限學習未深的份上多多包涵呵。每個class都其實都對應一個Class對象,該對象就包含在我們編寫完一個類編譯之后在相應的路徑下產生一個.class文件中,該Class對象就用于表示這個類的
系統 2019-08-29 23:37:43 2240
前期做一個項目,是要做個WEBSERVICES相關的東西,本來采用XFIRE進行開發,但在開發過程中發現在XFIRE中有些JAR包與項目中其它的JAR包發生沖突,所以只有改用AXIS進行,在網上查了很多資料,不過大都講的比較含糊,試了很久最后終于在MYECLIPSE中直接使用AXIS進行開發,今天將此貼出來,請大家多多指教;第一步:在ECLIPSE中新建一個WEB工程,并將下載下來的AXIS源文件下面的axis\WEB-INF\lib下的JAR包添加到WE
系統 2019-08-29 23:34:26 2240
使用WinAVI配合TMPGEncDVDAuthor將多個mpg檔燒成一塊DVD先用WinAVI轉換成KVCD檔:1.打開WinAVI,選“DVD”。2.選取你欲轉換的檔案。3.記得選擇“CreateSeparateFiles”,否則轉換的檔案會合并在一起。4.之后就選“OutputDirectory”,另外在“OutputFormat”下記得選“KVCD”及按“Advanced”。照著以下的規格設定,有必要時請根據個人喜好更改。SplitSetting一
系統 2019-08-29 23:24:49 2240
前年,Google就為GoogleMaps增加了很多有趣的功能,比如GPS導航。雖然在國內GoogleMaps還比較簡單,但在美國GoogleMap的地圖已經可以和專業地圖公司抗衡了,更重要的是,GoogleMaps使用成本低廉。加上Google另一個產品Googleearth的應用模式和前景看好,GoogleMaps自然也成為GPS專業廠商如Garmin、TomTom的一塊心病。不過,GoogleMap到現在為止,還是沒有提供語音導航功能。雖然轉彎之前軟
系統 2019-08-29 23:00:41 2240
之前一直對Java方法中的傳值問題一直以為參數傳遞的是一個值,而不是一個引用,今天看了一下《Java參考大全》,里面的一個注釋寫到,方法中傳遞基本類型(int.byte.char等)時是傳值,傳遞對象時是傳遞的引用。注意到此,方能解惑。關于Java方法的傳值問題
系統 2019-08-29 22:53:32 2240
海量數據處理之BloomFilter詳解前言本博客內曾已經整理過十道海量數據處理面試題與十個方法大總結。接下來,本博客內會重點分析那些海量數據處理的方法,并重寫十道海量數據處理的面試題。如果有任何問題,歡迎不吝指正。謝謝。一、什么是BloomFilterBloomFilter是一種空間效率很高的隨機數據結構,它利用位數組很簡潔地表示一個集合,并能判斷一個元素是否屬于這個集合。BloomFilter的這種高效是有一定代價的:在判斷一個元素是否屬于某個集合時,
系統 2019-08-29 22:28:46 2240