一、為什么要使用Python進行數據分析?
python擁有一個巨大的活躍的科學計算社區,擁有不斷改良的庫,能夠輕松的集成C,C++,Fortran代碼(Cython項目),可以同時用于研究和原型的構建以及生產系統的構建。
二、Python的優勢與劣勢:
1.Python是一種解釋型語言,運行速度比編譯型數據慢。
2.由于python有一個全局解釋器鎖(GIL),防止解釋器同時執行多條python字節碼,所以python不適用于高并發、多線程的應用程序。
三、使用Python進行數據分析常用的擴展包。
目前初始階段的學習主要涉及4個包的安裝:numpy、scipy、pandas、matplotlib
我筆記本里安裝的是Python2.7版本,在安裝了pip和setuptools工具,關于pip和setuptools工具的安裝詳見相關筆記。
最初使用的安裝命令很簡單:
pip install pandas pip install numpy pip install scipy pip install matplotlib
但是只安裝成功了numpy和matplotlib兩個包,pandas和scipy安裝失敗,查閱了相關資料發現可能是版本問題或者包的依賴相關。
最終在stack overflow發現了一個很棒的Python包提供網址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
--這里要Mark一下,后邊爭取寫一個爬蟲,搞下來所有的包防止丟失。
以上網址是加州大學歐文分校提供的Python相關庫的下載地址,修改#后邊的名字可以進去其他包的下載頁面,此頁面中提供了安裝某個包需要依賴的前置包的說明,非常友好。
依賴包說明類似:
Pandas, a cross-section and time series data analysis toolkit. Requires numpy, dateutil, pytz, setuptools, and optionally numexpr, bottleneck, scipy, matplotlib, pytables, lxml, xarray, blosc, backports.lzma, statsmodels, sqlalchemy and other dependencies.
然后就是一堆的pandas下載地址。
最終根據各個包的相關性先安裝了numpy+mkl的whl文件,然后是安裝scipy最后是pandas。
安裝的方法如下:
1.下載對應的4個包放在D:\目錄下(很奇怪我筆記本是AMD64位的但是安裝amd64版本的包報不支持的platform的錯誤,安裝了32位的可以正常import)
2.cmd命令行進入D:\目錄執行:pip install <包的全名>進行安裝。(如果已安裝了其他錯誤的版本,使用pip uninstall卸載)
最后使用如下類似命令查看包的安裝位置:
以上這篇對Python進行數據分析_關于Package的安裝問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
