摘要:原文鏈接譯文鏈接使用一步一步地來進(jìn)行數(shù)據(jù)分析翔你已經(jīng)決定來學(xué)習(xí),但是你之前沒有編程經(jīng)驗(yàn)。在我看來精通用開發(fā)好的軟件才能夠高效地進(jìn)行數(shù)據(jù)分析,這觀點(diǎn)是沒有必要的。
原文鏈接:Step by step approach to perform data analysis using Python
譯文鏈接:使用Python一步一步地來進(jìn)行數(shù)據(jù)分析--By Michael翔
你已經(jīng)決定來學(xué)習(xí)Python,但是你之前沒有編程經(jīng)驗(yàn)。因此,你常常對(duì)從哪兒著手而感到困惑,這么多Python的知識(shí)需要去學(xué)習(xí)。以下這些是那些開始使用Python數(shù)據(jù)分析的初學(xué)者的普遍遇到的問題:
需要多久來學(xué)習(xí)Python?
我需要學(xué)習(xí)Python到什么程度才能來進(jìn)行數(shù)據(jù)分析呢?
學(xué)習(xí)Python最好的書或者課程有哪些呢?
為了處理數(shù)據(jù)集,我應(yīng)該成為一個(gè)Python的編程專家嗎?
當(dāng)開始學(xué)習(xí)一項(xiàng)新技術(shù)時(shí),這些都是可以理解的困惑,這是《在20小時(shí)內(nèi)學(xué)會(huì)任何東西》的作者所說的。不要害怕,我將會(huì)告訴你怎樣快速上手,而不必成為一個(gè)Python編程“忍者”。
不要犯我之前犯過的錯(cuò)在開始使用Python之前,我對(duì)用Python進(jìn)行數(shù)據(jù)分析有一個(gè)誤解:我必須不得不對(duì)Python編程特別精通。因此,我參加了Udacity的Python編程入門課程,完成了code academy上的Python教程,同時(shí)閱讀了若干本Python編程書籍。就這樣持續(xù)了3個(gè)月(平均每天3個(gè)小時(shí)),我那會(huì)兒通過完成小的軟件項(xiàng)目來學(xué)習(xí)Python。敲代碼是快樂的事兒,但是我的目標(biāo)不是去成為一個(gè)Python開發(fā)人員,而是要使用Python數(shù)據(jù)分析。之后,我意識(shí)到,我花了很多時(shí)間來學(xué)習(xí)用Python進(jìn)行軟件開發(fā),而不是數(shù)據(jù)分析。
在幾個(gè)小時(shí)的深思熟慮之后,我發(fā)現(xiàn),我需要學(xué)習(xí)5個(gè)Python庫來有效地解決一系列的數(shù)據(jù)分析問題。然后,我開始一個(gè)接一個(gè)的學(xué)習(xí)這些庫。
在我看來,精通用Python開發(fā)好的軟件才能夠高效地進(jìn)行數(shù)據(jù)分析,這觀點(diǎn)是沒有必要的。
忽略給大眾的資源有許多優(yōu)秀的Python書籍和在線課程,然而我不并不推薦它們中的一些,因?yàn)?,有些是給大眾準(zhǔn)備的而不是給那些用來數(shù)據(jù)分析的人準(zhǔn)備的。同樣也有許多書是“用Python科學(xué)編程”的,但它們是面向各種數(shù)學(xué)為導(dǎo)向的主題的,而不是成為為了數(shù)據(jù)分析和統(tǒng)計(jì)。不要浪費(fèi)浪費(fèi)你的時(shí)間去閱讀那些為大眾準(zhǔn)備的Python書籍。
在進(jìn)一步繼續(xù)之前,首先設(shè)置好你的編程環(huán)境,然后學(xué)習(xí)怎么使用IPython notebook
學(xué)習(xí)途徑從code academy開始學(xué)起,完成上面的所有練習(xí)。每天投入3個(gè)小時(shí),你應(yīng)該在20天內(nèi)完成它們。Code academy涵蓋了Python基本概念。但是,它不像Udacity那樣以項(xiàng)目為導(dǎo)向;沒關(guān)系,因?yàn)槟愕哪繕?biāo)是從事數(shù)據(jù)科學(xué),而不是使用Python開發(fā)軟件。
當(dāng)完成了code academy練習(xí)之后,看看這個(gè)Ipython notebook:
Python必備教程(在總結(jié)部分我已經(jīng)提供了下載鏈接)。
它包括了code academy中沒有提到的一些概念。你能在1到2小時(shí)內(nèi)學(xué)完這個(gè)教程。
現(xiàn)在,你知道足夠的基礎(chǔ)知識(shí)來學(xué)習(xí)Python庫了。
Numpy首先,開始學(xué)習(xí)Numpy吧,因?yàn)樗抢肞ython科學(xué)計(jì)算的基礎(chǔ)包。對(duì)Numpy好的掌握將會(huì)幫助你有效地使用其他工具例如Pandas。
我已經(jīng)準(zhǔn)備好了IPython筆記,這包含了Numpy的一些基本概念。這個(gè)教程包含了Numpy中最頻繁使用的操作,例如,N維數(shù)組,索引,數(shù)組切片,整數(shù)索引,數(shù)組轉(zhuǎn)換,通用函數(shù),使用數(shù)組處理數(shù)據(jù),常用的統(tǒng)計(jì)方法,等等。
Numpy Basics Tutorial
PandasPandas包含了高級(jí)的數(shù)據(jù)結(jié)構(gòu)和操作工具,它們使得Python數(shù)據(jù)分析更加快速和容易。
教程包含了series, data frams,從一個(gè)axis刪除數(shù)據(jù),缺失數(shù)據(jù)處理,等等。
Pandas Basics Tutorial
Matplotlib這是一個(gè)分為四部分的Matplolib教程。
1st 部分:第一部分介紹了Matplotlib基本功能,基本figure類型。
MatplotLib Part 1
2nd 部分:包含了怎么調(diào)整figure的樣式和顏色,例如:makers,line,thicness,line patterns和color map.
MatplotLib Part2
3rd 部分:圖的注釋--包含若干圖,控制坐標(biāo)軸范圍,長款比和坐標(biāo)軸。
MatplotLib Part3
4th 部分:包含了一些復(fù)雜圖形。
MatplotLib Part4
你學(xué)習(xí)Python時(shí)能犯的最簡單的錯(cuò)誤之一就是同時(shí)去嘗試學(xué)習(xí)過多的庫。當(dāng)你努力一下子學(xué)會(huì)每樣?xùn)|西時(shí),你會(huì)花費(fèi)很多時(shí)間來切換這些不同概念之間,變得沮喪,最后轉(zhuǎn)移到其他事情上。
所以,堅(jiān)持關(guān)注這個(gè)過程:
理解Python基礎(chǔ)
學(xué)習(xí)Numpy
學(xué)習(xí)Pandas
學(xué)習(xí)Matplolib
下載鏈接:你可以從我的github上下載這些文件。這些文件是以.ipynb格式存放。這些文件也包含了我用來說明的一些圖片。
Python and Numpy Basics
Pandas Basics
Matplotlib
最后博客鏈接:
Michael翔
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.hztianpu.com/yun/37854.html
摘要:反對(duì)的意見主要是這樣可能會(huì)破壞掉無數(shù)個(gè)腳本,而且中已經(jīng)有太多的魔法了。除此之外,的命名本身也算是一種包袱。首字母大寫的,譯作史努比,則是一只被很多人喜愛的漫畫小狗。 showImg(https://segmentfault.com/img/remote/1460000019559250); 本文原創(chuàng)并首發(fā)于公眾號(hào)【Python貓】,未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載。 原文地址:https://mp....
摘要:提供了許多可重用的預(yù)先構(gòu)建好的程序棧的模板。從我們的目的來看,是一個(gè)能夠部署基于容器的程序棧并管理其生命周期的開源的軟件。注意和棧被展開以顯示每一個(gè)程序棧中的多個(gè)容器。文件是與模板相關(guān)的元數(shù)據(jù)的初始資源。 Rancher提供了許多可重用的、預(yù)先構(gòu)建好的程序棧的模板。拓展這些已有的模板或者創(chuàng)建并分享已完成的新模板,是參與Rancher用戶社區(qū)的好方式。同時(shí),這也可以幫助你的組織更高效地利...
摘要:提供了許多可重用的預(yù)先構(gòu)建好的程序棧的模板。從我們的目的來看,是一個(gè)能夠部署基于容器的程序棧并管理其生命周期的開源的軟件。注意和棧被展開以顯示每一個(gè)程序棧中的多個(gè)容器。文件是與模板相關(guān)的元數(shù)據(jù)的初始資源。 Rancher提供了許多可重用的、預(yù)先構(gòu)建好的程序棧的模板。拓展這些已有的模板或者創(chuàng)建并分享已完成的新模板,是參與Rancher用戶社區(qū)的好方式。同時(shí),這也可以幫助你的組織更高效地利...
摘要:學(xué)習(xí)筆記七數(shù)學(xué)形態(tài)學(xué)關(guān)注的是圖像中的形狀,它提供了一些方法用于檢測形狀和改變形狀。學(xué)習(xí)筆記十一尺度不變特征變換,簡稱是圖像局部特征提取的現(xiàn)代方法基于區(qū)域圖像塊的分析。本文的目的是簡明扼要地說明的編碼機(jī)制,并給出一些建議。 showImg(https://segmentfault.com/img/bVRJbz?w=900&h=385); 前言 開始之前,我們先來看這樣一個(gè)提問: pyth...
閱讀 3778·2021-09-24 09:48
閱讀 1262·2021-09-10 10:51
閱讀 3451·2019-08-30 13:03
閱讀 3484·2019-08-30 12:51
閱讀 1531·2019-08-30 11:22
閱讀 1251·2019-08-29 18:38
閱讀 2214·2019-08-29 16:41
閱讀 3439·2019-08-29 15:32