李航統(tǒng)計學習方法課件 李航的統(tǒng)計學方法
大家好,今天小編關注到一個比較有意思的話題,就是關于李航統(tǒng)計學習方法課件的問題,于是小編就整理了1個相關介紹李航統(tǒng)計學習方法課件的解答,讓我們一起看看吧。
如何學習數據分析?
優(yōu)秀的數據分析師并不能速成,但是零經驗也有零經驗的捷徑。
市面上有《七周七數據庫》,《七周七編程語言》。今天我們就《七周七學習成為數據分析師》,沒錯,七周。
第一周:Excel學習掌握
如果Excel玩的順溜,可以略過這一周。但很多人并不會vlookup,所以有必要講下。
了解sum,count,sumif,countif,find,if,left/right,時間轉換等。excel的各類函數很多,完全不需要學全。重要的是學會搜索。我學函數是即用即查,將遇到的問題在網上搜索得到所需函數。
重中之重是學會vlookup和數據透視表。這兩個對后續(xù)的數據轉換有幫助。
學會vlookup,SQL中的join,Python中的merge能很快掌握。
學會數據透視表,SQL中的group,Python中的groupby也是同理。
這兩個搞定,基本10萬條以內的數據統(tǒng)計沒啥難度,也就速度慢了點。80%的辦公室白領都能秒殺。
網上多找些習題做,Excel是熟能生巧。
養(yǎng)成一個好習慣,不要合并單元格,不要過于花哨。表格按照原始數據、加工數據,圖表的類型管理。
附加學習:
1、了解中文編碼utf-8,ascii的含義和區(qū)別
2、了解單元格格式,幫助你了解后期的timestamp,date,string,int,bigint,char,factor等各類格式。
3、如果時間還有剩余,可以看《大數據時代》,培養(yǎng)職業(yè)興趣。
第二周:數據可視化
數據分析界有一句經典名言,字不如表,表不如圖。別說平常人,數據分析師自己看數據也頭大。這時就得靠數據可視化的神奇魔力了。
以上就是所謂的可視化。排除掉數據挖掘這類高級分析,不少數據分析師的平常工作之一就是監(jiān)控數據觀察數據。
另外數據分析師是需要兜售自己的觀點和結論的。兜售的最好方式就是做出觀點清晰數據詳實的PPT給老板看。如果沒人認同分析結果,那么分析也不會被改進和優(yōu)化,分析師的價值在哪里?工資也就漲不了對吧。
抽空花一段時間學習可視化的基礎,如《數據之美》
另外你還需要了解BI的概念。知名的BI產品有Tableau,Power BI,還有國產的FineBI等。都有體驗版和免費版能下載,網上找一點數據就能體驗可視化的魅力。比Excel的圖表高級多了。
BI需要了解儀表盤Dashboard的概念,知道維度的聯動和鉆取,知道絕大多數圖表適用的場景和怎么繪制。比如以下FineBI制作的dashboard。
第三周:分析思維的訓練
這周我們輕松一下,學學理論知識。
分析思維首推大名鼎鼎的《金字塔原理》,幫助數據分析師結構化思維。如果金字塔原理讓你醍醐灌頂,那么就可以學思維導圖,下載一個XMind中文網站,或者在線用百度腦圖。
再了解SMART、5W2H、SWOT、4P理論、六頂思考帽等框架。這些框架都是大巧不工的經典。你要快速成為數據分析師,思考方式也得跟著改變。網上搜咨詢公司的面試題,搜Case Book。
題目用新學的思維導圖做,先套那些經典框架,做一遍,然后去看答案對比。因為要鍛煉數據分析能力。所以得結合數據導向的思維。
這里送三條金句:
一個業(yè)務沒有指標,則不能增長和分析
好的指標應該是比率或比例
好的分析應該對比或關聯。
舉一個例子:我告訴你一家超市今天有1000人的客流量,你會怎么分析?
這1000人的數量,和附件其他超市比是多是少?(對比)
這1000人的數量比昨天多還是少?(對比)
1000人有多少產生了實際購買?(轉化比例)
路過超市,超市外的人流是多少?(轉化比例)
這是一個快速搭建分析框架的方法。如果只看1000人,是看不出分析不出任何結果。
第四周:數據庫學習
Excel對十萬條以內的數據處理起來一點不虛,但是資深的數據分析師還是笑摸狗頭,Too Young Too Sample,爺搞得都是百萬數據。要百萬數據,就得上數據庫。
SQL是數據分析師的核心技能之一。有些公司并不給數據庫權限,需要分析師寫郵件提需求,這非常不好。數據分析師經常有各類假設需要驗證,很多時候寫十幾行SQL就能得到的答案,還得麻煩其他部門導出數據。
SQL學習不需要買書,W3C學習就行了,SQL 教程。大多數互聯網公司都是MySQL,我也建議學,性價比最高。
作為數據分析師,只要懂Select相關,增刪改、約束、索引、數據庫范式全部略過。你的公司心得多大才會給你寫權限。
了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數等即可。
你看,和Excel的函數都差不多。如果時間充裕,則學習row_number,substr,convert,contact等。和Excel一樣,學會搜索解決問題。不同引擎的函數也會有差異,例如Presto和phpMyAdmin。
期間你不需要考慮優(yōu)化和寫法丑陋,查詢幾秒和幾分鐘對數據分析師沒區(qū)別,跑數據時喝杯咖啡唄,以后你跑個SVM都能去吃飯了。
網上搜索SQL相關的練習題,刷一遍就行。也能自己下載數據庫管理工具,找些數據練習。我用的是Sequel Pro。
第五周:統(tǒng)計知識學習
統(tǒng)計學是數據分析的基礎之一。
統(tǒng)計知識會要求我們以另一個角度看待數據。當你知道AB兩組的差異用平均值看是多傻的事情,你的分析技巧也會顯著提高。
這一周努力掌握描述性統(tǒng)計,包括均值、中位數、標準差、方差、概率、假設檢驗、顯著性、總體和抽樣等概念。詳細的數學推導不用細看,誰讓我們是速成呢,只要看到數據,知道不能怎么樣,而是應該這樣分析即可。
Excel中有一個分析工具庫,簡單強大。對列1的各名詞做到了解。如果是多變量多樣本,學會各種檢驗。
《統(tǒng)計數字會撒謊》休閑讀物,有趣的案例可以讓我們避免很多數據陷阱。
深入淺出統(tǒng)計學 (豆瓣)還是經典的HeadFirst系列,適應它一貫的啰嗦吧。
多說一句,老板和非分析師不會有興趣知道背后的統(tǒng)計學原理,通常要的是分析后的是與否,二元答案。不要告訴他們P值什么的,告訴他們活動有效果,或者沒效果。
第六周:業(yè)務學習(用戶行為、產品、運營)
這一周需要了解業(yè)務。對于數據分析師來說,業(yè)務的了解比數據方法論更重要。當然很遺憾,業(yè)務學習沒有捷徑。
我舉一個數據沙龍上的例子,一家O2O配送公司發(fā)現在重慶地區(qū),外賣員的送貨效率低于其他城市,導致用戶的好評率降低??偛康臄祿治鰩熃⒘烁鱾€指標去分析原因,都沒有找出來問題。后來在訪談中發(fā)覺,因為重慶是山城,路面高低落差比較夸張,很多外賣人員的小電瓶上不了坡…所以導致送貨效率慢。
這個案例中,我們只知道送貨員的送貨水平距離,數據上根本不可能知道垂直距離這個指標。這就是數據的局限,也是只會看數據的分析師和接地氣分析師的最大差異。
對于業(yè)務市場的了解是數據分析師工作經驗上最大優(yōu)勢之一。既然是零經驗面試,公司肯定也知道剛入門分析師不會有太多業(yè)務經驗,不會以這個卡人。所以簡單花一周了解行業(yè)的各指標。
《增長黑客》
數據驅動業(yè)務的典型,里面包含產品運營最經典的AAARR框架,部分非數據的營銷案例,
《網站分析實戰(zhàn)》
如果應聘的公司涉及Web產品,可以了解流量的概念。書中案例以Google Analytics為主。其實現在是APP+Web的復合框架,比如朋友圈的傳播活動肯定需要用到網頁的指標去分析。
《精益數據分析》
互聯網數據分析的入門書籍,歸納總結了幾個常用的分析框架。比較遺憾的是案例都是歐美。
還有一個小建議,現在有不少第三方的數據應用,囊括了不少產品領域的數據分析和統(tǒng)計。自學黨們即使沒有生產環(huán)境的數據,也可以看一下應用Demo,有好處的。
除了業(yè)務知識,業(yè)務層面溝通也需要掌握。另外建議在面試前幾天收集該行業(yè)的業(yè)務強化一下。
第七周:Python/R學習
終于到第七周,也是最痛苦的一周。這時應該學習編程技巧。是否具備編程能力,是初級數據分析和高級數據分析的風水嶺。數據挖掘,爬蟲,可視化報表都需要用到編程能力。掌握一門優(yōu)秀的編程語言,可以讓數據分析師事半功倍,升職加薪,迎娶白富美。
這里有兩條支線,學習R語言或Python。速成只要學習一條,以后再補上另外一門。
R的優(yōu)點是統(tǒng)計學家編寫的,缺點也是統(tǒng)計學家編寫。如果是各類統(tǒng)計函數的調用,繪圖,分析的前驗性論證,R無疑有優(yōu)勢。但是大數據量的處理力有不逮,學習曲線比較陡峭。Python則是萬能的膠水語言,適用性強,可以將各類分析的過程腳本化。Pandas,sklearn等各包也已經追平R。
如果學習R,建議看《R語言實戰(zhàn)》,照著書本打一遍代碼,一星期綽綽有余。另外還有一本《統(tǒng)計學》,偏知識理論,可以復習前面的統(tǒng)計學知識。
R學習和熟悉各種包。知道描述性統(tǒng)計的函數。掌握DataFrame。如果時間有余。可以再去學習ggplot2。
Python擁有很多分支,我們專注數據分析這塊,入門可以學習《深入淺出Python》。
需要學會條件判斷,字典,切片,循環(huán),迭代,自定義函數等。知道數據領域最經典的包Pandas+Numpy。
在速成后的很長一段時間,我們都要做調包俠。
這兩門語言最好安裝IDE,R語言我建議用RStudio,Python我建議用 Anaconda。都是數據分析的利器。
Mac自帶Python2.7,但現在Python 3已經比幾年前成熟,而且沒有編碼問題。各類教程也足夠多,不要抱成守舊了。Win的電腦,安裝Python會有環(huán)境變量的問題,是個大坑(R的中文編碼也是天坑)。
到這里,剛剛好是七周。如果還需要第八周+,則是把上面的鞏固和融會貫通,畢竟速成是以轉崗或拿offer為目的。有機會,我會專門寫文章講解每一周的具體知識,并且用爬蟲爬一些數據做練習和案例。
謝邀
現在發(fā)達城市北上廣,已經開始用大數據,運做基金了。而且門檻很高,必須金融和計算機的本科以上人員,研究生擇優(yōu)錄取。
可見大數據,發(fā)展的力度。很多人不知道大數據怎么交易股票,這這里簡單說下,現在好多券商軟件支持,大數據自動化交易,也就是說,當你編寫好自己的預期策略后,由程序根據你的策略實行,自動化交易?,F在名聲僅次于巴菲特的詹姆斯.西蒙斯,就是大數據量化交易的先驅,他名下的大獎章基金,就是根據大數據量化交易運行。
大數據量化交易,可以實現。一天成百上千次此交易,只要資金允許。這也是發(fā)達發(fā)達城市為什么著重研究的對象。還有大數據是未來的趨勢。電腦在對市場熱度的分析,要強于人工識別。但是論單個交易,人工肯定強于電腦,但是從現在的基金規(guī)模來看。電腦交易是主要趨勢。不管多厲害的基金經理,精力都是有限的。
目前的大數據都是借助python為主要語言編寫的,感興趣的可以看看相關方面的學習。券商對自動化交易的資金,一般是5w門檻。所以,隨著市場的發(fā)展。大數據量化交易,會慢慢普及。
以上就是本人對大數據的看法,喜歡的可以加個關注,點個贊。
很高興回答您的問題。
作為一個數據分析師,結合工作我談談我自己的看法。
首先,做數據分析首先得學習數據庫,比較數據是最基本的資源。
其次,是數據分析相關的理論,為建?;蛘哌M行進一步分析打基礎。代數和統(tǒng)計知識要求較高。
再次,學習各種軟件。Excel是最最最基本的工具,各種函數、插件的學習;SPSS、R至少掌握一種吧,個人認為SPSS更容易上手,當然每個行業(yè)有自己相對認可的工具;Python建議掌握,很強大的工具,清洗數據、建模、可視化、爬蟲等等都可以完成。最后建議掌握一個可視化軟件比如Tableau。當然分析完需要寫報告,不管文字功底、概括能力、審美能力,都是有要求的。
最后,模型學習,這個沒的說,要知道每個模型是用來干什么,比如決策樹做畫像是經常會用到的。
特別想說一點,數據分析不能只看數據,還要相對了解業(yè)務,脫離業(yè)務的數據分析什么都不是。
希望對您有幫助。
到此,以上就是小編對于李航統(tǒng)計學習方法課件的問題就介紹到這了,希望介紹關于李航統(tǒng)計學習方法課件的1點解答對大家有用。