更新時間:2023-01-07 15:06:07作者:佚名
一直存在一個理解誤區,單純的以為從事數據分析,學會Python,SQL就行了,認為數據分析和編程一樣,盡可能的熟練使用這些語言就足夠了,直到真正上手開始分析時,我懵圈了,拿到數據之后完全不知道要做什么,再好的編程技能也用不上。所以我不得不從頭開始,了解數據分析的流程。
分析方法之于數據分析,就如設計圖對于蓋房子一樣重要。分析方法能將零散的想法轉化為有條理的思路。那么常見的分析方法有哪些呢?
1 邏輯樹分析法,分析目的:將復雜的問題簡單化。
圖1 邏輯樹分析方法的思路
最具代表性的就是費米問題,這類問題的特點是初次聽到時,會覺得已知條件太少,離答案太遠,但是當變通分析對象之后,所有問題都會迎刃而解。具體解釋參見百度百科,里面還補充了具體案例加深理解。
2 PEST分析法,分析目的:行業分析。
有些業務可以從以下4個角度為切入點進行分析。
圖2 PEST字母代指3 多維度拆解分析法,分析目的:多個角度思考。
該方法將業務分為不同的維度,比如七大姑介紹了相親對象給你,據說男方個子高(維度1),家庭背景好(維度2),長得帥(維度3)。這樣就把一個未曾謀面的人從不用維度“拆解”,方便了解。
那么業務究竟該從哪些維度去拆解呢?
從指標構成和業務流程。比如:
圖3 線上店鋪查看推廣效果如何的維度拆解
注意:多維度拆解分析法有一個獨特之處,叫做辛普森悖論,如從整體和部分考察數據可能會有完全相反的結論,具體解釋參考百科。
圖4 多維度拆解分析方法總結4 對比分析法,分析目的:對比。
俗話說,沒有對比就沒有傷害,對比要有比較的對象。對比問題本質上是指現狀與理想狀態之前的差距,如果理想的狀態未知,就無法比較,進而無法確定問題。
圖5 對比找對象定基準
圖6 對比分析思路總結5 假設檢驗分析法,分析目的:如何解決業務問題。
圖7 假設檢驗分析步驟
假設分析的參考方向:
其中:
圖8 4p營銷理論
圖9 業務流程方向
注意事項:
圖10 假設檢驗分析思路圖6 相關關系分析法,分析目的:數據之間的關系。
相關關系是研究2種或2種以上數據之間存在什么關系的方法,用相關系數( r )表示, r 的大小表示相關程度,正負表示變量的相關方向, \left| r\right|\leq1 , \left| r \right|=1 時相關性最大。
圖11 相關分析解決問題的模式
相關分析如何用?
相關系數;散點圖;哪些因素和分析目標相關;結合其他分析方法深入分析;比如,假設檢驗分析法最后找出幾條原因,但是一般公司資源有限,一個階段中只能集中解決一個問題,這時候就可以通過相關分析法來確定優先解決哪些影響大的因素。
但是,要區分因果關系和相關關系。有的問題直接應用相關關系解釋,有些問題需要找到事件背后的原因(因果關系),因為有時會存在第3方因素或純屬巧合。
如何區分呢?單變量控制法。
7 群組分析法,分析目的:對數據分組,分析留存(流失)問題
按照某個特征,將數據分為不同的組,然后比較各組的數據。
群組分析解決問題的模式:
群組分析找到留存率高(低)的組;假設檢驗,相關分析等分析方法分析為什么留存率高(低);
要根據業務靈活分組,比如視頻類會員按月分組分析留存率,微博、推特類APP按某月使用產品的天數分組等等。
8 RFM分析方法
RFM三個指標含義
把3個指標按價值從低到高排序,3個指標分別作為三維坐標系的XYZ軸,把空間分為8部分,對應下圖。
3指標對應3維圖
如果覺得上面的圖看起來不直觀,可直接看下面的用戶分類規則表。RFM分析法把用戶分為8類,可以對不同價值用戶使用不同的營銷策略,最大化發揮有限的資源,也就是所謂的“精細化運營”。
用戶分類規則表
那么如何用RFM對用戶分類呢?
1)計算R、F、M值;
要得到這3個指標,一般需要數據的3個字段:用戶ID或者用戶名稱、消費時間和消費金額。
根據原始數據計算出的R、F、M值示例
2)給R、F、M按價值打分;
注意!這里的打分是按指標的價值打分,而不是按指標數值大小打分,R越小,F越大,M越大,相對應的用戶價值越高。具體實際業務中,如何定義打分的范圍,要根據具體的業務靈活制定,沒有統一的標準。
打分規則舉例
3)計算價值平均值;
分別計算出R值打分、F值打分、M值打分這3列的平均值。
價值平均值
4)用戶分類;
在表格中增加3列案例分析報告,分別記錄R、F、M值是高于平均值還是低于平均值。如果低于平均值,記為“高”,否則記為“低”。最后和用戶分類表里定義的規則進行比較,就可以得出用戶屬于哪種類別。
用RFM分析法對用戶分類步驟總結:
回頭看前面的分類圖,在坐標軸的中心,可以理解為某個指標價值的平均值。
用戶分類后,如何精細化運營呢?
對用戶分類就是針對每類用戶指定不同的運營策略,具體公司業務不同,方法也不一樣。這里舉例說明前4類用戶:
使用RFM分析法的注意事項:
不同業務的R、F、M指標定義不同,要根據具體業務靈活應用;好比開車的車速控制在哪個范圍是根據路況靈活把握的。同樣的,RFM打分規則可與業務部門溝通,或者使用聚類方法對R、F、M值進行分類,再給每個類別打分;9 漏斗分析方法
從業務流程起點開始到最后目標完成,中間的每個環節都會有用戶流失,因此需要一種分析方法來衡量業務流程每一步的轉化效率。比如,淘寶用戶從瀏覽到最后下單經歷的業務流程是:一款商品瀏覽量1000、點擊量500、訂單量200、支付量50。
某業務環節轉化率=本業務環節用戶數/上一業務環節用戶數,可以衡量相鄰業務環節的轉化情況。比如業務第1環節是瀏覽,第2環節是點擊,則點擊量環節轉化率為:點擊量(500)/瀏覽量(1000)=50%。
某業務環節整體轉化率=某業務環節用戶數/第1業務環節數量,衡量從第1步到該環節為止,總體的轉化情況。如第1環節是瀏覽量1000,支付環節的整天轉化率=支付量(50)/瀏覽量(1000)=5%。
漏斗分析圖,來源于它的形狀像漏斗,所以叫“漏斗圖”。
漏斗分析的作用是:定位問題節點,找出存在問題的業務環節。漏斗分析常用于用戶轉化分析或者用戶流失分析,所以有兩個需關注的指標:用戶轉化和用戶流失。
使用漏斗分析的注意事項:
可以用漏斗分析方法分析用戶轉化問題,不同行業的業務流程不一樣,所以漏斗分析圖也不一樣。如果把漏斗分析方法原封不動地帶入某個行業,不去結合所在行業的業務特點,那么分析出的結果很難具有業務指導性。
比如,傳統的漏斗圖以AARRR模型為基礎,即:獲客--留存--活躍--變現--推薦,這是以用戶增長為核心的漏斗圖,但是對于非社區類產品,比如低頻且成交周期長的購車場景而言,傳統的AARRR模型無法真正表達出汽車行業的業務需求。需將漏斗分析法和購車的業務流程結合起來,形成:線索--進件--過審--簽約--交車的漏斗圖。所以,行業發生變化的過程中,漏斗分析需要從用戶增長轉移到汽車行業,這樣的漏斗分析才可以產生指導作用。
10 杜邦分析方法
杜邦分析法將各種財務指標綜合在一起,評價公司財務管理效果,通常用于公司財務方面的分析。
結合案例應用理解:
假如你想開家面館,自己出資10萬,找親戚借了10萬,那么面館的總資產是20萬:其他投入10萬(自己的錢)+面館負債10萬(找親戚借的)。
1)銷售凈利潤:面館是否賺錢?
銷售凈利潤=凈利潤/銷售額。假如面館第一個月銷售額5萬,刨除其他成本后凈利潤1萬,那么銷售凈利潤=1/5=20%,就是每賣出100塊的面,能賺20元。
2)總資產周轉率:面館資產運營效率如何?
資產周轉率=銷售額總資產,面館總資產20萬,第一個月銷售額5萬,資產周轉率=5/20=25%。
3)權益乘數:面館債務負擔有沒有風險?
權益乘數=總資產/凈資產,也叫做杠桿率,衡量公司負債經營情況。面館總資產20萬,自己出資10萬,則面館的權益乘數=20/10=2。
帶入杜邦分析公式:凈資產收益率=銷售利潤率*資產周轉率*權益乘數,所以,面館的凈資產收益率=20%*25%*2=10%。
當要分析企業為什么利潤下降了類似財務問題,可以用杜邦分析法逐個分解指標來分析,下圖為萬科2018年9月份的杜邦分析。
總結完分析方法,來捋一下數據分析解決問題的過程。
圖12 數據分析解決問題的過程
(1)明確問題。
通過觀察把問題定義清楚,這一步需要明確數據來源和準確性,并對業務指標進行理解。
確認偏誤:定義問題時已經包括了“原因”,根據經驗主觀的把思考局限在“我覺得”的范圍內。人們總傾向于尋找證據來支持自己已經相信的事情,從而抵制不同的看法。要時刻清晰地提醒自己:數據分析不是主觀的臆斷,而是客觀的分析,一切靠數據說話。
圖13 明確問題流程
(2)分析原因。
影響問題的原因有很多種,若把所有原因都分析一遍,工作量很大。根據“計算的平方律”,當一個問題要考慮的因素復雜度變為原來的2倍,對應解決問題需要的時間會變成原來的4倍。所以分析原因時,要優先分析關鍵的因素(分主次)。
3步分析法:
①使用“多維度拆解分析法”對問題進行拆解,將一個復雜問題細化為各個子問題,可以按照用戶、產品、競品3個維度拆解;
圖14 可參考拆解維度
②對拆解的每個部分,使用“假設檢驗分析法”找出問題,分析過程中可使用“對比分析法”等多個分析法輔助完成;
③找到問題以后,多問自己“為什么出現了這個問題”,然后使用“相關分析方法”進行深入分析;
(3)決策。
分析出原因并不是終點,還要提出建議,盡善盡美。
小試牛刀,列出自己的分析思路,嘗試對淘寶嬰兒用品的銷售情況進行分析。
簡要介紹一下數據集,數據集中有兩個表格,分別為表1購買商品,表2嬰兒信息,圖15是表中各列的含義。
圖15 表字段理解
具體的數據清洗操作可查閱下面的文章。
下面的文章是對嬰兒商品銷售情況的簡單可視化分析,僅供參考。
一、明確問題
①明確數據來源和準確性
②業務指標理解
產品角度
a 總銷量波動情況
b 熱銷產品是哪個
用戶角度
a 不同性別對商品類別的需求
b 不同年齡段對商品類別的需求
圖16 分析思路腦圖二、分析原因
(一) 產品角度
1 總銷量波動情況
圖17 不同年份月銷量統計圖
在圖17中,紅色代表銷量最高的月份,分別是12年11月,13年5月,11月,14年5月,11月。黃色代表銷量最低的月份,分別是13年2月,14年1月,15年2月。
5月,11月銷量高,1月,2月銷量低,四年都是這種情況,這是為什么呢?
先使用多維度拆解分析法,對總銷量進行拆解,總銷量=平均單次購買量*購買次數,再用假設檢驗分析法逐個驗證是平均單次購買量還是購買次數影響了總銷量。
假設1:用戶單次購買量影響總銷量,即用戶在5月和11月單次購買量增多,在1月,2月反而下降。
圖18 月平均購買量趨勢圖
如圖18,月平均購買量波動很小,基本在1.5-2之間,所以總銷量的波動不是單次購買量引起的,假設1不成立。
假設2:購買次數影響總銷量。
圖19 購買數量和次數的趨勢圖
圖20 購買數量和次數的散點圖
圖19中購買數量和購買次數的趨勢一致,圖20中的散點圖更進一步證明購買數量和次數的正相關關系,而且相關系數接近1,為強相關。假設2成立。
圖21 假設檢驗方法流程
由圖19可以看出,購買次數的峰值在5月和11月,2月最低,因為假設2成立,總銷量的波動和購買次數有關,所以可以直接分析購買次數的波動原因。
分析11月份購買次數增加的原因。
圖22 2012-2014年11月份購買次數折線圖
圖22顯示,每年的11月11日購買次數激增,當天的購買次數遠超當月其他天,并且2012-2014年雙十一當天的購買次數一直在漲幅狀態。聯想到著名的雙十一大戰,11月份銷量高峰合乎情理。
同樣將2013-2014年5月份每天的購買次數可視化,得到圖23。
圖23 2013年,2014年5月份購買次數折線圖
圖23中,兩個年份5月的購買次數趨勢基本一致,5月份節日較多,包括5月11日和5月12日的母親節促銷,5月20日網絡情人節,以及兒童節的提前預熱。
接下來分析每年1,2月份購買次數下降的原因。
圖24 2013年,2014年,2015年1,2月份購買次數折線圖
查閱日歷得知,2013年春節是2月10日,2014年春節是1月31日,春節期間,物流停運,公司放假,購買次數減少。2015年春節是2月19日,數據集中2015年不完整,可以合理預計2月19日的購買次數也是最低點。
對購買次數指標再次拆解,購買次數包含新用戶購買次數和老用戶購買次數。因為數據有限,假設第一次出現的用戶id為新用戶,第二次及之后出現的為老用戶,則:
圖25 新老用戶購買次數統計
可以看出,老用戶占比極低,所以對應的復購率就低,具體原因需要結合更多的信息判斷。
2 熱銷產品
圖26 商品一級分類銷售占比
圖27 商品二級分類銷量前十
商品一級分類中28,50008168和50014815銷量最好,三者占比為82.02%,占據了主要的市場。商品二級分類中銷量呈階梯式下降,銷量第一的50018831占比5.34%。
(二)用戶角度
1 不同性別對商品需求的差異
圖28 不同性別商品購買量占比
已知性別的數據占比較少,所以此項分析僅供參考。在已知性別的929名用戶中案例分析報告,男性共428位,女性491位,接近1:1。但是圖28顯示男女嬰兒購買商品數量比約為2:3,說明用戶中女嬰兒占比高,比男嬰兒多20%。
圖29 不同性別選擇商品的不同
圖30 每種商品男女選擇占比
由圖29,30可得,男女用戶均主要集中選購的商品為:50014815、50008168和28。6種商品中,50014815和38商品女性購買者比男性多40%。
2 不同年齡段對商品需求的差異
圖31 六類商品在不同年齡段的銷量
圖32 同一年齡段6類商品需求占比
未出生和0-3歲階段是嬰兒需求量最大的兩個階段,其中0-3歲年齡段銷量最大,50014815在未出生和0-3歲都是最受歡迎的,不同年齡段6種商品銷量排行均不同,說明不同年齡段的需求是不同的。
5008168對于4個年齡段都是需求極大的商品,并且隨著年齡的增大,銷量占比也越來越大,與之相反的是50022520,未出生時需求最大。
三、提出建議商品總銷量和購買次數有關,而購買用戶中老用戶占比極少,如果商品不是耐用品,商家應該考慮是什么原因導致的,并加以改進。不同年齡的嬰兒主推產品要有所側重,找準目標群體,比如0-3歲主推50014815,4-12歲推售50008168;女性嬰兒在產品需求上比男性更高,可加強50014815和38產品對女性嬰兒的宣傳力度;在活動期間,可以設置套餐,將熱銷產品捆綁或者一個熱銷產品贈送一個冷門產品出售,又或者將相鄰年齡段的產品搭配出售。法定節假日及電商節要把握銷量高峰的時機,平時也可借鑒推出不同的活動,刺激消費。
End.
參考費米問題%E8%B4%B9%E7%B1%B3%E9%97%AE%E9%A2%98/5100727?fr=aladdin辛普森悖論%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA/4475862?fr=aladdin