收獲QS Top 100統計學offer,我是如何學習數據分析技能的?
預約咨詢
收獲QS Top 100統計學offer,我是如何學習數據分析技能的?
指南者留學 Journey 2022年06月22日 閱讀量:1399
<p style="text-align: justify;"><strong>學員背景</strong><br />F同學<br /><strong>本科背景</strong><br />廣東財經大學 應用統計專業<br />GPA 81.1 雅思7<br />指南者商業分析項目實戰學員<br /><strong>錄取學校(2022年秋季入學)</strong><br /><a href="http://www.jorgecolomardetectives.com/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(QS排名78) 應用統計學專業</span></a><br /><strong>背提戰績</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">距離項目結束已經過去兩個月了,當時參加這個項目的情形還歷歷在目。我是在今年1月初的時候報名這個項目的,其實當時最擔心的問題是這個項目會不會很水,因為網絡上一直詬病于這些項目,但當我真正參與到課程中去的時候,我發現我的想法是錯誤的。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">項目中很多地方對我影響很大,當然我也受益其中,這個項目強化了我的專業技能(提前學習數據分析和挖掘建模方面的技能),豐富了我的實踐經歷,對我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">01 背景與契機</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">一開始選擇參加指南者的背景提升項目,是因為覺得自己的項目經歷太少再加上自己是雙非學校的背景,缺少具體的實戰經驗,大學里參加的項目也很少。即使我是應用統計專業,在學校里學了R語言和SQL,但是<strong>Python的實際應用一直是我的弱點</strong>,所以基于這個想法,我想參加一個提升個人編程能力的項目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">考慮到我后期我想申請港校和英國商業分析的方向,擁有相關的背景經歷也是非常有必要的,<strong>國外的學校在BA這塊的錄取會特別注重申請者的數據分析和建模能力以及實踐經驗</strong>,這些都是我當時比較缺少的幾點吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項目相似的經歷會大大提高成功的概率,因為能體現出自身與項目的匹配度。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">同時我未來的就業方向也是想往數據分析和商業分析這兩個方向,所以提前了解這個領域所必備的技能對以后就業或找實習都會有一定的好處?;谶@幾點,我決定參加這個項目提升自己的背景與能力,最終收獲滿滿。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">02 項目介紹</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我參加的這個項目的名字叫做基于電商大數據零食市場的分析,這個項目主要是收集各類淘寶村的店鋪數據和商品價格、銷量和人氣等數據,以可視化和挖掘建模的方式解讀農村淘寶的經濟特征,從商品特色、品質和口碑等方面,共同探究淘寶村如何實現興農扶貧的目標。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">本次項目的授課老師&mdash;&mdash;王老師,他在bilibili平臺的Tableau可視化視頻幾年來穩居第一,而且他本人也曾經在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實用的建議,所以個人覺得同學們完全可以大膽去報名這個項目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">關于學習的內容,總共分為六大節,上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎、pandas、多分類問題、語義情感分析、預測與相關因素分析,最牛的莫過于是利用百度智能云進行語句情感得分分析,直接調用一段代碼就可以了,大大減少了代碼的書寫時間提高了效率,關鍵<strong>這是我從來沒有在學校的一門課程里接觸到類似的知識</strong>,我認為這也是項目中的一個亮點之一,緊跟現在人工智能的一個潮流。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">03 準備過程</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">即使我是學統計專業,但在實際的操作中也會遇到不少&ldquo;困難&rdquo;,有一些是十分低級的錯誤,比如使用jupyter notebook的時候把小窗口直接關掉,導致了程序無法正常運行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個項目里需要每周一次作業,來檢查同學們的聽課情況,因為當時在寫畢業設計,時間分配和把控上做得不是很好,沒怎么認真聽課。所以想一次性利用課程的課件把作業完成好然后交給老師,但是沒想到當中遇到不少問題,在群上詢問老師意見,一下子就被老師發現了,老師很嚴厲地批評了我,并語重心長地對我說:<strong>編程是需要時間去練習的</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">從那時開始,我每周的課都聽三遍,并將代碼自己再運行一遍,務必讓自己每一個知識點都掌握好,這樣操作下來感覺就沒有特別大的問題了,因為很多難點都是老師所設計好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習編程,提高個人的編程能力,比如在??途W、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業做好充分的準備</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">04 項目實戰</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">經過一個多月的學習之后,我對Python和SQL已經掌握得差不多了,在課程的最后就是需要進行項目實操。個人猜測,老師應該運用了web scraper插件在天貓上爬取了近3000多條數據以及商品的評論區的數據,我們參加項目的同學進行后續的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">首先基本操作,先導入numpy和pandas包,然后對excel表格里的數據進行處理,因為正常情況下獲取的數據都是會有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對二維數據表對空白值去除填充,并且定義新函數對發貨地址的省份與城市實現Excel中的分列功能,最后運用數組與集合等知識來對列中不規則的信息有效提取出來,以獲得商品的具體分類。在這個過程中,老師還經常提醒我們要定期對表內的信息進行檢查,不然會影響到后續的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個項目中最精彩的部分估計就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評論區頻次最高的詞匯,消費者對產品的態度一目了然。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">當然這些僅僅停留在描述統計的范疇里面,是經不起考驗的。后面我們需要借助統計模型建立多元線性回歸模型和PCA模型,利用相關理論進行必要的降維,導入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關性通過顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統</strong>對商品評論內容進行分析,這一步的操作行云流水,十分體現技術,因為在實際處理中,用戶會輸入很多表情,這些都屬于異常字符,都需要進行過濾,所以老師介紹了try&hellip;except&hellip;的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進行,最后計算出同一產品的中位數,并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對后續的商家的運營策略調整具有積極性意義。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">05 個人感受</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我之前一直覺得SQL和Python在實際工作用到的情況十分少,我本人對我自己的Excel水平十分自信,覺得Excel應該可以處理大部分數據分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對十分大的數據量的時候,上萬條數據的時候Excel就可以不管用了,可以說是內存不夠,Python和SQL則可以改善這些缺點,在電腦里相當于是建立了一個虛擬內存,處理數據起來就會十分快捷,這也是<strong>Excel無法達到的高度</strong>,所以<strong>如果以后要吃數據分析這口飯,Python和SQL真的能決定這一份職業的上限。</strong></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">目前我拿到了南安普頓大學應用統計專業的offer,很感謝這個項目給予我的幫助,也增強了我對數據分析技能的信心,當然想要成功,單靠這個課程是不夠的,還需要自身在日常生活中不斷耕耘,在實際數據分析操作中不斷查缺補漏,老師說的話和這股信念鼓勵著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
預約咨詢
預約咨詢
關注指南者留學公眾號
下載指南者留學App
預約咨詢
您的會員等級不足,查看等級詳情
立即前往
huangav