地區(qū)
英國
美國
中國香港
新加坡
澳大利亞
院校庫
學校庫
專業(yè)庫
排名庫
認證查詢
英國選校
學員錄取
成功案例
錄取報告
本科戰(zhàn)績
南極星計劃
留學資訊
背景提升
背提項目
實習內(nèi)推
高頻競賽
背提免費課
顧問團隊
資料庫
關(guān)于我們
服務(wù)項目
指南動態(tài)
聯(lián)系我們
App下載
本科留學
留學考研雙保險
2025 QS
英國留學選校查詢
登錄
收獲QS Top 100統(tǒng)計學offer,我是如何學習數(shù)據(jù)分析技能的?
關(guān)注已取消
關(guān)注成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{ !collectStatus ? '+' : '' }}
{{!collectStatus ? '關(guān)注' : '已關(guān)注'}}
預(yù)約咨詢
收獲QS Top 100統(tǒng)計學offer,我是如何學習數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學 Journey
2022年06月22日
閱讀量:1916
<p style="text-align: justify;"><strong>學員背景</strong><br />F同學<br /><strong>本科背景</strong><br />廣東財經(jīng)大學 應(yīng)用統(tǒng)計專業(yè)<br />GPA 81.1 雅思7<br />指南者商業(yè)分析項目實戰(zhàn)學員<br /><strong>錄取學校(2022年秋季入學)</strong><br /><a href="http://pnemnih.cn/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(QS排名78) 應(yīng)用統(tǒng)計學專業(yè)</span></a><br /><strong>背提戰(zhàn)績</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">距離項目結(jié)束已經(jīng)過去兩個月了,當時參加這個項目的情形還歷歷在目。我是在今年1月初的時候報名這個項目的,其實當時最擔心的問題是這個項目會不會很水,因為網(wǎng)絡(luò)上一直詬病于這些項目,但當我真正參與到課程中去的時候,我發(fā)現(xiàn)我的想法是錯誤的。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">項目中很多地方對我影響很大,當然我也受益其中,這個項目強化了我的專業(yè)技能(提前學習數(shù)據(jù)分析和挖掘建模方面的技能),豐富了我的實踐經(jīng)歷,對我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">01 背景與契機</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">一開始選擇參加指南者的背景提升項目,是因為覺得自己的項目經(jīng)歷太少再加上自己是雙非學校的背景,缺少具體的實戰(zhàn)經(jīng)驗,大學里參加的項目也很少。即使我是應(yīng)用統(tǒng)計專業(yè),在學校里學了R語言和SQL,但是<strong>Python的實際應(yīng)用一直是我的弱點</strong>,所以基于這個想法,我想?yún)⒓右粋€提升個人編程能力的項目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">考慮到我后期我想申請港校和英國商業(yè)分析的方向,擁有相關(guān)的背景經(jīng)歷也是非常有必要的,<strong>國外的學校在BA這塊的錄取會特別注重申請者的數(shù)據(jù)分析和建模能力以及實踐經(jīng)驗</strong>,這些都是我當時比較缺少的幾點吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項目相似的經(jīng)歷會大大提高成功的概率,因為能體現(xiàn)出自身與項目的匹配度。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">同時我未來的就業(yè)方向也是想往數(shù)據(jù)分析和商業(yè)分析這兩個方向,所以提前了解這個領(lǐng)域所必備的技能對以后就業(yè)或找實習都會有一定的好處。基于這幾點,我決定參加這個項目提升自己的背景與能力,最終收獲滿滿。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">02 項目介紹</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我參加的這個項目的名字叫做基于電商大數(shù)據(jù)零食市場的分析,這個項目主要是收集各類淘寶村的店鋪數(shù)據(jù)和商品價格、銷量和人氣等數(shù)據(jù),以可視化和挖掘建模的方式解讀農(nóng)村淘寶的經(jīng)濟特征,從商品特色、品質(zhì)和口碑等方面,共同探究淘寶村如何實現(xiàn)興農(nóng)扶貧的目標。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">本次項目的授課老師——王老師,他在bilibili平臺的Tableau可視化視頻幾年來穩(wěn)居第一,而且他本人也曾經(jīng)在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實用的建議,所以個人覺得同學們完全可以大膽去報名這個項目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">關(guān)于學習的內(nèi)容,總共分為六大節(jié),上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎(chǔ)、pandas、多分類問題、語義情感分析、預(yù)測與相關(guān)因素分析,最牛的莫過于是利用百度智能云進行語句情感得分分析,直接調(diào)用一段代碼就可以了,大大減少了代碼的書寫時間提高了效率,關(guān)鍵<strong>這是我從來沒有在學校的一門課程里接觸到類似的知識</strong>,我認為這也是項目中的一個亮點之一,緊跟現(xiàn)在人工智能的一個潮流。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">03 準備過程</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">即使我是學統(tǒng)計專業(yè),但在實際的操作中也會遇到不少“困難”,有一些是十分低級的錯誤,比如使用jupyter notebook的時候把小窗口直接關(guān)掉,導致了程序無法正常運行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個項目里需要每周一次作業(yè),來檢查同學們的聽課情況,因為當時在寫畢業(yè)設(shè)計,時間分配和把控上做得不是很好,沒怎么認真聽課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒想到當中遇到不少問題,在群上詢問老師意見,一下子就被老師發(fā)現(xiàn)了,老師很嚴厲地批評了我,并語重心長地對我說:<strong>編程是需要時間去練習的</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">從那時開始,我每周的課都聽三遍,并將代碼自己再運行一遍,務(wù)必讓自己每一個知識點都掌握好,這樣操作下來感覺就沒有特別大的問題了,因為很多難點都是老師所設(shè)計好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習編程,提高個人的編程能力,比如在??途W(wǎng)、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業(yè)做好充分的準備</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">04 項目實戰(zhàn)</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">經(jīng)過一個多月的學習之后,我對Python和SQL已經(jīng)掌握得差不多了,在課程的最后就是需要進行項目實操。個人猜測,老師應(yīng)該運用了web scraper插件在天貓上爬取了近3000多條數(shù)據(jù)以及商品的評論區(qū)的數(shù)據(jù),我們參加項目的同學進行后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先基本操作,先導入numpy和pandas包,然后對excel表格里的數(shù)據(jù)進行處理,因為正常情況下獲取的數(shù)據(jù)都是會有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對二維數(shù)據(jù)表對空白值去除填充,并且定義新函數(shù)對發(fā)貨地址的省份與城市實現(xiàn)Excel中的分列功能,最后運用數(shù)組與集合等知識來對列中不規(guī)則的信息有效提取出來,以獲得商品的具體分類。在這個過程中,老師還經(jīng)常提醒我們要定期對表內(nèi)的信息進行檢查,不然會影響到后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個項目中最精彩的部分估計就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評論區(qū)頻次最高的詞匯,消費者對產(chǎn)品的態(tài)度一目了然。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">當然這些僅僅停留在描述統(tǒng)計的范疇里面,是經(jīng)不起考驗的。后面我們需要借助統(tǒng)計模型建立多元線性回歸模型和PCA模型,利用相關(guān)理論進行必要的降維,導入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關(guān)性通過顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統(tǒng)</strong>對商品評論內(nèi)容進行分析,這一步的操作行云流水,十分體現(xiàn)技術(shù),因為在實際處理中,用戶會輸入很多表情,這些都屬于異常字符,都需要進行過濾,所以老師介紹了try…except…的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進行,最后計算出同一產(chǎn)品的中位數(shù),并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對后續(xù)的商家的運營策略調(diào)整具有積極性意義。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">05 個人感受</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我之前一直覺得SQL和Python在實際工作用到的情況十分少,我本人對我自己的Excel水平十分自信,覺得Excel應(yīng)該可以處理大部分數(shù)據(jù)分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對十分大的數(shù)據(jù)量的時候,上萬條數(shù)據(jù)的時候Excel就可以不管用了,可以說是內(nèi)存不夠,Python和SQL則可以改善這些缺點,在電腦里相當于是建立了一個虛擬內(nèi)存,處理數(shù)據(jù)起來就會十分快捷,這也是<strong>Excel無法達到的高度</strong>,所以<strong>如果以后要吃數(shù)據(jù)分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。</strong></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">目前我拿到了南安普頓大學應(yīng)用統(tǒng)計專業(yè)的offer,很感謝這個項目給予我的幫助,也增強了我對數(shù)據(jù)分析技能的信心,當然想要成功,單靠這個課程是不夠的,還需要自身在日常生活中不斷耕耘,在實際數(shù)據(jù)分析操作中不斷查缺補漏,老師說的話和這股信念鼓勵著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
壓績點是壞文明
1591
死磕雅思沒用,有人不是那塊料
1487
海外名校1v1科研:基于深度學習的中國租房通脹預(yù)測|收獲一作論文與導師推薦信!
21653
背景提升學員|喜報!新國立、南洋理工、港大、港城、悉尼大學、曼大、華威、伊利諾伊香檳分校offer來了!
21691
對機器學習感興趣?不如先來實踐一下!|《特斯拉車輛故障自動檢測系統(tǒng)》
21600
曼大范教授1v1科研:溫和條件下CO2催化制甲醇:新型催化劑的研發(fā)|收獲一作論文與導師推薦信!
21518
預(yù)約咨詢
預(yù)約咨詢
七日熱點資訊
世界大學排名——港大名列全國三甲
擠爆了!港中文多個專業(yè)突發(fā)滿位、港大網(wǎng)申系統(tǒng)崩潰......25fall香港接連發(fā)出預(yù)警,今年申請真的那么難嗎?
“為了LSE,我放棄了985保研。”畢業(yè)后,我用一年50多萬的學費換來了外企工作!
搶人了!新國立、港中文相繼開設(shè)新專業(yè),今年各大院校的搶人大戰(zhàn)還在持續(xù)發(fā)力?
震驚!賓大學霸街頭槍殺美國醫(yī)保巨頭CEO,和馬斯克、特朗普同是校友的他究竟有何來頭?
拿到帝國理工offer的我哭了...211無緣美國Top30,轉(zhuǎn)戰(zhàn)英港新逆襲上岸世界第二!
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學App
預(yù)約咨詢
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
登錄
二維碼已過期
重新獲取
已掃碼
等待確認登錄
請使用微信掃描二維碼登錄
現(xiàn)在來設(shè)置你的賬號吧
只需要花不到一分鐘,之后便可以獲得更精準的推薦~
1
留學意向
2
基本意向
3
詳細背景
4
了解途徑
1.1 您期望申請學歷是
1.2 您期待的留學地區(qū)是
多選
2.1 您的身份狀態(tài)是
2.2 您的目前學歷是
3.1 您的本科學校是
大陸本科
海外本科
3.2 您的學校名稱是
沒有查詢到相關(guān)的學校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關(guān)的專業(yè)
查詢中...
4. 您從哪里了解到指南者留學網(wǎng)站的
*
0/20
取消
上一步
下一步
復(fù)制
復(fù)制
您的會員等級不足,查看等級詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定