地區(qū)
英國
美國
中國香港
新加坡
澳大利亞
院校庫
學(xué)校庫
專業(yè)庫
排名庫
認(rèn)證查詢
英國選校
學(xué)員錄取
成功案例
錄取報(bào)告
本科戰(zhàn)績(jī)
南極星計(jì)劃
留學(xué)資訊
背景提升
背提項(xiàng)目
實(shí)習(xí)內(nèi)推
高頻競(jìng)賽
背提免費(fèi)課
顧問團(tuán)隊(duì)
資料庫
關(guān)于我們
服務(wù)項(xiàng)目
指南動(dòng)態(tài)
聯(lián)系我們
App下載
本科留學(xué)
留學(xué)考研雙保險(xiǎn)
2025 QS
英國留學(xué)選校查詢
登錄
GPA 81,我選擇“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”項(xiàng)目提升背景!
關(guān)注已取消
關(guān)注成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{ !collectStatus ? '+' : '' }}
{{!collectStatus ? '關(guān)注' : '已關(guān)注'}}
預(yù)約咨詢
GPA 81,我選擇“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”項(xiàng)目提升背景!
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學(xué) Journey
2022年10月24日
閱讀量:1938
<p style="text-align: justify;"><img style="width: 808px; height: 61px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1666599255621/1666599255621.png" width="808" height="61" /></p> <p style="text-align: justify;"><strong>學(xué)員背景</strong><br />W同學(xué)<br /><strong>本科背景</strong><br />南京理工大學(xué) 通信工程<br />GPA 81.2<br /><strong>背提項(xiàng)目</strong><br />指南者留學(xué)機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)<br />匯豐銀行外幣理財(cái)用戶購買意愿預(yù)測(cè)</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">01 契機(jī)背景</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我是一名大四的本科生,在大三升大四的暑假參加了指南者留學(xué)的機(jī)器學(xué)習(xí)背景提升項(xiàng)目,主要內(nèi)容是匯豐銀行外幣理財(cái)用戶購買意愿預(yù)測(cè)。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><strong>首先,我想談一談為什么選擇指南者的背景提升項(xiàng)目。</strong></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在大學(xué)前三年的學(xué)習(xí)中,作為電子信息類專業(yè)的學(xué)生,除了需要接觸大量的與電子學(xué)科相關(guān)理論,編程能力也是很重要的一部分,誰能夠?qū)⑵骷睦碚撝R(shí)與編程代碼相結(jié)合,誰就能在短時(shí)間內(nèi)實(shí)現(xiàn)器件功能的設(shè)計(jì),并且相較于一些傳統(tǒng)的電子設(shè)計(jì)軟件,通過編程設(shè)計(jì)出來的器件能夠更好的實(shí)現(xiàn)功能的多樣性和創(chuàng)新性。譬如在一個(gè)傳統(tǒng)芯片的設(shè)計(jì)中,可能添加一個(gè)功能就需要在版圖上進(jìn)行全部芯線的重新連接和繪制,但在數(shù)字化的芯片設(shè)計(jì)中只需要添加或修改其中的一部分代碼。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">其次,是為了個(gè)人能力的進(jìn)一步提升。在本科的學(xué)習(xí)過程中,我從未接觸過python這類語言,也未參與過機(jī)器學(xué)習(xí)相關(guān)的課程,但python無疑是當(dāng)下最熱門的計(jì)算機(jī)語言之一,“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”的模式也無疑是當(dāng)下最熱門的項(xiàng)目之一。<strong>我希望能通過我的個(gè)人能力,對(duì)某類數(shù)據(jù)集實(shí)現(xiàn)從無到有、從復(fù)雜到簡(jiǎn)單的分析過程,能夠從單一的數(shù)字中挖掘出有用的信息。</strong>這對(duì)我來說是一個(gè)全新的項(xiàng)目和挑戰(zhàn),而指南者的背提項(xiàng)目恰好給予了我這一機(jī)會(huì)。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最后一條是為了<strong>彌補(bǔ)自己在留學(xué)申請(qǐng)時(shí)科研項(xiàng)目上的空缺</strong>。在大學(xué)階段我雖然完成了不少實(shí)驗(yàn)和課程設(shè)計(jì),但所接觸的科研經(jīng)歷總體較少,而在院校申請(qǐng)時(shí)科研項(xiàng)目經(jīng)歷又是很被看重的一方面,因此這一機(jī)會(huì)成為了我背景提升的“救命稻草”。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">02 項(xiàng)目過程及收獲</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">主要的項(xiàng)目過程是首先通過老師的課程學(xué)習(xí)相關(guān)的基礎(chǔ)知識(shí),譬如科研項(xiàng)目的一般流程、機(jī)器學(xué)習(xí)的項(xiàng)目簡(jiǎn)介、Numpy庫、Matplotlib庫、Pandas庫、數(shù)據(jù)清洗的一般方法、回歸模型、分類模型、評(píng)價(jià)指標(biāo)等。每一次課程都會(huì)對(duì)應(yīng)著相關(guān)的作業(yè)(主要是對(duì)老師給的題目進(jìn)行編程并寫一份簡(jiǎn)單的報(bào)告),之后老師會(huì)集中幾次作業(yè)的情況對(duì)我的作業(yè)進(jìn)行單獨(dú)講解,這個(gè)過程大約持續(xù)了3~4周。這些作業(yè)內(nèi)容幫助我很好地理解了課程的相關(guān)內(nèi)容,并進(jìn)一步加深了對(duì)python編程的理解。</p> <p style="text-align: justify;"><img style="width: 501px; height: 708px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phppPkePE.jpg" width="501" height="708" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">完成了上述課程的學(xué)習(xí)之后就進(jìn)入了具體的項(xiàng)目實(shí)戰(zhàn)。我的項(xiàng)目?jī)?nèi)容主要是結(jié)合匯豐銀行以往的用戶購買外匯理財(cái)產(chǎn)品的數(shù)據(jù)以及用戶本身的信息(如住房情況、信貸狀況、家庭背景、工作信息等)來進(jìn)行有效特征的篩選,也就是從其中挑選出對(duì)購買理財(cái)產(chǎn)品影響因子較大的因素放入最終的模型,而無關(guān)的因素則可以刪去,并且通過用戶自身信息與過往金融行為來搭建購買意愿預(yù)測(cè)系統(tǒng),提高最終預(yù)測(cè)模型的效率。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先需要在數(shù)據(jù)預(yù)處理中進(jìn)行了缺失值填補(bǔ)、獨(dú)熱編碼等步驟,并進(jìn)行了樸素的過采樣處理保證數(shù)據(jù)集的平衡性。在數(shù)據(jù)處理的第一步我就碰到了問題,但我的指導(dǎo)老師梅老師一直對(duì)我的每次問題進(jìn)行了詳細(xì)的解答,為我省去了很多不必要的麻煩。<br /><img style="width: 705px; height: 564px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_php0YtJy9.jpg" width="705" height="564" /><img style="width: 711px; height: 358px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpiWsblT.jpg" width="711" height="358" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在進(jìn)行模型搭建之前先對(duì)數(shù)據(jù)進(jìn)行一定的清洗,畢竟在以后面對(duì)實(shí)際的數(shù)據(jù)集時(shí),不可能得到一個(gè)完完整整的數(shù)據(jù)庫,因此數(shù)據(jù)清洗是必要的,以某數(shù)據(jù)集為例統(tǒng)計(jì)可得到該數(shù)據(jù)集共有19439行損失,64列損失。查看每列數(shù)據(jù)的缺失值比例,其中部分結(jié)果如下:</p> <p style="text-align: justify;"><img style="width: 770px; height: 259px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpce4a2H.jpg" width="770" height="259" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">從中可以看出,該數(shù)據(jù)集中有大量的缺失值,出于下一步模型的需要因此不能進(jìn)行簡(jiǎn)單的刪除,對(duì)此我使用Imputer進(jìn)行了缺失值填補(bǔ)等數(shù)據(jù)預(yù)處理步驟。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">同時(shí),在該數(shù)據(jù)集中有幾個(gè)特征是無序的分類特征。為了處理這一問題,我進(jìn)行了獨(dú)熱編碼等步驟,即為每一個(gè)無序分類特征的每一個(gè)可能的類別創(chuàng)建一個(gè)“虛擬”變量。經(jīng)過以上處理之后數(shù)據(jù)集就顯得有序了許多,于是就開始進(jìn)行下面的步驟。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在特征抽取步驟中,我使用了GBDT和PCA的方法進(jìn)行,兩種方法各有優(yōu)點(diǎn)和缺點(diǎn),我都進(jìn)行了嘗試并對(duì)相應(yīng)的結(jié)果進(jìn)行了對(duì)比。在本項(xiàng)目中的PCA降維中,可以繪制出n_components與cum_explained_variance_ratio對(duì)應(yīng)的圖像曲線如下,最終選擇n=20作為新生成的特征個(gè)數(shù)。<br /><img style="width: 663px; height: 403px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phphUBVKS.jpg" width="663" height="403" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最終結(jié)合了測(cè)試集上的指標(biāo)以及模型的運(yùn)算量大小等綜合因素,本項(xiàng)目采用PCA的特征抽取方法。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在特征過濾中主要選擇了方差選擇法、遞歸特征消除法和基于懲罰項(xiàng)的特征選擇法,并對(duì)原理和結(jié)果進(jìn)行了說明。最后利用不同的機(jī)器學(xué)習(xí)算法分別進(jìn)行交叉驗(yàn)證和網(wǎng)格搜索確定模型的參數(shù)(如:n_estimators、max_depth等)并對(duì)該數(shù)據(jù)集進(jìn)行預(yù)測(cè),例如隨機(jī)森林、邏輯回歸、stacking集成等,最后通過AUC和ROC等評(píng)價(jià)指標(biāo)的對(duì)比分析確定最佳模型,即隨機(jī)森林模型可以對(duì)銀行外幣理財(cái)用戶購買意愿起到比較好的預(yù)測(cè)效果。該系統(tǒng)還可以通過數(shù)據(jù)來對(duì)用戶的購買意愿進(jìn)行判斷,并且提供意愿排名,來更為精準(zhǔn)的找到意愿強(qiáng)烈的客戶提高產(chǎn)品的購買率。</p> <p style="text-align: justify;"><img style="width: 808px; height: 1143px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpfWE8NC.jpg" width="808" height="1143" /><img style="width: 808px; height: 1142px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpjnjsFK.jpg" width="808" height="1142" /><img style="width: 808px; height: 1142px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpGloUsz.jpg" width="808" height="1142" /></p> <p style="text-align: center;"><span class="h6">(我的最終報(bào)告部分展示)</span></p> <p style="text-align: center;"> </p> <p style="text-align: justify;"><span class="h1">03 收獲與感悟</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最后我還想談一談我在這一過程中的收獲。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先是指南者的背景提升項(xiàng)目讓我更加<strong>清楚了自身的興趣和學(xué)習(xí)的意義</strong>,書本上的理論知識(shí)雖然是枯燥的但也是必備的,如何將這些理論知識(shí)運(yùn)用到實(shí)踐中去并取得真正有意義的成果才是最重要的,而成果是否有意義的重要衡量標(biāo)準(zhǔn)之一就是是否能解決實(shí)際問題,本次的背提項(xiàng)目讓我看到了知識(shí)與實(shí)踐融合的魅力。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">第二是<strong>讓我在留學(xué)申請(qǐng)中提升了自己的競(jìng)爭(zhēng)力</strong>,對(duì)于科研小白的我來說,這無疑是我的申請(qǐng)簡(jiǎn)歷中濃墨重彩的一筆,該項(xiàng)目不僅是對(duì)我個(gè)人能力的證明,也能夠幫助申請(qǐng)?jiān)盒5睦蠋焸冞M(jìn)一步了解我。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">第三是<strong>提高了我對(duì)新事物的接受能力</strong>,從接觸一門全新的編程語言到能夠最終完成該項(xiàng)目,這對(duì)我來說是一次挑戰(zhàn)也是一次飛躍,這讓我對(duì)接下來的學(xué)習(xí)生活更有自信。</p> <p style="text-align: justify;"><img style="width: 808px; height: 188px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1666599264914/1666599264914.png" width="808" height="188" /></p>
猜你喜歡
壓績(jī)點(diǎn)是壞文明
1591
死磕雅思沒用,有人不是那塊料
1487
海外名校1v1科研:基于深度學(xué)習(xí)的中國租房通脹預(yù)測(cè)|收獲一作論文與導(dǎo)師推薦信!
21653
背景提升學(xué)員|喜報(bào)!新國立、南洋理工、港大、港城、悉尼大學(xué)、曼大、華威、伊利諾伊香檳分校offer來了!
21691
對(duì)機(jī)器學(xué)習(xí)感興趣?不如先來實(shí)踐一下?。短厮估囕v故障自動(dòng)檢測(cè)系統(tǒng)》
21600
曼大范教授1v1科研:溫和條件下CO2催化制甲醇:新型催化劑的研發(fā)|收獲一作論文與導(dǎo)師推薦信!
21518
預(yù)約咨詢
預(yù)約咨詢
七日熱點(diǎn)資訊
世界大學(xué)排名——港大名列全國三甲
擠爆了!港中文多個(gè)專業(yè)突發(fā)滿位、港大網(wǎng)申系統(tǒng)崩潰......25fall香港接連發(fā)出預(yù)警,今年申請(qǐng)真的那么難嗎?
“為了LSE,我放棄了985保研。”畢業(yè)后,我用一年50多萬的學(xué)費(fèi)換來了外企工作!
搶人了!新國立、港中文相繼開設(shè)新專業(yè),今年各大院校的搶人大戰(zhàn)還在持續(xù)發(fā)力?
震驚!賓大學(xué)霸街頭槍殺美國醫(yī)保巨頭CEO,和馬斯克、特朗普同是校友的他究竟有何來頭?
拿到帝國理工offer的我哭了...211無緣美國Top30,轉(zhuǎn)戰(zhàn)英港新逆襲上岸世界第二!
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學(xué)App
預(yù)約咨詢
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
登錄
二維碼已過期
重新獲取
已掃碼
等待確認(rèn)登錄
請(qǐng)使用微信掃描二維碼登錄
現(xiàn)在來設(shè)置你的賬號(hào)吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請(qǐng)學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是
多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱是
沒有查詢到相關(guān)的學(xué)校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關(guān)的專業(yè)
查詢中...
4. 您從哪里了解到指南者留學(xué)網(wǎng)站的
*
0/20
取消
上一步
下一步
復(fù)制
復(fù)制
您的會(huì)員等級(jí)不足,查看等級(jí)詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認(rèn)
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認(rèn)收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定