拿到資料的預處理是進行機器學習的第一步,因為在現實生活中取得的資料往往不完整,或是不符合機器學習的需求,所以我們必須先經過資料預處理來將資料「改造」成機器學習喜歡的樣子。本章節最後會提供一個data preprocessing的模板(both Python and R),以後每個章節一開始都用這個模板來預處理資料。

練習用的資料在 https://www.superdatascience.com/machine-learning/ 的Part 1。

文章標籤

李晴 發表在 痞客邦 留言(0) 人氣()

有鑑於之前參加一些類似黑克松(hackathon)的比賽,一大堆組別在上台報告時總是張口閉口就提機器學習(machine learning)。有些工院大佬是真的利用給的資料建了一個machine learning的模型,出來的結果看起來真的很厲害,但也有些商院組別看起來就是只會說不會做,把自己不會做的都說機器學習會做,所以我決定要來了解一下到底什麼是機器學習,當然實作的部分也要好好學,這樣下次比賽才能派上用場。

機器學習(machine learning)是現在正夯的詞彙之一,顧名思義就是機器自己學習的過程。形式有很多種,像是給定一些歷史資料,讓機器分析找出規律之後預測未來的趨勢(supervised learning);或是給定一些顧客的資料,讓機器通過這些資料替顧客進行分群以分別加強廣告效果(clustering);或甚至也有不給定任何起始資料讓機器自己學習的作法(unsupervised learning)。

文章標籤

李晴 發表在 痞客邦 留言(0) 人氣()