資料科學的 OSEMN 模式
Last updated
Was this helpful?
Last updated
Was this helpful?
Mason & Wiggins (2010) 定義了資料科學的五個步驟:
Obtaining data 抓取
Scrubbing data 清理
Exploring data 探索
Modeling data 建模
iNterpreting data 詮解
簡稱 OSEMN model (發音 awesome)。
抓取資料涉及到確認資料的來源,取得的方式。
現成數據
透過 API
網路爬蟲
要考慮到的有
取樣 (sampling) 的方法
資料取得的法律與倫理議題