Ou SecretNote
2016年1月16日 星期六
數據科學取樣方法
Simple Random Sampling
將每個樣本編號,在隨機選號抽出樣本。
Stratified Sampling
當樣本有些特色,例如年齡、居住地、國籍等。可以根據這些特色做分類,在從這些分類的群組裡,每個群組取出樣本。
Cluster Sampling
當一個群組可以由一個特點所組成,例如年齡、居住地、國籍等。只針對一個特點進行取樣,例如使用年齡分組,只對20~30歲取樣。
Systematic Sampling
假設樣本共N個,將樣本以n個分成N/n組,在從1~N/n裡隨機選出k。N/n就可以用k來取樣。
沒有留言:
張貼留言
較新的文章
較舊的文章
首頁
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言