2016年1月16日 星期六

數據科學取樣方法


  • Simple Random Sampling

將每個樣本編號,在隨機選號抽出樣本。

  • Stratified Sampling

當樣本有些特色,例如年齡、居住地、國籍等。可以根據這些特色做分類,在從這些分類的群組裡,每個群組取出樣本。

  • Cluster Sampling

當一個群組可以由一個特點所組成,例如年齡、居住地、國籍等。只針對一個特點進行取樣,例如使用年齡分組,只對20~30歲取樣。

  • Systematic Sampling
假設樣本共N個,將樣本以n個分成N/n組,在從1~N/n裡隨機選出k。N/n就可以用k來取樣。

沒有留言:

張貼留言