分層抽樣之基本觀念請參考另篇文章:分層隨機抽樣 (Stratified Random Sampling)
以下為分層等比例隨機抽樣之SAS的應用:
在[程式一]中建立30筆資料, 變數包括no, age, sex,檔名為AA,其中男性10筆,女性20筆,欲抽出30%的樣本,根據比例配置法(Proportional allocation),女性將抽出6個樣本,男性將抽出3個樣本。
[程式一];
data aa;
input no age sex $ @@;
cards;
1 23 F 2 24 F 3 52 M 4 36 M 5 12 M
6 18 F 7 42 F 8 19 M 9 37 M 10 29 F
11 23 F 12 26 F 13 27 F 14 37 F 15 32 F
16 45 M 17 12 M 18 35 M 19 42 M 20 18 M
21 16 F 22 19 F 23 49 F 24 51 F 25 40 F
26 31 F 27 19 F 28 27 F 29 39 F 30 34 F
;
proc print;
run;
利用以下3段指令即可完成分層等比例隨機抽樣
1.method=srs(抽出不放回的簡單隨機抽樣)
2.samprate=0.3(固定抽出比例為0.3)
3.strata sex(指定特定分層)
需要特別注意的是,分層變數要先以sort排序,seed=0則每次抽取的樣本不同,若取大於0的整數,則下次抽樣時即可得到相同的樣本。
[程式二];
proc sort data=aa;
by SEX;
PROC SURVEYSELECT data=aa method =srs
out=aa1 samprate=0.3 seed =1234;
strata sex;
proc print data=aa1;
run;
[結果]
留言列表