Stratification Sampling 13826B
1. **Énoncé du problème :**
Un chercheur veut constituer un échantillon représentatif de 300 étudiants répartis en 7 strates (établissements). On doit calculer le nombre d'individus à tirer dans la 2e strate (Isc) par stratification, puis déterminer les 10 premiers numéros à tirer par échantillonnage systématique avec un pas $p_2=125$.
2. **Formule de la stratification :**
Le nombre d'individus $n_i$ à tirer dans la strate $i$ est donné par
$$n_i = n \times \frac{N_i}{N}$$
avec $n=300$ la taille totale de l'échantillon, $N_i$ la taille de la strate $i$, et $N$ la population totale.
3. **Calculs pour la 2e strate (Isc) :**
- Taille totale $N = 20000 + 10000 + 8000 + 12000 + 3000 + 2000 + 5000 = 60000$
- Taille de la 2e strate $N_2 = 10000$
- Calcul de $n_2$ :
$$n_2 = 300 \times \frac{10000}{60000} = 300 \times \frac{1}{6} = 50$$
4. **Échantillonnage systématique dans la 2e strate :**
- Pas de base $p_2 = 125$
- Les individus sont numérotés de 1 à $N_2 = 10000$
- Le nombre d'individus à tirer est $n_2 = 50$
- Le premier numéro à tirer est un nombre aléatoire $r$ entre 1 et $p_2$. Supposons $r=1$ pour cet exemple (sinon on peut choisir un autre nombre).
- Les 10 premiers numéros à tirer sont :
$$r, r+p_2, r+2p_2, \ldots, r+9p_2 = 1, 126, 251, 376, 501, 626, 751, 876, 1001, 1126$$
---
5. **Deuxième problème :**
Population $N=2500$ décomposée en 5 strates $C_1$ à $C_5$ avec tailles $N_1=600$, $N_2=450$, $N_3=900$, $N_4=170$, $N_5=380$. On veut un échantillon $n=250$.
6. **Méthode de stratification :**
Pour chaque strate $i$, on calcule
$$n_i = n \times \frac{N_i}{N}$$
7. **Calculs :**
- $n_1 = 250 \times \frac{600}{2500} = 250 \times 0.24 = 60$
- $n_2 = 250 \times \frac{450}{2500} = 250 \times 0.18 = 45$
- $n_3 = 250 \times \frac{900}{2500} = 250 \times 0.36 = 90$
- $n_4 = 250 \times \frac{170}{2500} = 250 \times 0.068 = 17$
- $n_5 = 250 \times \frac{380}{2500} = 250 \times 0.152 = 38$
8. **Conclusion :**
L'échantillon représentatif est constitué de 60 individus de $C_1$, 45 de $C_2$, 90 de $C_3$, 17 de $C_4$ et 38 de $C_5$.
Cela garantit que la proportion de chaque strate dans l'échantillon reflète celle de la population totale.