Regression Obligations
1. **Énoncé du problème :**
Un investisseur étudie la relation entre les rendements des obligations (RDT) et leur maturité (MAT) selon le modèle linéaire :
$$RDT_t = \alpha + \beta MAT_t + \varepsilon_t, \quad t=1,\ldots,8$$
On doit répondre à plusieurs questions sur ce modèle.
2. **Type de donnée :**
Les données sont des données de panel temporel (série chronologique) car $t$ représente des périodes successives (de 1 à 8).
3. **Signe escompté de $\beta$ :**
On s'attend généralement à ce que $\beta > 0$ car les obligations à plus longue maturité ont souvent un rendement plus élevé (prime de risque de durée).
4. **Hypothèse d'homoscedasticité :**
C'est l'hypothèse que la variance des erreurs $\varepsilon_t$ est constante pour toutes les observations $t$, c'est-à-dire
$$\mathrm{Var}(\varepsilon_t) = \sigma^2, \quad \forall t$$
Cela garantit la validité des tests statistiques classiques.
5. **Estimation des paramètres $\alpha$ et $\beta$ par MCO :**
Données :
$$\sum RDT_t^2 = 58{,}04, \quad \sum RDT_t MAT_t = 23{,}55, \quad \sum MAT_t^2 = 316{,}875,$$
$$n=8, \quad \sum RDT_t = 2{,}65, \quad \sum MAT_t = 7{,}875$$
Calcul des moyennes :
$$\bar{RDT} = \frac{2{,}65}{8} = 0{,}33125, \quad \bar{MAT} = \frac{7{,}875}{8} = 0{,}984375$$
Calcul de $\beta$ :
$$\beta = \frac{\sum RDT_t MAT_t - n \bar{RDT} \bar{MAT}}{\sum MAT_t^2 - n \bar{MAT}^2} = \frac{23{,}55 - 8 \times 0{,}33125 \times 0{,}984375}{316{,}875 - 8 \times (0{,}984375)^2}$$
Calculons le numérateur :
$$23{,}55 - 8 \times 0{,}33125 \times 0{,}984375 = 23{,}55 - 2{,}610 = 20{,}94$$
Calculons le dénominateur :
$$316{,}875 - 8 \times 0{,}969 = 316{,}875 - 7{,}752 = 309{,}123$$
Donc :
$$\beta = \frac{20{,}94}{309{,}123} \approx 0{,}0677$$
Calcul de $\alpha$ :
$$\alpha = \bar{RDT} - \beta \bar{MAT} = 0{,}33125 - 0{,}0677 \times 0{,}984375 = 0{,}33125 - 0{,}0666 = 0{,}2646$$
6. **Test de significativité des estimateurs $\alpha$ et $\beta$ au seuil 10% :**
Il faut calculer les erreurs standards et les statistiques $t$.
Calcul de la somme des carrés des résidus (SCR) :
$$\sum RDT_t^2 - \alpha \sum RDT_t - \beta \sum RDT_t MAT_t = 58{,}04 - 0{,}2646 \times 2{,}65 - 0{,}0677 \times 23{,}55$$
$$= 58{,}04 - 0{,}701 - 1{,}594 = 55{,}745$$
Degré de liberté : $n-2=6$
Variance estimée des résidus :
$$s^2 = \frac{SCR}{n-2} = \frac{55{,}745}{6} = 9{,}29$$
Erreur standard de $\beta$ :
$$SE(\beta) = \sqrt{\frac{s^2}{\sum (MAT_t - \bar{MAT})^2}} = \sqrt{\frac{9{,}29}{309{,}123}} = \sqrt{0{,}030} = 0{,}173$$
Statistique $t$ pour $\beta$ :
$$t_\beta = \frac{0{,}0677}{0{,}173} = 0{,391}$$
Valeur critique $t_{0,05,6} = 1{,}943$ (bilatéral 10% → 5% unilatéral)
Comme $0{,}391 < 1{,}943$, $\beta$ n'est pas significatif au seuil 10%.
Erreur standard de $\alpha$ :
$$SE(\alpha) = \sqrt{s^2 \left(\frac{1}{n} + \frac{\bar{MAT}^2}{\sum (MAT_t - \bar{MAT})^2}\right)} = \sqrt{9{,}29 \left(\frac{1}{8} + \frac{(0{,}984)^2}{309{,}123}\right)}$$
$$= \sqrt{9{,}29 \times (0{,}125 + 0{,}0031)} = \sqrt{9{,}29 \times 0{,}128} = \sqrt{1{,}19} = 1{,}09$$
Statistique $t$ pour $\alpha$ :
$$t_\alpha = \frac{0{,}2646}{1{,}09} = 0{,243}$$
Comme $0{,}243 < 1{,}943$, $\alpha$ n'est pas significatif au seuil 10%.
7. **Pouvoir explicatif du modèle (coefficient de détermination $R^2$) :**
$$R^2 = 1 - \frac{SCR}{SCT}$$
Où $SCT = \sum (RDT_t - \bar{RDT})^2 = \sum RDT_t^2 - n \bar{RDT}^2 = 58{,}04 - 8 \times (0{,}33125)^2 = 58{,}04 - 8 \times 0{,}1097 = 58{,}04 - 0{,}877 = 57{,}163$$
Donc :
$$R^2 = 1 - \frac{55{,}745}{57{,}163} = 1 - 0{,}975 = 0{,}025$$
Le modèle explique environ 2,5% de la variance des rendements.
8. **Coefficient de détermination corrigé $R^2_{adj}$ :**
$$R^2_{adj} = 1 - \frac{SCR/(n-2)}{SCT/(n-1)} = 1 - \frac{55{,}745/6}{57{,}163/7} = 1 - \frac{9{,}29}{8{,}166} = 1 - 1{,}137 = -0{,}137$$
$R^2_{adj}$ corrige $R^2$ en pénalisant le nombre de variables. Ici, il est négatif, indiquant un très mauvais ajustement.
9. **Test de significativité globale du modèle au seuil 1% :**
Statistique $F$ :
$$F = \frac{(SCT - SCR)/1}{SCR/(n-2)} = \frac{(57{,}163 - 55{,}745)/1}{55{,}745/6} = \frac{1{,}418}{9{,}29} = 0{,}153$$
Valeur critique $F_{1,6}^{0,01} = 13{,}74$
Comme $0{,}153 < 13{,}74$, le modèle n'est pas globalement significatif au seuil 1%.
10. **Tableau d'analyse de la variance (ANOVA) :**
| Source | Somme des carrés | ddl | Carré moyen | F |
|--------------|------------------|-----|-------------|---------|
| Régression | 1,418 | 1 | 1,418 | 0,153 |
| Résidus | 55,745 | 6 | 9,29 | |
| Total | 57,163 | 7 | | |
**Interprétation :** Le modèle n'explique pas bien la variation des rendements, les coefficients ne sont pas significatifs, et le pouvoir explicatif est très faible.