A.6 Théorème de Frisch-Waugh-Lovell
À retenir
Si \(Y\), \(X_1\) et \(X_2\) sont trois variables aléatoires, alors pour ce qui est du coefficient sur \(X_1\), il revient au même de régresser \(Y\) sur \(X_1\) et \(X_2\) simultanément, ou bien de régresser d’abord \(Y\) sur \(X_2\), puis \(X_1\) sur \(X_2\), et enfin le résidu de la première régression sur le résidu de la seconde.
En d’autres termes, en imposant les contraintes usuelles sur les résidus, si : \[\left\{\begin{array}{c} Y=\alpha_1 + \beta_{11} X_1 + \beta_{12} X_2 + \epsilon_1 \\ Y=\alpha_{2} + \beta_{22} X_2 + \epsilon_2 \\ X_1 = \alpha_3 + \beta_{32} X_2 +\epsilon_3 \\ \epsilon_2 = \alpha_4 + \beta_{43} \epsilon_3 + \epsilon_4 \end{array}\right.\] alors \(\beta_{11} = \beta_{43}\).
En effet, en substituant \(\epsilon_2\) par \(Y-\alpha_2 -\beta_ {22}X_2\) et \(\epsilon_3\) par \(X_1-\alpha_3 - \beta_{32}X_2\) dans la dernière égalité, on a : \(Y = (\alpha_2 + \alpha_4 - \beta_{43}\alpha_3) + \beta_{43}X_1 + (\beta_{22}-\beta_{43}\beta_{32})X_2 + \epsilon_4\). Par ailleurs, on sait que \(\mathbb{E}[\epsilon_4]=0\), et en utilisant la bilinéarité de la covariance et la définition de \(\epsilon_2\) et \(\epsilon_3\) : \[\begin{eqnarray} \mathcal{C}(\epsilon_4, X_2) &=& \mathcal{C}(\epsilon_2, X_2) - \beta_43\mathcal{C}(\epsilon_3, X_2) \nonumber \\ &=& 0 \nonumber \end{eqnarray}\] Ensuite, en utilisant de nouveau la bilinéarité de la covariance ; \(\mathcal{C}(\epsilon_4, X_1) = \beta_{32} \mathcal{C}(\epsilon_4, X_2) + \mathcal{C}(\epsilon_3, \epsilon_4)\). Le calcul précédent montre que le premier terme est nul, et le second est également nul par définition de \(\epsilon_4\). Enfin, on sait que la décomposition de \(Y\) en une fonction affine de \(X_1\) et \(X_2\) et d’une variable aléatoire de moyenne nulle et non-corrélée à \(X_1\) et \(X_2\) est unique : on peut donc identifier les coefficients deux à deux. En d’autres termes, on a bien \(\beta_{43}=\beta_{11}\).