A.12 Comportement asymptotique de l’estimateur des moindres carrés ordinaires en relâchant l’hypothèse d’indépendance

À retenir

Lorsque le nombre de clusters tend vers l’infini, la loi de l’estimateur des moindres carrés ordinaires s’identifie à une loi normale multidimensionnelle centrée (c’est-à-dire d’espérance nulle) et de matrice de variance-covariance (i) proportionnelle à l’inverse du nombre de clusters et (ii) à un terme qui ne dépend que de la distribution jointe des variables dépendantes et indépendantes et de la corrélation des ces variables entre observations appartenant au même cluster.

On en propose ici une preuve simplifiée dans le cas où tous les clusters font la même taille. On suppose donc que l’on peut découper l’échantillon sur lequel on travaille en \(n_C\) clusters que l’on pourrait noter \(C_1\), \(C_2\), \(\dots\), \(C_{n_C}\). Pour chaque cluster \(c\), on peut considérer la matrice \(\mathbf{X}_c\) qui reprend la même construction que la matrice \(X\) mais restreinte aux individus de ce cluster. En d’autres termes, la matrice \(\mathbf{X}_c\) empile les unes sur les autres les autres les lignes qui correspondent aux variables indépendantes pour les différents individus qui appartiennent au cluster \(c\). On peut également définir un vecteur \(\tilde{\epsilon_c}\) qui est égal à la somme sur tous les individus appartenant au cluster \(c\) du produit \(X_i \epsilon_i\) : \[\tilde{\epsilon_c}:=\sum_{\begin{array}{c}i=1 \\ i \in c\end{array}}^n X_i \epsilon_i\]

En revenant à la définition du produit matriciel, on peut voir que pour tout cluster \(c\) : \[\mathbf{X}_c'\mathbf{X}_c=\sum_{\begin{array}{c}i=1 \\ i \in c\end{array}}^n X_i X_i' \] Par conséquent, comme tous les clusters sont mutuellement exclusifs, \(\mathbf{X}'\mathbf{X}=\sum_{c=1}^{n_C} \mathbf{X}_c'\mathbf{X}_c\). Par conséquent, on a : \[ \sqrt{n_c}(\hat{\beta}-\beta)= \left(\frac{1}{n_C} \sum_{c=1}^{n_C} \mathbf{X}_c'\mathbf{X}_c \right)^{-1} \sqrt{n_C}\left(\frac{1}{n_C} \sum_{c=1}^{n_C} \tilde{\epsilon_c} \right) \] Comme on a supposé que les clusters étaient indépendants entre eux, le premier terme du produit s’identifie quand le nombre de clusters devient très grand avec l’inverse de l’espérance \(\mathbb{E}[\sum_{i \in c} X_iX_i']^{-1}\). Le second terme du produit s’identifie en vertu du théorème central limite appliqué au niveau des clusters indépendants à une loi normale centrée de matrice de variance-covariance \(\mathcal{V}(\tilde{\epsilon_c})\). En définitive, la loi de la variable aléatoire \(\sqrt{n_c}(\hat{\beta}-\beta)\) s’identifie quand le nombre de clusters tend vers l’infini avec la loi normale centrée de matrice de variance-covariance \(\mathbb{E}[\sum_{i \in c} X_iX_i']^{-1} \mathcal{V}(\tilde{\epsilon_c}) \mathbb{E}[\sum_{i \in c} X_iX_i']^{-1}\).