A.13 Identification sous l’hypothèse d’indépendance conditionnelle
À retenir
Sous les hypothèses d’indépendance conditionnelle et de support commun, il est possible d’identifier l’effet causal moyen de l’intervention sur toute la population. Cet effet causal moyen est égal à la moyenne des contrastes mesurés dans chacune des strates définies par les valeurs prises par les caractéristiques observables, avec des poids proportionnels à la taille de ces strates dans la population.
L’hypothèse d’indépendance conditionnelle assure que lorsque l’on se place à l’intérieure d’une strate définie par la valeur \(x\) prise par les caractéristiques observables, le contraste de la variable d’intérêt entre les individus selon qu’ils ont fait ou non l’objet de l’intervention est égale à un effet causal moyen spécifique à cette strate. En effet : \[\begin{align} &\mathbb{E}[Y_i \mid D_i=1, X_i=x]-{E}[Y_i \mid D_i=0, X_i=x] \nonumber \\ =& \mathbb{E}[Y_i(1) \mid D_i=1, X_i=x]-{E}[Y_i(0) \mid D_i=0, X_i=x] \nonumber \\ =& \mathbb{E}[Y_i(1) \mid X_i=x]-{E}[Y_i(0) \mid X_i=x] \nonumber \\ =& \mathbb{E}[Y_i(1)-Y_i(0) \mid X_i=x] \nonumber \\ \end{align}\] où la première égalité provient de la définition des valeurs potentielles de la variable d’intérêt, la seconde repose sur l’hypothèse d’indépendance conditionnelle, et la troisième sur la linéarité de l’espérance.
Par ailleurs, on peut utiliser la loi des espérances itérées pour décomposer l’effet causal moyen entre les différentes strates : \[\begin{align} &\mathbb{E}[Y_i(1)-Y_i(0)] \nonumber \\ =& \sum_x \mathbb{E}[Y_i(1)-Y_i(0) \mid X=x] \mathbb{P}(X_i=x) \nonumber \\ \end{align}\]
En combinant les deux résultats précédents, il vient donc : \[\begin{align} &\mathbb{E}[Y_i(1)-Y_i(0)] \nonumber \\ =& \sum_x \left\{\mathbb{E}[Y_i \mid D_i=1, X_i=x]-{E}[Y_i \mid D_i=0, X_i=x]\right\} \mathbb{P}(X_i=x) \nonumber \\ \end{align}\] L’hypothèse de support commun permet d’affirmer que l’on n’est bien en mesure d’identifier tous les termes de cette somme, puisqu’elle dit essentiellement qu’aucun des sous-ensembles définis par l’intersection d’une strate de caractéristiques observables (\(X_i=x\)) et d’un statut vis-à-vis de l’intervention (\(D_i\)) n’est vide.
À retenir
Sous les hypothèses d’indépendance conditionnelle et de support commun, il est possible d’identifier l’effet causal moyen de l’intervention pour la sous-population des individus qui font l’objet de l’intervention, ou pour la sous-population des individus qui n’ont pas fait l’objet de l’intervention. Ces effets causaux moyens sont égaux à la moyenne des contrastes mesurés dans chacune des strates définies par les valeurs prises par les caractéristiques observables, avec des poids proportionnels à la taille de ces strates dans chacune de ces sous-populations.
La mécanique de la preuve est la même que l’on considère l’effet causal moyen sur la sous-population qui fait l’objet de l’intervention ou sur celle qui ne le fait pas. On se penche ici sur le premier cas, la lectrice ou le lecteur désireux d’approfondir pourra transposer sans difficulté la démonstration au cas de l’effet causal moyen sur la sous-population non-affectée par l’intervention.
On part de la loi des espérances itérées : \[\begin{align} &\mathbb{E}[Y_i(1)-Y_i(0) \mid D_i=1 ] \nonumber \\ =& \sum_x \mathbb{E}[Y_i(1)-Y_i(0) \mid X=x,\, D_i=1] \mathbb{P}(X_i=x \mid D_i=1) \nonumber \\ \end{align}\]
L’hypothèse d’indépendance conditionnelle assure que lorsque l’on se place dans une strate \(X_i=x\), les effets moyens sont indépendants du statut vis-à-vis de l’intervention, donc : \[ \mathbb{E}[Y_i(1)-Y_i(0) \mid X=x,\, D_i=1] =\mathbb{E}[Y_i(1)-Y_i(0) \mid X=x]\]
Il ne reste plus ensuite qu’à exploiter les résultats de la preuve précédente.