A.14 Propriété équilibrante du score de propension

À retenir

Si les variables de conditionnement permettent de définir des strates au sein desquelles la situation empirique est assimilable à une expérience aléatoire contrôlée, ou à une expérience naturelle, alors le score de propension permet de définir des strates plus grandes au sein desquelles cette assimilation est toujours valable. Ainsi, à l’intérieur de ces grandes strates, les valeurs potentielles de la variable d’intérêt ne dépendent pas de l’assignation à l’intervention, de sorte que la comparaison des individus ayant fait l’objet de l’intervention avec ceux qui n’en ont pas fait l’objet permet d’identifier les effets causaux moyens de celle-ci. De plus, la distribution des caractéristiques observables définies par les variables de conditionnement est la même dans chacun de ces groupes lorsque l’on fait la comparaison à l’intérieur d’une grande strate définie par le score de propension.

Pour prouver ce résultat, on va établir deux faits :

  1. d’une part, à l’intérieur d’une strate définie par la valeur du score de propension, n’importe quelle fonction des covariables est en fait indépendante en moyenne de l’assignation de l’intervention ;
  2. d’autre part, à l’intérieur d’une strate définie par la valeur du score de propension, n’importe quelle fonction des valeurs potentielles de la variable d’intérêt est en fait indépendante en moyenne de l’assignation à l’intervention.

Ces deux faits étant établis, on aura justifié l’assimilation de la situation empirique à une expérience aléatoire contrôlée, ou à une expérience naturelle : à l’intérieur d’une strate définie par le score de propension, le groupe des individus ayant fait l’objet de l’intervention, et celui qui n’en a pas fait l’objet sont essentiellement identiques tant du point de vue de leurs caractéristiques observables que du point de vue des valeurs potentielles de la variable d’intérêt.

Pour prouver cela, on considère une valeur quelconque du score de propension \(p_0\) dans l’intervalle \(]0,1[\), en supposant qu’il existe au moins une valeur des variables de conditionnement pour laquelle le score de propension est égal à \(p_0\).

On commence par montrer qu’à l’intérieur d’une strate définie par le score de propension, la probabilité de faire l’objet de l’intervention est égale au score de propension. Cette probabilité s’écrit : \[\begin{align} &\mathbb{P}(D_i=1 \mid p(X_i)=p_0) \nonumber \\ =& \mathbb{E}[D_i \mid p(X_i)=p_0] \nonumber \\ =& \mathbb{E}[\mathbb{E}[D_i \mid X_i, p(X_i)=p_0] \mid p(X_i)=p_0] \nonumber \\ =& \mathbb{E}[\mathbb{E}[D_i \mid X_i] \mid p(X_i)=p_0] \nonumber \\ =& \mathbb{E}[\mathbb{P}(D_i=1 \mid X) \mid p(X_i)=p_0] \nonumber \\ =& \mathbb{E}[p(X_i) \mid p(X_i)=p_0] \nonumber \\ =& \mathbb{E}[p_0 \mid p(X_i)=p_0] \nonumber \\ =& p_0 \nonumber \\ \end{align}\] où la première égalité tient simplement à ce que \(D_i\) est une variable aléatoire dichotomique à valeur dans \(\{0,1\}\), la deuxième est une application de la loi des espérances itérées, la troisième vient de ce qu’une fois que l’on conditionne sur \(X_i\), conditionner de surcroît sur \(p(X_i)\) est redondant, la quatrième revient à l’écriture de l’espérance d’une variable dichotomique sous la forme d’une probabilité, la cinquième correspond à la définition du score de propension \(p(x)\), et les deux dernières utilisent les propriétés élémentaires de l’espérance conditionnelle.

Afin d’établir le premier point, on suppose que l’on dispose d’une fonction quelconque \(f\) des variables de conditionnement \(X\). On s’intéresse d’abord au groupe qui a fait l’objet de l’intervention. On propose ici une preuve simplifiée en supposant que les variables de conditionnement \(X_i\) sont prennent un nombre fini de valeurs. La moyenne de cette fonction des variables de conditionnement dans ce groupe, à l’intérieur de la strate définie par la valeur du score de propension \(p_0\) est égale à : \[\begin{align} & \mathbb{E}[f(X_i) \mid D_i=1, p(X_i)=p_0] \nonumber \\ =& \sum_{p(x)=p_0} f(x) \mathbb{P}(X_i=x \mid D_i=1, p(X_i)=p_0) \nonumber\\ =& \sum_{p(x)=p_0} f(x) \frac{\mathbb{P}(X_i=x \mid p(X_i)=p_0)}{\mathbb{P}(D_i=1 \mid p(X_i)=p_0)}\mathbb{P}(D_i=1 \mid X_i=x, p(X_i)=p_0) \nonumber\\ =& \sum_{p(x)=p_0} f(x) \frac{\mathbb{P}(X_i=x \mid p(X_i)=p_0)}{\mathbb{P}(D_i=1 \mid p(X_i)=p_0)}\mathbb{P}(D_i=1 \mid X_i=x) \nonumber\\ =& \sum_{p(x)=p_0} f(x) \frac{\mathbb{P}(X_i=x \mid p(X_i)=p_0)}{p_0}p(x) \nonumber\\ =& \sum_{p(x)=p_0} f(x) \mathbb{P}(X_i=x \mid p(X_i)=p_0) \nonumber\\ =& \mathbb{E}[f(X_i) \mid p(X_i)=p_0] \nonumber \\ \end{align}\] La première égalité correspond à la loi des espérances itérées : on fait porter la somme sur les seules valeurs de \(x\) des variables de conditionnement qui vérifient \(p(x)=p_0\), et dans ce cas l’espérance considérée est la moyenne des moyennes prises dans toutes les strates définies par les valeurs des variables de conditionnement de \(f(X_i)\), avec des poids égaux à la part de chacune de ces strates dans la grosse strate définie par la valeur du score de propension. La deuxième égalité est une application de la formule de Bayes, la troisième utilise le fait qu’une fois que l’on a conditionné par les variables de conditionnement, conditionner de surcroît par le score de propension est redondant. La quatrième égalité utilise la définition du score de propension, et le résultat précédent qui établit que la probabilité de faire l’objet de l’intervention dans la grande strate définie par le score de propension est égale au score de propension. La cinquième égalité exploite le fait que la somme ne porte toujours que sur les valeurs des variables de conditionnement qui renvoient la bonne valeur du score de propension, et la dernière utilise la loi des espérances itérées.

Ainsi, la moyenne de n’importe quelle fonction des variables de conditionnement, pour les individus ayant bénéficié de l’intervention, à l’intérieur d’une strate définie par le score de propension est égale à la moyenne de cette fonction prise dans cette strate toute entière. Il en découle qu’il en va de même pour le groupe des individus qui n’ont pas fait l’objet de l’intervention à l’intérieur de la même strate, ce qui justifie le premier résultat.

Pour établir le second point, on considère une fonction quelconque \(g\) des valeurs potentielles de la variable d’intérêt \((Y_i(0), Y_i(1))\), et l’on s’intéresse à sa moyenne dans le groupe des individus ayant fait l’objet de l’intervention, à l’intérieur d’une strate définie par la valeur \(p_0\) du score de propension. Cette moyenne est égale à : \[\begin{align} &\mathbb{E}[g(Y_i(0), Y_i(1)) \mid D_i=1, p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[\mathbb{E}[g(Y_i(0), Y_i(1)) \mid X_i=x, D_i=1, p(X_i)=p_0] \mid D_i=1, p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[\mathbb{E}[g(Y_i(0), Y_i(1)) \mid X_i=x, D_i=1] \mid D_i=1, p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[\mathbb{E}[g(Y_i(0), Y_i(1)) \mid X_i=x] \mid D_i=1, p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[\mathbb{E}[g(Y_i(0), Y_i(1)) \mid X_i=x] \mid p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[\mathbb{E}[g(Y_i(0), Y_i(1)) \mid X_i=x, p(X_i)=p_0] \mid p(X_i)=p_0] \nonumber \\ =&\mathbb{E}[g(Y_i(0), Y_i(1)) \mid p(X_i)=p_0] \nonumber \\ \end{align}\] La première égalité est une application de la loi des espérances itérées, la deuxième tient à ce qu’une fois que l’on conditionne par les variables de conditionnement, conditionner de surcroît par le score de propension n’apporte aucune information. La troisème correspond à l’hypothèse d’indépendance conditionnelle : à l’intérieur d’une strate définie par les valeurs des variables de conditionnement, la situation est assimilable à une expérience aléatoire contrôlée, donc la moyenne de n’importe quelle fonction des valeurs potentielles de la variable d’intérêt dans le groupe de ceux qui ont bénéficié de l’intervention est égale à cette moyenne prise dans la strate toute entière. Cette moyenne est une fonction qui ne dépend que des variables de conditionnement : on peut donc appliquer le premier point, qui implique que, dans une grosse strate définie par la valeur du score de propension, la moyenne de cette variable aléatoire, pour ceux qui ont fait l’objet de l’intervention, est égale à la moyenne prise dans cette grosse strate toute entière. On peut ensuite appliquer de nouveau la loi des espérances itérées dans l’autre sens et conclure.

Ainsi, la moyenne de n’importe quelle fonction des valeurs potentielles de la variable d’intérêt dans le groupe des individus ayant fait l’objet de l’intervention, à l’intérieur d’une strate définie par la valeur du score de propension, est égale à la moyenne de cette fonction prise dans cette strate toute entière. Cela implique qu’il en va de même pour le groupe des individus qui n’ont pas fait l’objet de l’intervention, ce qui justifie in fine le deuxième point.

En définitive, ces deux points permettent de justifier l’assimilation de la situation à une expérience aléatoire contrôlée ou à une expérience naturelle, au sein de grosses strates définies par les valeurs du score de propension.