A Ride in Targeted Learning Territory
[Une virée en territoire d’apprentissage ciblé]
Journal de la société française de statistique, Tome 161 (2020) no. 1, pp. 201-286.

Notre ambition est de présenter une introduction accessible au domaine de l’apprentissage ciblé. À titre d’exemple, nous considérons l’inférence statistique d’une quantité causale simple souvent rencontrée dans la littérature causale. Nous utilisons ce paramètre exemplaire pour introduire des concepts-clefs qui jouent un rôle important dans des problèmes plus difficiles. L’introduction entrelace deux fils narratifs, l’un théorique et l’autre computationnel. Elle contient aussi des exercices. Le code est écrit dans le langage R, qui est largement utilisé par les statisticiens et data scientists pour développer des programmes statistiques et des analyses de données. Il s’appuie sur le paquetage tlrider, composé spécifiquement pour ce projet.

Our ambition is to present a gentle introduction to the field of targeted learning. As an example, we consider statistical inference on a simple causal quantity that is ubiquitous in the causal literature. We use this exemplar parameter to introduce key concepts that can be applied to more complicated problems. The introduction weaves together two main threads, one theoretical and the other computational. It also contains exercises. The code is written in the programming language R, which is widely used among statisticians and data scientists to develop statistical software and data analysis. It uses tlrider, a package that we built specifically for this project.

Classification : 62F12, 62F35, 62G08, 62G20
Keywords: causality, targeted learning
Mot clés : apprentissage ciblé, causalité
Benkeser, David 1 ; Chambaz, Antoine 2

1 Department of Biostatistics and Bioinformatics, Emory University, Rollins School of Public Health, 1518 Clifton Road, Atlanta, Georgia 30322.
2 MAP5 (UMR CNRS 8145), Université de Paris, 45 rue des Saints-Pères, 75270 Paris cedex 06.
@article{JSFS_2020__161_1_201_0,
     author = {Benkeser, David and Chambaz, Antoine},
     title = {A {Ride} in {Targeted} {Learning} {Territory}},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {201--286},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {161},
     number = {1},
     year = {2020},
     mrnumber = {4125255},
     zbl = {1443.62072},
     language = {en},
     url = {http://www.numdam.org/item/JSFS_2020__161_1_201_0/}
}
TY  - JOUR
AU  - Benkeser, David
AU  - Chambaz, Antoine
TI  - A Ride in Targeted Learning Territory
JO  - Journal de la société française de statistique
PY  - 2020
SP  - 201
EP  - 286
VL  - 161
IS  - 1
PB  - Société française de statistique
UR  - http://www.numdam.org/item/JSFS_2020__161_1_201_0/
LA  - en
ID  - JSFS_2020__161_1_201_0
ER  - 
%0 Journal Article
%A Benkeser, David
%A Chambaz, Antoine
%T A Ride in Targeted Learning Territory
%J Journal de la société française de statistique
%D 2020
%P 201-286
%V 161
%N 1
%I Société française de statistique
%U http://www.numdam.org/item/JSFS_2020__161_1_201_0/
%G en
%F JSFS_2020__161_1_201_0
Benkeser, David; Chambaz, Antoine. A Ride in Targeted Learning Territory. Journal de la société française de statistique, Tome 161 (2020) no. 1, pp. 201-286. http://www.numdam.org/item/JSFS_2020__161_1_201_0/

[1] Barrett, Malcolm ggdag: Analyze and Create Elegant Directed Acyclic Graphs (2018) https://CRAN.R-project.org/package=ggdag (R package version 0.1.0)

[2] Benkeser, D.; Chambaz, A. Une brève introduction à l’apprentissage ciblé, Causalité et statistique, Éditions Technip (2020), pp. 69-119 (Edited by F. Bertrand, G. Saporta, and C. Thomas-Agnan)

[3] Kuhn, Max caret: Classification and Regression Training (2020) https://CRAN.R-project.org/package=caret (R package version 6.0-85)

[4] Le Cam, Lucien M. Théorie asymptotique de la décision statistique, Séminaire de Mathématiques Supérieures, No. 33 (Été, 1968), Les Presses de l’Université de Montréal, Montreal, Que., 1969 | MR

[5] Pfanzagl, Johann Contributions to a general asymptotic statistical theory, Lecture Notes in Statistics, 13, Springer-Verlag, New York-Berlin, 1982 | DOI | MR

[6] van der Laan, Mark J.; Polley, Eric C.; Hubbard, Alan E. Super learner, Stat. Appl. Genet. Mol. Biol., Volume 6 (2007), p. Art. 25, 23 | DOI | MR | Zbl

[7] van der Laan, Mark J.; Rubin, Daniel Targeted maximum likelihood learning, Int. J. Biostat., Volume 2 (2006), p. Art. 11, 40 | DOI | MR

[8] van der Laan, Mark J.; Rose, Sherri Targeted learning, Springer Series in Statistics, Springer, New York, 2011, lxxi+626 pages (Causal inference for observational and experimental data) | DOI | MR

[9] van der Laan, Mark J.; Rose, Sherri Targeted learning in data science, Springer Series in Statistics, Springer, Cham, 2018, xlii+640 pages (Causal inference for complex longitudinal studies) | DOI | MR | Zbl

[10] van der Vaart, A. W. Asymptotic statistics, Cambridge Series in Statistical and Probabilistic Mathematics, 3, Cambridge University Press, Cambridge, 1998 | MR

[11] Wickham, Hadley; Grolemund, Garrett R for data science: import, tidy, transform, visualize, and model data, O’Reilly Media, Inc., 2016