Our ambition is to present a gentle introduction to the field of targeted learning. As an example, we consider statistical inference on a simple causal quantity that is ubiquitous in the causal literature. We use this exemplar parameter to introduce key concepts that can be applied to more complicated problems. The introduction weaves together two main threads, one theoretical and the other computational. It also contains exercises. The code is written in the programming language R, which is widely used among statisticians and data scientists to develop statistical software and data analysis. It uses tlrider, a package that we built specifically for this project.
Notre ambition est de présenter une introduction accessible au domaine de l’apprentissage ciblé. À titre d’exemple, nous considérons l’inférence statistique d’une quantité causale simple souvent rencontrée dans la littérature causale. Nous utilisons ce paramètre exemplaire pour introduire des concepts-clefs qui jouent un rôle important dans des problèmes plus difficiles. L’introduction entrelace deux fils narratifs, l’un théorique et l’autre computationnel. Elle contient aussi des exercices. Le code est écrit dans le langage R, qui est largement utilisé par les statisticiens et data scientists pour développer des programmes statistiques et des analyses de données. Il s’appuie sur le paquetage tlrider, composé spécifiquement pour ce projet.
Keywords: causality, targeted learning
Mot clés : apprentissage ciblé, causalité
@article{JSFS_2020__161_1_201_0, author = {Benkeser, David and Chambaz, Antoine}, title = {A {Ride} in {Targeted} {Learning} {Territory}}, journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique}, pages = {201--286}, publisher = {Soci\'et\'e fran\c{c}aise de statistique}, volume = {161}, number = {1}, year = {2020}, mrnumber = {4125255}, zbl = {1443.62072}, language = {en}, url = {http://www.numdam.org/item/JSFS_2020__161_1_201_0/} }
TY - JOUR AU - Benkeser, David AU - Chambaz, Antoine TI - A Ride in Targeted Learning Territory JO - Journal de la société française de statistique PY - 2020 SP - 201 EP - 286 VL - 161 IS - 1 PB - Société française de statistique UR - http://www.numdam.org/item/JSFS_2020__161_1_201_0/ LA - en ID - JSFS_2020__161_1_201_0 ER -
%0 Journal Article %A Benkeser, David %A Chambaz, Antoine %T A Ride in Targeted Learning Territory %J Journal de la société française de statistique %D 2020 %P 201-286 %V 161 %N 1 %I Société française de statistique %U http://www.numdam.org/item/JSFS_2020__161_1_201_0/ %G en %F JSFS_2020__161_1_201_0
Benkeser, David; Chambaz, Antoine. A Ride in Targeted Learning Territory. Journal de la société française de statistique, Volume 161 (2020) no. 1, pp. 201-286. http://www.numdam.org/item/JSFS_2020__161_1_201_0/
[1] ggdag: Analyze and Create Elegant Directed Acyclic Graphs (2018) https://CRAN.R-project.org/package=ggdag (R package version 0.1.0)
[2] Une brève introduction à l’apprentissage ciblé, Causalité et statistique, Éditions Technip (2020), pp. 69-119 (Edited by F. Bertrand, G. Saporta, and C. Thomas-Agnan)
[3] caret: Classification and Regression Training (2020) https://CRAN.R-project.org/package=caret (R package version 6.0-85)
[4] Théorie asymptotique de la décision statistique, Séminaire de Mathématiques Supérieures, No. 33 (Été, 1968), Les Presses de l’Université de Montréal, Montreal, Que., 1969 | MR
[5] Contributions to a general asymptotic statistical theory, Lecture Notes in Statistics, 13, Springer-Verlag, New York-Berlin, 1982 | DOI | MR
[6] Super learner, Stat. Appl. Genet. Mol. Biol., Volume 6 (2007), p. Art. 25, 23 | DOI | MR | Zbl
[7] Targeted maximum likelihood learning, Int. J. Biostat., Volume 2 (2006), p. Art. 11, 40 | DOI | MR
[8] Targeted learning, Springer Series in Statistics, Springer, New York, 2011, lxxi+626 pages (Causal inference for observational and experimental data) | DOI | MR
[9] Targeted learning in data science, Springer Series in Statistics, Springer, Cham, 2018, xlii+640 pages (Causal inference for complex longitudinal studies) | DOI | MR | Zbl
[10] Asymptotic statistics, Cambridge Series in Statistical and Probabilistic Mathematics, 3, Cambridge University Press, Cambridge, 1998 | MR
[11] R for data science: import, tidy, transform, visualize, and model data, O’Reilly Media, Inc., 2016