On numerical computation for the distribution of the convolution of N independent rectified Gaussian variables
[Éléments de calculs pour la distribution de N variables Gaussiennes rectifiées indépendantes]
Journal de la société française de statistique, Tome 159 (2018) no. 1, pp. 88-111.

For large N and when no variables is predominant over the others, the central limit theorem (CLT) shall apply to the sum of random variables with negative values reset to zero. The parameters of the normal distribution are simply obtained by computing the expected value and the variance of each left rectified distributions. But for small N , the distribution of the sum is clearly not Gaussian and can present several modes and a strong skewness. In this paper, a way of computing the probability density function of the sum of N independent rectified Gaussian variables is presented, so that the calculation issues raised by the convolution product is solved. Some numerical examples are given and the validity of this approach is assessed through a comparison with a Monte-Carlo approach and an application to the PAH’s (Polycyclic Aromatic Hydrocarbon) batch filters measurements is provided.

Pour N grand, le thèorème de la limite centrale s’applique si l’on cherche à sommer des variables aléatoires gaussiennes rectifiées, i.e. dont les valeurs négatives sont remises à zéro. Les paramètres de la gaussienne sont obtenus en sommant les espérances et les variances de chaque gaussienne censurée. Pour N petit, la distribution de la somme n’est évidemment pas gaussienne : elle peut présenter plusieurs modes et une forte asymétrie. Dans ce papier, le calcul de la densité de probabilité associée à la somme de variables aléatoires gaussiennes rectifiées indépendantes est présenté. Il est obtenu classiquement à partir d’un produit de convolution mais il présente des complications calculatoires qui sont détaillées et résolues. Une comparaison avec des simulations Monte-Carlo est fournie pour valider les développements. Enfin, une application à des données de mesures par filtres de HAP (Hydrocarbure Aromatique Polycyclique) est également présentée.

Mots clés : probability density function, rectified Gaussian variable, sum of independent variables
@article{JSFS_2018__159_1_88_0,
     author = {Beauchamp, Maxime},
     title = {On numerical computation for the distribution of the convolution of {N} independent rectified {Gaussian} variables},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {88--111},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {159},
     number = {1},
     year = {2018},
     zbl = {1410.60020},
     mrnumber = {3803125},
     language = {en},
     url = {http://www.numdam.org/item/JSFS_2018__159_1_88_0/}
}
TY  - JOUR
AU  - Beauchamp, Maxime
TI  - On numerical computation for the distribution of the convolution of N independent rectified Gaussian variables
JO  - Journal de la société française de statistique
PY  - 2018
DA  - 2018///
SP  - 88
EP  - 111
VL  - 159
IS  - 1
PB  - Société française de statistique
UR  - http://www.numdam.org/item/JSFS_2018__159_1_88_0/
UR  - https://zbmath.org/?q=an%3A1410.60020
UR  - https://www.ams.org/mathscinet-getitem?mr=3803125
LA  - en
ID  - JSFS_2018__159_1_88_0
ER  - 
Beauchamp, Maxime. On numerical computation for the distribution of the convolution of N independent rectified Gaussian variables. Journal de la société française de statistique, Tome 159 (2018) no. 1, pp. 88-111. http://www.numdam.org/item/JSFS_2018__159_1_88_0/

[1] Ashour, S.; Abdel-Hamid, M. Approximate skew normal distribution. Journal of Advanced Research, Journal of Advanced Research,, Volume 1 (2010), pp. 341-350

[2] Albinet, A. Rapport de recommandations pour le prélèvement et l’analyse des hydrocarbures aromatiques polycycliques (HAP) dans l’air ambiant (2011) (Technical report)

[3] Billingsley, P. Probability and Measure. 3rd Edition, Probability and Mathematical Statistics, Wiley, 1995 | MR 1324786

[4] Bliss, C. I. The Method of Probits, Science, Volume 79 (1934) no. 2037, pp. 38-39 | Article

[5] Directive 2008/50/EC of the European Parliament and of the Council of 21 May 2008 on ambient air quality and cleaner air for Europe (2008)

[6] Eddelbuettel, D. Seamless R and C++ Integration with Rcpp, Springer, New York, 2013 (ISBN 978-1-4614-6867-7) | Zbl 1283.62001

[7] Eddelbuettel, D.; François, R. Rcpp: Seamless R and C++ Integration, Journal of Statistical Software, Volume 40 (2011) no. 8, pp. 1-18 http://www.jstatsoft.org/v40/i08/

[8] Genz, A.; Bretz, F. Computation of Multivariate Normal and t Probabilities, Lecture Notes in Statistics, Springer-Verlag, Heidelberg, 2009 | MR 2840595 | Zbl 1204.62088

[9] Genz, A.; Bretz, F.; Miwa, T.; Mi, X.; Leisch, F.; Scheipl, F.; Hothorn, T. mvtnorm: Multivariate Normal and t Distributions (2017) https://CRAN.R-project.org/package=mvtnorm (R package version 1.0-6)

[10] Harva, M.; Kabán, A. Variational learning for rectified factor analysis, Signal Processing, Volume 87 (2007) no. 3, pp. 509 -527 | Article | Zbl 1186.94145

[11] Krenek, R.; Cha, J.; Cho, B. R. Development of the Convolutions of Truncated Normal Random Variables with Three Different Quality Characteristics in Engineering Applications, Comput. Ind. Eng., Volume 94 (2016) no. C, pp. 125-137 | Article

[12] Lambert, D. Zero-Inflated Poisson Regression, with an Application to Defects in Manufacturing, Technometrics, Volume 34 (1992) no. 1, pp. 1-14 http://www.jstor.org/stable/1269547 | Zbl 0850.62756

[13] McConalogue, D.J. Numerical treatment of convolution integrals involving distributions with densities having singularities at the origin., Commun. Statist. B Simulation Comput., Volume 10 (1981), pp. 265-280 | MR 617645 | Zbl 0465.65008

[14] Mudholkar, G. S.; Hutson, A. D. The epsilon-skew-normal distribution for analyzing near-normal data, Journal of Statistical Planning and Inference, Volume 83 (2000), pp. 291-309 | MR 1748020 | Zbl 0943.62012

[15] O’Hagan, A.; Leonard, T. Bayes estimation subject to uncertainty about parameter constraints, Biometrika, Volume 63 (1976), pp. 201-202 | MR 428571 | Zbl 0326.62025

[16] R Development Core Team R: A Language and Environment for Statistical Computing (2008) http://www.R-project.org (ISBN 3-900051-07-0)

[17] Tobin, J. Estimation of Relationships for Limited Dependent Variables, Econometrica, Volume 26 (1958) no. 1, pp. 24-36 http://www.jstor.org/stable/1907382 | MR 90462 | Zbl 0088.36607

[18] Directive 2004/107/EC of the European Parliament and of the Council of 15 December 2004 relating to arsenic, cadmium, mercury, nickel and polycyclic aromatic hydrocarbons in ambient air (2004)

[19] Exigences générales concernant la compétence des laboratoires d’étalonnages et d’essais (September 2005)

[20] Air ambiant -Mesurage pour la mesure de benz(a)anthracène, benzo(b)fluoranthène, benzo(j)fluoranthène, benzo(k)fluoranthène, dibenz(a,h)anthracène, indéno(1,2,3-cd)pyrène et benzo(ghi)perylène (May 2014)