Statistique/Probabilités
Distribution exacte du score local, cas markovien
Comptes Rendus. Mathématique, Tome 336 (2003) no. 10, pp. 863-868.

Soit 𝕏=(X k ) k1 une suite de variables à valeurs dans {−v,…,0,…,+u}. On définit le score local d'une séquence par Hn=max1⩽ijn(∑k=ijXk). Le score local est utilisé notamment dans l'analyse des séquences biologiques afin de mettre en évidence des régions de séquences ayant des propriétés biologiques intéressantes. La signification statistique des scores locaux calculés permet alors de mettre en évidence ce qui est réellement intéressant et il est donc nécessaire de connaı̂tre la distribution du score local. Nous établissons ici la loi exacte du score local dans le cas où la suite des Xi est une chaı̂ne de Markov d'ordre 1.

Given a sequence 𝕏=(X k ) k1 of random variables taking values in {−v,…,0,…,+u}, let's define the local score of the sequence by Hn=max1⩽ijn(∑k=ijXk). The local score is used to analyze biological sequences pointing out regions of the sequences with interesting biological properties. In order to separate randomly events from really interesting segments, we establish here the distribution of the local score of Hn when the sequence 𝕏 is a Markov chain of order 1.

Reçu le :
Accepté le :
Publié le :
DOI : 10.1016/S1631-073X(03)00208-5
Mercier, Sabine 1 ; Hassenforder, Claudie 1

1 Université de Toulouse II, équipe GRIMM, dpt Math-Info, UFR SES, 31100 Toulouse cedex 9, France
@article{CRMATH_2003__336_10_863_0,
     author = {Mercier, Sabine and Hassenforder, Claudie},
     title = {Distribution exacte du score local, cas markovien},
     journal = {Comptes Rendus. Math\'ematique},
     pages = {863--868},
     publisher = {Elsevier},
     volume = {336},
     number = {10},
     year = {2003},
     doi = {10.1016/S1631-073X(03)00208-5},
     language = {fr},
     url = {http://www.numdam.org/articles/10.1016/S1631-073X(03)00208-5/}
}
TY  - JOUR
AU  - Mercier, Sabine
AU  - Hassenforder, Claudie
TI  - Distribution exacte du score local, cas markovien
JO  - Comptes Rendus. Mathématique
PY  - 2003
SP  - 863
EP  - 868
VL  - 336
IS  - 10
PB  - Elsevier
UR  - http://www.numdam.org/articles/10.1016/S1631-073X(03)00208-5/
DO  - 10.1016/S1631-073X(03)00208-5
LA  - fr
ID  - CRMATH_2003__336_10_863_0
ER  - 
%0 Journal Article
%A Mercier, Sabine
%A Hassenforder, Claudie
%T Distribution exacte du score local, cas markovien
%J Comptes Rendus. Mathématique
%D 2003
%P 863-868
%V 336
%N 10
%I Elsevier
%U http://www.numdam.org/articles/10.1016/S1631-073X(03)00208-5/
%R 10.1016/S1631-073X(03)00208-5
%G fr
%F CRMATH_2003__336_10_863_0
Mercier, Sabine; Hassenforder, Claudie. Distribution exacte du score local, cas markovien. Comptes Rendus. Mathématique, Tome 336 (2003) no. 10, pp. 863-868. doi : 10.1016/S1631-073X(03)00208-5. http://www.numdam.org/articles/10.1016/S1631-073X(03)00208-5/

[1] Daudin, J.-J.; Mercier, S. Distribution exacte du score local d'une suite de variables indépendantes et identiquement distribuées, C. R. Acad. Sci. Paris, Volume 329 (1999) no. 1, pp. 815-820

[2] Durbin, R.; Eddy, S.; Krogh, A.; Mitchison, G. Biological Sequence Analysis. Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK, 1998

[3] Karlin, S.; Altschul, S.F. Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes, Proc. Nat. Acad. Sci. USA, Volume 87 (1990), pp. 2264-2268

[4] Karlin, S.; Dembo, A. Limit distributions of maximal segmental score among Markov-dependent partial sums, Adv. Appl. Probab., Volume 24 (1992), pp. 113-140

[5] S. Mercier, Statistiques des scores pour l'analyse et la comparaison de séquences biologiques, Thèse de doctorat d'Université, Rouen, 1999

[6] Mercier, S.; Cellier, D.; Charlot, F.; Daudin, J.-J. Exact and asymptotic distribution for the local score of one i.i.d. random sequence, JOBIM 2000, Lecture Notes in Comput. Sci., 2066, 2001, pp. 74-85

[7] Mercier, S.; Daudin, J.-J. Exact distribution for the local score of one i.i.d. random sequence, J. Comp. Biol., Volume 8 (2001) no. 4, pp. 373-380

[8] Waterman, M.S. Introduction to Computational Biology, Chapman and Hall, London, 1995

Cité par Sources :