Les SNPs sont des variations bi-alléliques d'un seul nucléotide dans la séquence d'ADN pour lesquels les différents allèles existent dans la population générale à une fréquence supérieure à 0.01. Ils constituent la majorité du polymorphisme génique (90% du polymorphisme du génome humain) [Brookes, 1999]. Plus récemment, la majorité du polymorphisme a été montrée être génomique ("Copy Number Variant" ou CNV). En plus des variations bi-alléliques dues à des substitutions, le terme est également employé pour des insertions et des délétions d'une seule base. Les fréquences des différentes combinaisons de SNPs possibles dans le génome ne sont pas les mêmes. En effet, les SNPs impliquant une transition de C en T sont les plus fréquents, constituant les 2/3 des SNPs [Brookes, 1999]. Comparés aux marqueurs microsatellites, les SNPs présentent l'avantage d'une répartition plus homogène dans tout le génome et d'être excessivement nombreux. Plusieurs consortia ont été mis en place depuis 1999 tels que le SNP Consortium (TSC), le "International Human Genome Project Consortium" (HGP) et plus récemment le "International HapMap Consortium" pour identifier l'ensemble des SNPs existant dans le génome et ainsi, créer des cartes génétiques de haute densité, facilement accessibles via des bases de données publiques telles que le NCBI ("National Center for Biological Information") ou HapMap [Consortium, 2003]. On dénombre approximativement 3 millions de SNPs communs (fréquence de l'allèle mineure>20%), c'est-à-dire en moyenne un tous les 1 kb au sein du génome (Tableau 1.3Fréquence des SNPs présents dans la population humaine, [Kruglyak and Nickerson, 2001]). Au total, on estime à 10 millions le nombre de SNPs chez l'Homme. Néanmoins, des différences "région-spécifique" sur la répartition de ces SNPs au sein du génome existent. Ils sont plus fréquents dans les régions non codantes (les régions 5', 3' UTR et les introns) que dans les régions codantes. Sans compter les différences entre les régions codantes de gènes, les SNPs dit "synonymes", qui n'entraînent pas un changement d'acides aminés, sont plus communs que les SNPs "non synonymes" (faux-sens) (Tableau 1.4Nombre de SNPs présents à l'intérieur ou proches des régions codantes, [Cargill et al., 1999]). Dans près de 50% des cas, la fréquence de l'allèle minoritaire dépasse 5%, indiquant que ces allèles n'exercent pas d'effet délétère fortement contre-sélectionné.
Le faible taux de mutations par génération (10) des SNPs, les rendant ainsi stables, ainsi que leur abondance à travers le génome humain permet leur utilisation dans différentes applications comme l'étude du déséquilibre de liaison ou celle d'haplotype au sein de régions (projet HapMap, décrit ultérieurement) ou l'étude de la diversité génétique des populations humaines ou des espèces, permettant ainsi de suivre l'évolution des espèces. Cependant, étant donné que la plupart de ces marqueurs (> 80%) sont communs à toutes les populations humaines mais avec des fréquences alléliques différentes, ces marqueurs ont été particulièrement intéressants pour l'identification des facteurs génétiques des maladies complexes par analyse d'association. Ils sont utilisés lors d'étude de gènes ou de régions candidats et/ou du génome entier, surtout depuis la connaissance de la séquence complète du génome humain et de l'existence de nombreuses méthodes de génotypage à haut débit et à moindre coût telles que le "TaqMan" ou les "puces à ADN" (Affymetrix ou Illumina).
-