Dernière mise à jour: décembre 2021
Population geneticsMedical Data Science
Chasse aux variants - Histoire
Alpha, Beta, Gamma, Delta, Omicron... quézako ?
Découvrez SARS-CoV-2, ses variants et leurs impacts sur la pandémie
Contexte
Vous connaissez l’histoire : un nouveau coronavirus a commencé à infecter l’homme fin 2019. Il est appelé SARS-CoV-2 (Severe Acute Respiratory Syndrome-related Coronavirus 2) et est responsable de la maladie COVID-19 (Coronavirus disease-2019).
C’est le début d’une incroyable course contre la montre pour apprendre à connaître ce nouveau virus et suivre son évolution dans le but de maîtriser la pandémie, trouver des traitements et des vaccins.
C’est quoi un virus ?
Un virus est un tout petit parasite qui pourrait être comparé à un sac contenant du matériel génétique. Pour se multiplier, un virus doit infecter les cellules d’un organisme vivant (animal, plante ou bactérie).
La vie sur Terre ne serait pas possible sans les virus !
Il y a plus de virus que d’étoiles dans l’univers ! Chaque jour des milliards de virus sont déposés sur une surface d’un mètre carré. Les virus jouent un rôle clé dans l’équilibre des populations et l’évolution des espèces.
Podcast: les virus sont-ils utiles ?
Source: Deposition rates of viruses and bacteria above the atmospheric boundary layer (2018); There are more viruses than stars in the universe. Why do only some infect us? (2020)
Des virus qui rendent malades
Mais voilà, environ 200 types de virus sont la cause de maladie chez l'homme.
Source: ViralZone - Human viruses and associated pathologies
C'est le cas du coronavirus SARS-CoV-2, responsable de la COVID-19 !
SARS-CoV-2...
SARS-CoV-2 infecte les cellules humaines et en particulier les cellules de notre nez et de nos poumons.
La protéine spike, présente à sa surface, peut être comparée à une clé qui permet au virus de pénétrer dans les cellules humaines.
Une fois à l'intérieur de la cellule, des centaines de copies du virus sont produites grâce aux informations présentes dans le matériel génétique.
Chaque cellule infectée pourrait libérer ensuite quelques dizaines de milliers de nouveaux virus, dont certains sont prêts à infecter d'autres cellules ! Les cellules infectées sont détruites, ce qui peut conduire parfois à de graves problèmes respiratoires.
Source: The total number and mass of SARS-CoV-2 virions in an infected person
...son matériel génétique
Le matériel génétique du virus est un ARN simple brin : il peut être comparé à un petit fil composé d’une longue chaîne de nucléotides. Il existe 4 nucléotides différents dans l'ARN, symbolisés par les lettres A, U, C et G. Note : les ARNs sont toujours représentés sous forme d'ADN dans les banques de données : les U sont donc remplacés par des T.
Le 10 janvier 2020, des chercheurs chinois ont publié la première séquence du génome de SARS-CoV-2: elle est composée de 29'903 nucléotides.
Source: A new coronavirus associated with human respiratory disease in China (2020)
...ses mutations
Le matériel génétique du virus est copié de nombreuses fois au sein de la cellule infectée afin de pouvoir produire des milliers de nouveaux virus.
Ces copies ne sont pas parfaites : il peut y avoir jusqu’à 20 ‘fautes de frappe’ par génome par année. Ces ‘fautes de frappe’ sont aléatoires : elles sont appelées ‘mutations’. A noter que 20 'fautes de frappe' sur quelque 30'000 nucléotides, est un taux d'erreur bas comparé à d'autres virus !
...et ses variants
Les virus portant certaines mutations disparaissent au cours du temps, d’autres restent, parce qu’ils sont mieux adaptés à leur environnement. C’est le principe même de l’évolution !
Certains virus possèdent alors une combinaison de mutations spécifique qui persistent dans le temps : ce sont des virus ‘variants’.
Il existe aujourd’hui une vingtaine de virus variants : les plus célèbres sont les variants Alpha (détecté pour la première fois en Angleterre), Beta (détecté pour la première fois en Afrique du Sud), Gamma (détecté pour la première fois au Brésil), Delta (détecté pour la première fois en Inde), Mu (détecté pour la première fois en Colombie) et le dernier, le variant Omicron, détecté pour la première fois en Afrique australe. Il y a même eu des variants détectés pour la première fois en Suisse !
Variants, mutations, quelques explications !
Il est important de bien comprendre ce qu’on entend par ‘variants’ dans le cadre de l’évolution de SARS-CoV-2.
Chaque virus est légèrement différent, puisque chaque virus contient une combinaison de mutations différentes. Et la plupart de ces mutations n’ont pas d’influence sur la pathologie du virus.
Le fait d’avoir regroupé les différents virus en une vingtaine de variants est un peu arbitraire. Les variants Alpha, Beta, Gamma, etc, c’est un peu comme si on parlait des différentes races de chien. En 2017, sur la base d’analyses génétiques, 161 races de chiens ont été regroupées en 23 groupes ou clades (groupes d’animaux partageant un même ancêtre commun). Les virus appartenant à un même variant ont certaines mutations en commun (mais pas toutes !) et ont une pathogénicité similaire.
Identifier les variants en circulation est essentiel pour gérer la pandémie : certaines mutations sont clairement plus dangereuses que d'autres !
Pourquoi certaines mutations sont plus dangereuses que d'autres ?
Le matériel génétique contient les recettes pour fabriquer les protéines qui sont essentielles à la ‘vie’ du virus.
Si une recette est modifiée, à cause des mutations, la protéine correspondante pourrait elle aussi être modifiée.
Or, certaines mutations modifient la protéine spike, une protéine qui joue un rôle clé dans la pandémie !
La protéine spike
La protéine spike est présente à la surface de SARS-CoV-2. C'est elle qui permet au virus de pénétrer dans les cellules en interagissant avec une protéine humaine appelée ACE2.
C'est également elle qui est reconnue par les anticorps que nous produisons en particulier grâce aux vaccins. Ces anticorps sont essentiels pour lutter contre le virus !
Si des mutations modifient la protéine spike, cela pourrait avoir des conséquences à la fois sur la transmissibilité du virus et/ou sur l’efficacité des vaccins !
Spike sous la loupe
La protéine spike, comme toutes les protéines, est constituée d’une chaîne d’acides aminés. Il existe 20 acides aminés différents, symbolisés par des lettres (G, E, N, I, A, L, …).
La cellule utilise l'information contenue dans le matériel génétique pour fabriquer une protéine.
3 lettres ‘nucléotide’, correspondent à une lettre ‘acide aminé’ : exemple AAT -> N.
Voici une toute petite partie de la séquence en acides aminés de la protéine spike : 1’273 acides aminés au total dans la banque de données UniProtKB !
Une mutation célèbre...
La mutation A -> T, localisée en position 23'063 dans le génome de SARS-CoV-2, est une des mutations qui a été repérée pour la première fois dans un génome séquencé en Angleterre en décembre 2020.
Cette mutation a été retrouvée par la suite dans des milliers de génomes séquencés dans les 4 coins du monde, et en particulier dans le génome des variants Alpha, Beta, Gamma et Omicron !
...N501Y
Cette mutation (AAT -> TAT) conduit à un changement d’acide aminé N -> Y en position 501 dans la séquence en acides aminés de la protéine spike : cette mutation est appelée N501Y.
Cette mutation pourrait avoir un impact sur la capacité de SARS-CoV-2 à infecter les cellules humaines, car elle est située dans la région de la protéine spike qui interagit avec les cellules humaines.
Heureusement, pas toutes les mutations sont un impact sur la séquence des protéines !
Alpha, Beta, Gamma, Delta, Omicron,...
Plus le virus se réplique sans contrôle, plus il a de chances d'accumuler des mutations bénéfiques rares.
Les virus 'variants' qui persistent dans le temps ont une combinaison de quelques dizaines de mutations dans leur génome, par rapport au génome séquencé en Chine en janvier 2020 (génome de référence).
Chaque virus variant possère ainsi une dizaine de mutations dans la protéine spike (une dizaine de changements sur 1'273 acides aminés). Le variant Omicron, lui, en possède une trentaine (Source) !
Ces combinaisons de mutations permettent d'identifier chaque virus variant, un peu comme un code-barre.
La mutation N501Y est retrouvée dans les variants Alpha, Beta, Gamma et Omicron. Elle n’est pas retrouvée dans le variant Delta.
Chaque combinaison de mutations confère des propriétés différentes au virus, en fonction des acides aminés qui sont modifiés et de leur localisation dans la protéine spike. C'est la raison pour laquelle les scientifiques travaillent sans relâche pour comprendre les impacts de ces combinaisons de mutations sur la transmissibilité du virus et la réponse aux vaccins !
Et l'évolution dans tout ça ?
Séquencer le matériel génétique et trouver les mutations permet aussi de reconstruire l’histoire de la transmission du virus et donc de suivre son évolution.
Petit casse-tête
Voici une représentation très schématisée de 6 génomes (lignes noires) chacun avec une combinaison différentes de mutations (rectangles de différentes couleurs).
Le génome du variant F est le génome 'original'.
L'apparition des différentes mutations peut être représentée par un arbre. La mutation rouge, présente dans de nombreux génomes est sans doute apparue en premier...
...puis la mutation jaune
...puis les mutations rose, orange et verte
Une des hypothèses qui pourrait être faite sur la base de cet arbre est que le variant E était présent avant les autres. En se propageant dans une population, le virus a ensuite acquis de nouvelles mutations et de nouveaux variants avec des combinaisons spécifiques de mutations ont commené à circuler (le variant C est apparu, puis les variants A, B et D).
En comparant ainsi les génomes il est possible de reconstruire une histoire approximative de la transmission du virus et de l’évolution.
Approximative, parce que nous n’avons pas accès à tous les génomes de tous les coronavirus SARS-CoV-2 qui ont circulé dans le monde, même si les experts en 2021 comparent plusieurs milliers de séquences par jour !
Voici l'évolution de SARS-CoV-2 vue, jour après jour, par les experts de NextStrain.org, une ressource du SIB Institut Suisse de Bioinformatique. En rouge, la branche du variant Omicron apparu début novembre 2021.Coronavirus et eaux usées...
Une surveillance génomique est indispensable pour pouvoir détecter la présence des différents virus variants dans l’environnement, pour pouvoir suivre leur circulation et estimer leur abondance.
Des chercheurs ont analysé des échantillons d'eaux usées collectées dans plusieurs stations d’épuration en Suisse, entre le 9 juillet et le 21 décembre 2020. L’ADN (et l’ARN) est extrait de ces échantillons, séquencé, puis analysé : une vraie chasse aux variants !
Ils ont ainsi retrouvé plusieurs mutations présentes dans le variant Alpha dans quatre échantillons provenant de Lausanne et un échantillon provenant d'une station de ski suisse.
Ces résultats suggèrent que le variant Alpha pourrait avoir circulé en Suisse mi-décembre 2020 déjà, soit deux semaines avant l’annonce officielle du premier patient infecté par le variant Alpha en Suisse.