Un peu d'évolution

Le contexte

10 à 100 millions d’espèces peuplent notre planète.

L’évolution est à l’origine de cette diversité: toutes les espèces sont apparentées à des degrés divers. Au sein de chaque espèce, les individus évoluent au fil des générations grâce à des changements qui surviennent de façon aléatoire dans leur ADN.

Ces changements (mutations) vont être sélectionnés, a posteriori, en fonction de l’environnement et de l’interaction des espèces et des individus entre eux. Et parfois, une nouvelle caractéristique voire une nouvelle espèce apparaît, mieux adaptée à son environnement.

Pour définir les liens de parenté, les biologistes recherchent ce que les espèces ont en commun mais aussi ce qui les distingue. Les liens de parenté entre les différentes espèces sont représentés le plus souvent sous forme d’un arbre, appelé ‘arbre phylogénétique’ ou ‘arbre de la vie’.

A l’époque de Darwin, on commença par comparer les espèces sur la base de leur morphologie – analyses de la taille, de la forme et de la structure des os, la présence de poils ou d’écailles ou, pour les plantes, la position des feuilles sur une tige, par exemple. Plus les caractéristiques morphologiques de 2 espèces sont similaires, plus leur ancêtre commun est récent.

Aujourd’hui, il est possible d’étudier l’évolution des espèces en comparant leur ADN et en particulier, leurs gènes ou leurs protéines. Plus l’ADN de 2 espèces est similaire, plus leur ancêtre commun est récent.

C’est quoi un arbre de la vie ? C’est quoi une mutation ? C’est quoi la sélection naturelle ? Comment construire un arbre de la vie avec des données moléculaires ? C’est quoi des ‘orthologues’ ?

L’arbre de la vie

« Toutes les espèces ont des ancêtres communs et évoluent grâce à la sélection naturelle ». C’est la théorie que proposa Charles Darwin en 1859 dans son livre « De l’origine des espèces ».
C’est également lui qui popularisera le concept d’arbre de la vie pour décrire les liens de parenté entre les espèces.

Charles Darwin III: Descent with modification

Voici un croquis d’un arbre de la vie proposé par Darwin en 1837 (First Notebook on Transmutation of Species).

Source: Wikimedia

L’évolution de l’arbre de la vie…

Les nouvelles technologies (séquençage de l’ADN), l’accès aux séquences (ADN & protéines) et l’avancement des techniques d’analyse bioinformatique & statistique ont bouleversé la classification des espèces.
On peut aujourd’hui estimer le degré de parenté entre les espèces et construire un arbre de la vie en comparant les séquences de leurs gènes et/ou de leurs protéines.

UN PEU DE BIOLOGIE > ADN, gène et protéine

Comment ça marche ?

Pour comprendre comment il est possible de construire un arbre de la vie en comparant des gènes ou des protéines, il faut se (re)plonger dans quelques notions de base de l’évolution.

Voici, par exemple, l’arbre de la vie tel que les scientifiques ont pu le concevoir en 2006 en comparant 31 protéines provenant de 191 espèces différentes.

Source: Toward Automatic Reconstruction of a Highly Resolved Tree of Life (2006)

Les bases moléculaires de l'évolution

Les bases moléculaires de l’évolution sont des changements qui surviennent de façon aléatoire dans l’ADN.

UN PEU DE BIOLOGIE > Cellule, chromosome, ADN, génome

Le plus souvent, ces changements ont lieu au moment de la division cellulaire, c’est-à-dire au moment où la cellule doit faire une copie de son ADN.

Qui dit copie, dit fautes de frappe ! Le système de réplication de l’ADN n’est pas parfait ! Ces fautes de frappe sont appelées mutations. Voici quelques exemples:

Mutations et sélection naturelle

Selon où ces mutations sont localisées dans le génome, elles peuvent affecter des mécanismes à la base de la biologie, de la physiologie et du développement des organismes... ou pas.

Pourquoi ?

– Certaines mutations n’ont pas d’impact parce qu’elles se trouvent en dehors des gènes ou en dehors des régions impliquées dans la régulation de l’expression des gènes (promoteurs).

– Les mutations présentes dans les introns ont généralement moins d’impact que celles présentes dans les exons.

– Certaines mutations n’ont pas d’impact sur la séquence de la protéine, car le code génétique est redondant : plusieurs codons codent pour un même acide aminé (GTT-> V, GTA -> V, GTC -> V, …).

– Certains changements d’acide aminé n’affectent pas la structure 3D et/ou le fonctionnement de la protéine.

Si une mutation conduit par exemple à un changement d’acide aminé qui modifie la fonction d’une protéine et que ce changement confère un avantage pour un individu dans un environnement particulier, l’individu en question va pouvoir survivre et/ou se reproduire plus rapidement : la mutation va alors se retrouver dans les générations suivantes.

Et parfois, une nouvelle caractéristique, voire une nouvelle espèce apparaît. Mais si l'environnement change à nouveau, cette nouvelle espèce pourrait ne pas survivre !

Notez que chez les organismes multicellulaires, seules les mutations présentes dans l’ADN des cellules impliquées dans la reproduction peuvent avoir un impact sur les générations suivantes (ovule, spermatozoïde, pollen, spore, ...). Les impacts ne sont souvent visibles qu'après plusieurs générations. Et comme le temps entre 2 générations est parfois très long (25 années pour l'homme ou la tortue, par exemple), il est difficile de 'voir' l'évolution !

Sélection naturelle: un exemple

Dans l’exemple suivant, chaque rond représente un individu. Tous ces individus appartiennent à une même espèce.

La mutation verte confère un avantage aux individus qui en sont porteur dans l’environnement dans lequel ils vivent. La mutation rouge est délétère : elle est peut-être la cause d’une maladie génétique grave.

Par conséquent, au cours des générations, le nombre d’individus avec la mutation verte va augmenter, jusqu’à ce que la mutation verte soit la plus fréquente au sein de la population dans l’environnement en question, alors que la mutation rouge va disparaître. Dans un autre environnement, c'est la mutation rouge qui aurait pu être sélectionnée !

Une histoire de mangeoires à oiseaux

La mangeoire à oiseaux

Source: Wikimedia

La longueur du bec des oiseaux est influencée par de nombreux gènes. Mais un gène en particulier a attiré l’attention des chercheurs en 2017: COLA45.

Dans les populations de mésanges charbonnières étudiées, ce gène possède deux allèles, T et C. L’allèle C est associé à un bec plus long et est plus fréquemment retrouvé dans la population de mésanges anglaises que dans les populations de mésanges hollandaises.

La sélection pour des becs plus longs pourrait être spécifique au Royaume-Uni : quelque chose dans l’environnement de ce pays a favorisé les mésanges charbonnières avec l’allèle C et un bec plus long.

Hypothèse: les longs becs pourraient conférer un avantage au Royaume-Uni, car ils permettraient aux oiseaux d’accéder plus facilement à la nourriture mise à disposition dans les mangeoires, mangeoires qui sont particulièrement fréquentes dans les jardins de ce pays.

Grâce à des balises placées sur les oiseaux, les chercheurs ont découvert que les mésanges avec l’allèle C utilisaient les mangeoires plus souvent que celles avec un allèle T.

Il s’agit d’un indice qui laisse penser que les chercheurs pourraient avoir fait la bonne hypothèse: la disponibilité de la nourriture dans les mangeoires pourrait constituer un avantage pour les oiseaux avec un bec plus long qui pourraient ainsi y accéder plus facilement.

L’évolution de la longueur des becs de ces oiseaux a été observée depuis 25 ans. Les analyses génétiques ont été faites sur plus de 2’300 oiseaux: quelques 490’000 mutations ont été étudiées. Mais ces données, pour être validées, nécessiteront encore d’autres études minutieuses sur la génétique de ces oiseaux et sur leur environnement.

Source:

Recent natural selection causes adaptive evolution of an avian polygenic trait
Understanding evolution (Berkeley): A New Story of Birds and Beaks

Construire un arbre de la vie avec des données moléculaires: notions importantes

1. Génome de référence

Chaque espèce est constituée d’une multitude d’individus. Chaque individu est unique, le génome de chaque individu au sein d’une même espèce est unique !

Afin de pouvoir comparer les espèces sur la base de leur génome, les biologistes travaillent avec un génome de référence qui a été choisi pour chaque espèce.
Pour chaque espèce dont le génome a été séquencé, il existe donc une séquence de génome de référence et un set de séquences de gènes et de protéines ‘de référence’.

Il est ainsi possible de comparer soit les séquences des génomes en entier (mais ce n’est pas simple et cela ne fait pas forcément toujours du sens), soit les séquences des gènes ou les séquences des protéines.

Et ce n’est pas tout ! Il faut comparer ce qui est comparable !

2. L’orthologie: une autre notion importante

“Orthology, the formalization of the intuitive notion of ‘corresponding genes in different species’, is a cornerstone of genomics“

Pour classer des espèces, il faut comparer les ‘mêmes’ caractères! Il est primordial de comparer la séquence d’un ‘même’ gène ou d’une ‘même’ protéine présente chez différentes espèces.

La quête de ces ‘orthologues’ (quest for orthologs) est une étape très importante pour étudier l’évolution au niveau moléculaire.

UN PEU DE BIOINFORMATIQUE > Comment trouver les orthologues ?

Orthologues (exemple 1): les séquences du gène insuline de l'homme, du chimpanzé, de la vache et d'un poisson

Voici la séquence ADN correspondant au gène de l’insuline dans le génome de référence de l’homme, du chimpanzé, de la vache et d’un poisson. En rouge: les exons.
Ces 4 gènes sont ‘orthologues’: ils codent pour une protéine similaire, qui a la même fonction biologique et un ancêtre commun.

^{L’insuline existe chez tous les vertébrés depuis les myxines (un taxon très ancien, dont les individus ont vécu probablement il y a quelques 100 millions d’années) jusqu’à l’homme (un taxon plus récent, qui est apparu il y a environ 7 millions années).}

Orthologues (exemple 2): les séquences de la protéine insuline de l'homme, du chimpanzé, de la vache et d'un poisson

Voici les séquences ‘de référence’ de la protéine insuline de l’homme, du chimpanzé de la vache et d’un poisson.

Amusez-vous à trouver les différences !

Construire un arbre de la vie avec des données moléculaires: le principe

Il est possible de construire un arbre de la vie en comparant les séquences en acides aminés de protéines ‘orthologues’.

La démarche, très simplifiée, peut être faite manuellement dans l’exemple ci-dessous.

Voici une partie de la séquence en acides aminés de l'insuline de l'homme, du chimpanzé, de la vache et d'un poisson.

Les séquences de l'homme et du chimpanzé sont les plus similaires (1 différence). La séquence du poisson est celle qui contient le plus de différences par rapport aux autres séquences.

Ces observations peuvent être représentées sous la forme d’un arbre.

A vous de jouer: qui est le cousin du concombre ?

Construisez des arbres à l’aide du programme Philophylo

Choississez une protéine
Philophylo recherche les séquences de cette protéine chez différentes espèces dans la banque de données UniProtKB/Swiss-Prot
Philophylo compare les séquences des protéines… dans le jargon bioinformatique, il construit un ‘alignement multiple’.
Des programmes bioinformatiques évaluent les différences ou similitudes observées dans l’alignement. Le résultat est ‘modélisé’ sous la forme d’un arbre. Les embranchements correspondent à des organismes ancestraux hypothétiques.
Remarque: Philophylo ne construit pas un vrai arbre phylogénétique (les calculs seraient beaucoup plus compliqués et trop longs !).

Qui est le ‘cousin’ du concombre ?
– Vous pouvez découvrir qui a un ancêtre commun avec le concombre en construisant un arbre phylogénétique avec les séquences du Récepteur à l’éthylène.

Qui est le ‘cousin’ du dodo ou du mammouth ?
– Vous pouvez découvrir qui a un ancêtre commun avec le dodo ou le mammouth en construisant un arbre phylogénétique avec les séquences du Cytochrome B.

Les experts comparent des dizaines de milliers de séquences, à l’aide de programmes bioinformatiques et statistiques complexes.

Pour construire ce 'nouvel' arbre de la vie en 2016, les chercheurs ont comparé 16 protéines différentes provenant de 3'830 espèces.

Source: A new view of the tree of life (2016)

L’hypothétique ancêtre commun à toutes les espèces (situé au centre de l'arbre) est appelé LUCA (Last Universal Common Ancestor).

Il aurait vécu il y a 3,5 à 4 milliards d’années et n’aurait été composé que d’une seule cellule.

Source: The physiology and habitat of the last universal common ancestor (2016) - Physiology, phylogeny, and LUCA (2016)

Ces arbres de la vie sont constamment remis à jour en fonction des nouvelles données disponibles !

Mais cette histoire de la vie restera toujours approximative, parce que nous n’avons pas et n’aurons jamais accès à toutes les séquences de tous les organismes qui vivent ou qui ont vécu sur Terre !

Les défis...

Les défis pour construire un arbre de la vie sont multiples:

(1) avoir accès aux génomes des différentes espèces (séquençage),

(2) avoir accès aux informations concernant la localisation des gènes & déterminer la séquences des protéines correspondantes (annotation)

(3) déterminer quel(s) gène(s) ou protéine(s) sont des ‘orthologues’ (‘quest for orthologs’).

Et c’est là que la bioinformatique entre en jeu !

Un peu de bioinformatique

Un peu d'évolution

Le contexte

C’est quoi un arbre de la vie ? C’est quoi une mutation ? C’est quoi la sélection naturelle ? Comment construire un arbre de la vie avec des données moléculaires ? C’est quoi des ‘orthologues’ ?

L’arbre de la vie

Source: Wikimedia

L’évolution de l’arbre de la vie…

Source: Toward Automatic Reconstruction of a Highly Resolved Tree of Life (2006)

Les bases moléculaires de l'évolution

Mutations et sélection naturelle

Pourquoi ?

Sélection naturelle: un exemple

Une histoire de mangeoires à oiseaux

La mangeoire à oiseaux

Source: Wikimedia

Source:

Recent natural selection causes adaptive evolution of an avian polygenic trait Understanding evolution (Berkeley): A New Story of Birds and Beaks

Construire un arbre de la vie avec des données moléculaires: notions importantes

1. Génome de référence

2. L’orthologie: une autre notion importante

Orthologues (exemple 1): les séquences du gène insuline de l'homme, du chimpanzé, de la vache et d'un poisson

Orthologues (exemple 2): les séquences de la protéine insuline de l'homme, du chimpanzé, de la vache et d'un poisson

Construire un arbre de la vie avec des données moléculaires: le principe

A vous de jouer: qui est le cousin du concombre ?

Source: A new view of the tree of life (2016)

Source: The physiology and habitat of the last universal common ancestor (2016) - Physiology, phylogeny, and LUCA (2016)

Les défis...

Recent natural selection causes adaptive evolution of an avian polygenic trait
Understanding evolution (Berkeley): A New Story of Birds and Beaks