Jump to content
Jesrad

Séquençage d'ADN, secrets de famille & cannelés au rhum

Recommended Posts

On m'a subtilement fait comprendre que ce sujet intéressait du monde ici :) Je vais vous présenter l'expérience que j'en ai eu, ce qui est possible actuellement, les limitations à prendre en compte, et quelques outils fort pratiques.

Il y a trois grands fournisseurs de séquençage "grand public" générique aujourd'hui, tous aux USA. Le plus connu, pionnier du domaine et racheté récemment par Google c'est 23andme ; on trouve aussi le projet Genographic initié par le groupe média National Geographic ; et enfin le dernier arrivé FamilyTreeDNA et son service Web grand public FamilyFinder ainsi que leur partenaire Ancestry.com.

(il y a aussi des fournisseurs de tests génétiques plus ciblés s'adressant aussi au grand public, comme Pathways Genetics mais ils ne font pas dans le séquençage "large")

Chacun a une orientation spécifique: 23andme vise le séquençage à fins médicales générales, FamilyFinder comme son nom l'indique pour retrouver ses origines immédiates (enfants illégitimes ou adoptés, réfugiés / déportés et migrants), et Genographic s'intéresserait plus aux origines ancestrales.

Cette distinction est importante: pour des raisons de coût et de rapidité chaque boîte a mis au point sa propre puce de séquençage (23andme) ou utilise un modèle "industriel" spécifique (les autres) et du coup ils ne testent pas les mêmes bases. Pour simplifier, ce qui est lu ce sont des emplacements spécifiques de certaines bases uniques dont on sait qu'elles varient entre les individus, contrairement aux 99,9% restant de l'ADN humain. Chacun de ces emplacements ou bases est un "SNP" ('snip') pour Single Nucleotide Polymorph(ism). Donc on n'obtient pas au final une longue liste de ATCG représentant son ADN du début à la fin, mais une litanie de lignes de type "emplacement génétique - numéro de chromosome - bases relevées sur chaque exemplaire":

...
rs3737717	1	1242084	AA
i6054370	1	1246013	GG
i6019334	1	1248166	CC
i6019335	1	1248974	TT
...
On connaît aujourd'hui environ un million de ces bases variantes, on estime qu'il y en aurait en tout dans les 2 millions et quelques, on devrait les connaître toutes d'ici 2050, mais en attendant chaque compagnie se concentre sur 500 à 600 000 SNPs parmi les mieux connus et variant moins rarement. La lecture n'est pas totalement garantie: comme les puces ne sont pas 100% parfaites, environ 0,1% des SNPs ne parviennent pas à être lus et portent un résultat vide, et entre une grosse dizaine à une petit centaine de SNPs par génome sont erronés. 23andme s'engage à rapporter au minimum 99,9% des SNPs qu'il analysent mais omettent de préciser ce dernier détail...

Je n'ai pas trop regardé mais il me semble que les prix sont comparables entre les trois. Les frais de port sont conséquents parce qu'un échantillon vivant d'ADN ça ne se conserve pas longtemps et que c'est expédié à l'international. D'ailleurs il y a quelques pays qui interdisent carrément ce genre d'envoi, comme la Russie ou le Vénézuéla. Mais on peut truander en se faiant expédier le kit dans un pays voisin grâce à un réexpéditeur commercial, et en mentant lors de l'envoi en retour de l'échantillon.

Dans mon cas j'ai fait appel à 23andme. Leurr kit arrive dans une grande pochette (dans mon cas DHL, pour la France et probablement le reste de l'Europe), avec une seconde pochette pour le retour, et perdu dedans: une petite boîte contenant le tube d'échantillonnage et les explications (en anglais uniquement). Il faut enregistrer un compte associé au numéro figurant sur le kit.

La plus grosse contrainte pour le test c'est l'envoi en retour, donc il faut soit habiter juste à côté d'un centre DHL Express (et pas un centre DHL ordinaire, attention !), soit organiser un enlèvement. Il faut n'avoir rien mangé depuis au moins 30 minutes avant de remplir le tube. Il y a la place pour au moins 3 ou 4 échantillons dans la pochette de retour (de mémoire elle est prépayée pour 500 grammes), donc on peut économiser pas mal en faisant plusieurs tests d'un coup.

Le kit met 48h à arriver au labo, ensuite il faut 3 à 6 semaines pour les résultats. Dès l'enregistrement du compte on peut participer aux études de recherche génétique en répondant à une demi-chiée de questionnaires de santé (il y a de tout: dépression, arthrite, Parkinson, cancer, droitier-ou-gaucher, bronzage, etc.). Comme la FDA (autorité sanitaire fédérale US) a brutalement interdit à 23andme de fournir des informations générales de santé à ses clients (alors qu'ils reçoivent des grants du NIH, paie ta cohérence étatique...), ils se sont précipitamment respécialisés en origine ancestrale et généalogique, donc il y a aussi des pages pour renseigner son arbre généalogique (soit manuellement soit par import d'un fichier GEDCOM, qu'on peut par exemple exporter à partir de geneanet) - le kit comprend d'ailleurs un abonnement limité à myheritage.com de 6 mois mais qui n'apporte franchement rien d'utile (quasiment toutes les fonctions restent payantes). Mieux vaut s'inscrire sur geneanet et transférer les données par fichier GEDCOM.

Ce qui est bien: 23andme a plus de 800 000 ADNs en banque, leur fonction de recherche de cousins distants est très efficace et précise (on peut exporter toutes les correspondances en CSV) donc il y a de quoi s'occuper.

Ce qui est moins bien: les fonctions "pays d'origine" et haplotypes (caractérisation patrilinéale et matrilinéale par le chromosome Y et l'ADN mitochondrial) sont inexactes voire carrément fausses. Les origines non-européennes sont largement sous-estimées, par exemple. Le typage du Y s'arrête à M418 pour la branche R1, et pour toutes les branches certaines variantes récemment identifiées (=depuis 2013, en gros) sont simplement manquantes (c'était le cas pour mon ADNmt ET pour mon ADN-Y).

Pour préciser sur l'origine ethnique: 23andme mesure la composition ethnique à partir d'échantillons en très petites quantitiés (1 seul échantillon pour certaines populations "de référence" ! Moins de 10 pour la majorité !) et surtout ils sont pris dans des populations modernes. C'est, disons, plutôt débile...

Heureusement il y a des outils disponibles sur l'Internet, qui sont utilisés en anthropologie génétique, que l'on peut utiliser pour améliorer largement ces résultats:

Interpretome - outil qui s'exécute localement (en javascript?), donc qui ne dévoile pas votre génome à un tiers. Il permet de faire de nombreuses analyses et confronter son ADN à des références mondiales, régionales et ancestrales (on a pas mal d'échantillons d'ADN humain d'il y a 3000, 6000, 15 000, 50 000 ans...)

GEDmatch - service gratuit d'analyse ancestrale mais donc assez "cheap" qui permet de faire les mêmes analyses, en plus de proposer de rechercher des similarités génétiques parmi les autres membres (j'ai pas encore pu tester ça, le traitement est très long faute de moyens)

Promethease - service payant (5$) pour sortir un compte-rendu complet d'informations de santé (comparable à ce que fournissait 23andme initialement), en utilisant les données de SNPedia qui rassemble les mutations connues de la littérature médicale. Du coup il y a baucoup de foutaise dans le rapport (les chercheurs adorent supposer des liens statistiques faibles entre gènes et phénotype voire entre gène et comportement... il faut bien gratter un financement, hein), mais les mutations les plus significatives sont spécialement soulignées.

  • Yea 2

Share this post


Link to post
Share on other sites

Promethease n'est pas soumis à la même réglementation que 23andme ? ou bien ils peuvent exercés car l'information délivrée est différente, ou vient de source différente.

Share this post


Link to post
Share on other sites

Je ne sais pas. Promethease c'est juste un généticien et un programmeur web.

Share this post


Link to post
Share on other sites

Quelle est la relation entre les bases variantes et les gènes ?

Par exemple, s'il y a environ 2 millions de bases variantes pour 30 000 gènes, est-ce cela veut dire qu'en moyenne chaque gène existe en 66 variantes différentes ?

Share this post


Link to post
Share on other sites

En voilà un fil intéressant.

Share this post


Link to post
Share on other sites

Quelle est la relation entre les bases variantes et les gènes ?

Par exemple, s'il y a environ 2 millions de bases variantes pour 30 000 gènes, est-ce cela veut dire qu'en moyenne chaque gène existe en 66 variantes différentes ?

Toutes les bases variantes ne sont pas dans des gènes, il y a aussi des pseudo-gènes et des segments intergéniques, par ailleurs il y a des mutations de plusieurs bases de long ou dont on hérite en cascade (elles se sont accumulées dans un ordre précis). Mais globalement oui, on trouve plein de variantes différentes de pratiquement tous les gènes.

Share this post


Link to post
Share on other sites

Une petite correction, FTDNA est bien plus ancien que 23andMe... Quelque chose que j’apprécie chez FTDNA, c'est qu'on peut y faire tester des SNP après son analyse initiale pour affiner les choses.

Je suis R1b-L21 en passant. Quelque part entre DF13 et L679 ("S16264, S21225" dans l'ISOGG).

  • Yea 1

Share this post


Link to post
Share on other sites

genetic-map-europe.png

 

 

 

The map above is only based on Y-DNA, thus only shows male common ancestors not female ones. Moreover, it should obviously not be used to imply that any country is better than any other. While we there may be differences between some of us, we are all equal.

 

 

C'est aussi l'occasion de remonter ce sujet qui est vraiment intéressant.

Share this post


Link to post
Share on other sites

A partir du 11 Novembre 2015 23andme cessera de permettre de récupérer toutes les correspondances génétiques de gens avec qui vous êtes en "sharing" (Ancestry Tools -> Countries of Ancestry -> Download all in CSV), et celles que vous avez avec des comptes anonymes.

C'est une énorme perte pour ceux qui veulent creuser et qui n'ont pas peur de passer des semaines sur un sujet très technique, mais c'est un grand progrès en matière de respect de la vie privée.

Donc ceux qui sont chez eux, il vous reste quelques jours.

Share this post


Link to post
Share on other sites

J'ai testé pour vous Y-Seq, un petit labo allemand qui vend des tests de SNPs Y-DNA spécifiques, au détail. C'est relativement rapide, et pas cher. Le mode de prélèvement (brossette buccale) permet l'envoi en pli simple. C'était mon choix pour compléter l'analyse de 23andme, qui était très limitée (12 marqueurs seulement, leur concurrent FTDNA monte à plus de 130).

Share this post


Link to post
Share on other sites

Tiens c'est vrai qu'il faut que je le fasse. 

Share this post


Link to post
Share on other sites

J'ai testé pour vous Y-Seq, un petit labo allemand qui vend des tests de SNPs Y-DNA spécifiques, au détail. C'est relativement rapide, et pas cher. Le mode de prélèvement (brossette buccale) permet l'envoi en pli simple. C'était mon choix pour compléter l'analyse de 23andme, qui était très limitée (12 marqueurs seulement, leur concurrent FTDNA monte à plus de 130).

Tu parles bien d'Yseq.net ? Très bon service effectivement. Ça a été fondé par des anciens de FTDNA il me semble. J'y ai fait testé quelques SNP aussi. Tu n'es donc pas du tout sur FTDNA ?

Share this post


Link to post
Share on other sites

Je n'ai pas compris la prestation vendue par ces labos. C'est de la généalogie ethnique ?

Share this post


Link to post
Share on other sites

Non je ne suis pas sur FTDNA, j'y ai un compte mais pas de données dessus faute de budget pour ça.

Je n'ai pas compris la prestation vendue par ces labos. C'est de la généalogie ethnique ?

Génétique et pas ethnique, mais oui.

Share this post


Link to post
Share on other sites

Ben de la généalogie sans mettre un nom sur un ancêtre c'est bien pour savoir à quel groupe ethnique (génétiquement bien sûr, hein) on rattache sa filiation (ils bossent tous sur le y ou sur la totale ?) ou il y a quelque chose que je ne saisi pas ?

C'est purement de la curiosité généalogique ou c'est aussi pour un intérêt médical ?

Share this post


Link to post
Share on other sites

C'est bien en l’occurrence simplement de la généalogie génétique, donc sur une échelle de temps différente de la généalogie classique. Les laboratoires ne testent pas l'ensemble du génome mais les paires les plus pertinentes en particulier pour identifier les haplogroupes les plus courants. En faisant tester des SNP précis, on peut aller plus loin que ces tests initiaux, s'il s'avère que l'on a besoin de déterminer la valeur d'une paire précise si l'étude de ses mutations est pertinente pour augmenter la précision de la cartographie des mutations caractéristiques d'un haplogroupe.

En se faisant analyser, on obtient naturellement des informations en particulier sur sa lignée patrilinéaire mais cela permet aussi de participer aux progrès de la science sur la question. Par exemple, mon Y a contribué à mettre en évidence l'origine continentale probable de l'un des haplogroupes celtiques/irlandais les plus courants. C'est pas décoiffant mais c'est quand même relativement cool.

Share this post


Link to post
Share on other sites

J'ai vraiment envie de faire cela. Un projet pour le début d'année.

Share this post


Link to post
Share on other sites

Ben de la généalogie sans mettre un nom sur un ancêtre c'est bien pour savoir à quel groupe ethnique (génétiquement bien sûr, hein) on rattache sa filiation (ils bossent tous sur le y ou sur la totale ?) ou il y a quelque chose que je ne saisi pas ?

C'est purement de la curiosité généalogique ou c'est aussi pour un intérêt médical ?

Non, généalogique et pas ethnique, tu ne réalises pas la portée de cette technique, en fait. Un haplotype précis sur un Y te permet bel et bien de mettre un nom sur un ancêtre lointain si il est assez précis et que les données de comparaison existent. Y en a plein qui peuvent ainsi confirmer descendre d'un certain roi d'Ecosse, du capitaine pirate Henry Morgan, de Genghis Khan, ou encore de tel célèbre patriarche gitan, nommément.

Share this post


Link to post
Share on other sites

Ha oui tiens, suite à ta réponse je regarde l'article "list of haplogroups of historic people".

C'est bluffant ce qu'on peut déduire quand même.

Share this post


Link to post
Share on other sites

Je précise en passant qu'on ne peut évidemment pas vraiment déduire un lien de descendance directe à partir de l'appartenance partagée à un haplogroupe. Il faut voir l'ancienneté de l'haplogroupe par rapport à la personne illustre concernée, la spécificité génétique et géographique, l'importance de sa progéniture, son rang social, etc.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...