ADN : pourquoi les empreintes génétiques ne protègent plus la vie privée

Les empreintes génétiques permettent de différencier deux individus, bien que notre ADN soit identique à 99,9%. Toutefois, les segments observés par les services médico-légaux peuvent révéler des informations sur l’état de santé des personnes dont l’ADN a été recueilli.

ADN

Les empreintes génétiques pourraient révéler des données médicales.

Johannes EISELE / AFP

99,9% de notre ADN est semblable à celui du reste de la population. Dans ces conditions, comment identifier le propriétaire du matériel génétique découvert sur une scène de crime ? La science médico-légale a fourni une réponse à cette question, avec la façon de différencier deux ADN.

INSTRUCTIONS. L’ADN donne les instructions pour assembler les acides aminés dans nos protéines selon des séquences précises. Pour que les protéines soient fonctionnelles, il faut une combinaison spécifique d’acides aminés. Une protéine qui ne fonctionne pas, ou absente, pourra entraîner une maladie génétique.

Afin de différencier deux empreintes génétiques, il faut donc aller chercher dans les 0,1% restants, là où l’ADN n’est pas connu pour coder quoi que ce soit de spécifique, ce qu’on appelle « l’ADN non codant. » « Parmi les quelque 3 millions de bases d’ADN (les bases forment les acides aminés, ndlr) qui ne codent pas pour les protéines, il y a des régions avec de multiples copies de courtes séquences répétées de ces bases. Ces séquences se répètent un nombre variable de fois chez différents individus. De telles régions sont appelées ‘répétitions en tandem courtes à nombre variable’ et elles constituent la base de l’analyse STR (pour « short tandem repeats »). Une collection de celles-ci peut fournir des preuves statistiques presque irréfutables de l’identité d’une personne, car la probabilité que deux personnes non apparentées aient le même nombre de séquences répétées dans ces régions devient de plus en plus faible à mesure que davantage de régions sont analysées« , explique le National Institute for Justice américain.

Une chance sur 1 milliard

Au début des années 1990, les Etats-Unis ont créé le CODIS (de l’anglais « Combined DNA Index System »), une banque de données qui répertorie les profils ADN. Les laboratoires médico-légaux contribuent à ces bases de données et fournissent des profils à partir d’échantillons collectés sur les preuves des scènes de crime, issues de personnes condamnés ou arrêtées pour un crime, mais également de personnes disparues. La justice utilise cette base de données pour essayer de faire correspondre des échantillons trouvés lors d’une enquête à des profils déjà stockés dans la base de données.

« Les 13 STR CODIS originaux ont été choisis pour être hautement polymorphes (dont il existe beaucoup de variations, ndlr), avec des différences minimales entre les populations (afin de pouvoir être utilisés avec n’importe quel individu, ndlr) ; ils peuvent être testés par PCR et se trouvent dans des domaines non-codants de l’ADN« , explique à Sciences et Avenir Rori Rholfs, professeure de biologie moléculaire à la San Francisco State University et autrice d’une récente étude publiée dans PNAS.

Avec 13 STR, la probabilité qu’une personne sans lien avec la personne réelle qui a commis le crime ait une correspondance parfaite pour les 13 était d’environ un sur un milliard. « Mais ils ont été choisis avant que le génome n’ait été séquencé en entier. Désormais, nous nous apercevons que certains de ces STR ne se situent pas du tout dans l’ADN non-codant et qu’ils sont révélateurs d’autres informations sur les individus. » En 2017, les 13 tronçons d’ADN ont été étendus à 20.

Des maladies psychiatriques, neurologiques ou dermatologiques

Avec les progrès fait en sciences depuis trente ans, le génome est désormais bien mieux connu et compris qu’à l’époque. Plusieurs travaux ont commencé à faire le lien entre d’autres STR ne faisant pas partie du CODIS et l’état de santé. L’équipe de San Francisco a voulu explorer la relation entre les STR du CODIS et l’expression des gènes. Sur les 20 marqueurs CODIS, ils ont trouvé six associations entre les marqueurs CODIS et l’expression génique de gènes voisins dans les lignées de globules blancs de plus de 400 individus qui n’avaient aucun lien les uns avec les autres dans la base de données.

99,9% de notre ADN est semblable à celui du reste de la population. Dans ces conditions, comment identifier le propriétaire du matériel génétique découvert sur une scène de crime ? La science médico-légale a fourni une réponse à cette question, avec la façon de différencier deux ADN.

INSTRUCTIONS. L’ADN donne les instructions pour assembler les acides aminés dans nos protéines selon des séquences précises. Pour que les protéines soient fonctionnelles, il faut une combinaison spécifique d’acides aminés. Une protéine qui ne fonctionne pas, ou absente, pourra entraîner une maladie génétique.

Afin de différencier deux empreintes génétiques, il faut donc aller chercher dans les 0,1% restants, là où l’ADN n’est pas connu pour coder quoi que ce soit de spécifique, ce qu’on appelle « l’ADN non codant. » « Parmi les quelque 3 millions de bases d’ADN (les bases forment les acides aminés, ndlr) qui ne codent pas pour les protéines, il y a des régions avec de multiples copies de courtes séquences répétées de ces bases. Ces séquences se répètent un nombre variable de fois chez différents individus. De telles régions sont appelées ‘répétitions en tandem courtes à nombre variable’ et elles constituent la base de l’analyse STR (pour « short tandem repeats »). Une collection de celles-ci peut fournir des preuves statistiques presque irréfutables de l’identité d’une personne, car la probabilité que deux personnes non apparentées aient le même nombre de séquences répétées dans ces régions devient de plus en plus faible à mesure que davantage de régions sont analysées« , explique le National Institute for Justice américain.

Une chance sur 1 milliard

Au début des années 1990, les Etats-Unis ont créé le CODIS (de l’anglais « Combined DNA Index System »), une banque de données qui répertorie les profils ADN. Les laboratoires médico-légaux contribuent à ces bases de données et fournissent des profils à partir d’échantillons collectés sur les preuves des scènes de crime, issues de personnes condamnés ou arrêtées pour un crime, mais également de personnes disparues. La justice utilise cette base de données pour essayer de faire correspondre des échantillons trouvés lors d’une enquête à des profils déjà stockés dans la base de données.

« Les 13 STR CODIS originaux ont été choisis pour être hautement polymorphes (dont il existe beaucoup de variations, ndlr), avec des différences minimales entre les populations (afin de pouvoir être utilisés avec n’importe quel individu, ndlr) ; ils peuvent être testés par PCR et se trouvent dans des domaines non-codants de l’ADN« , explique à Sciences et Avenir Rori Rholfs, professeure de biologie moléculaire à la San Francisco State University et autrice d’une récente étude publiée dans PNAS.

Avec 13 STR, la probabilité qu’une personne sans lien avec la personne réelle qui a commis le crime ait une correspondance parfaite pour les 13 était d’environ un sur un milliard. « Mais ils ont été choisis avant que le génome n’ait été séquencé en entier. Désormais, nous nous apercevons que certains de ces STR ne se situent pas du tout dans l’ADN non-codant et qu’ils sont révélateurs d’autres informations sur les individus. » En 2017, les 13 tronçons d’ADN ont été étendus à 20.

Des maladies psychiatriques, neurologiques ou dermatologiques

Avec les progrès fait en sciences depuis trente ans, le génome est désormais bien mieux connu et compris qu’à l’époque. Plusieurs travaux ont commencé à faire le lien entre d’autres STR ne faisant pas partie du CODIS et l’état de santé. L’équipe de San Francisco a voulu explorer la relation entre les STR du CODIS et l’expression des gènes. Sur les 20 marqueurs CODIS, ils ont trouvé six associations entre les marqueurs CODIS et l’expression génique de gènes voisins dans les lignées de globules blancs de plus de 400 individus qui n’avaient aucun lien les uns avec les autres dans la base de données.

Le changement de l’expression de certains gènes a été associé à la survenue de certaines maladies. Dans leurs travaux, une association a été identifiée entre certains CODIS et le changement des gènes aux alentours. Trois associations ont particulièrement intéressé les chercheurs. Celle avec le gène CSF1R, qui peut être associé à des maladies psychiatriques comme la dépression et la schizophrénie. Deux autres avec les gènes LARS2 et KDSR, qui peuvent, eux, être associés au syndrome de Perrault, à des maladies de plaquettes sanguines, des maladies dermatologiques et le syndrome MELAS, une maladie neurologique.

« Nos résultats ne sont que la partie émergée de l’iceberg« , explique Rohlf, qui s’est dite surprise de trouver des associations dans des échantillons aussi petits. « Si nous poussions nos analyses plus loin, y aurait-il encore plus d’informations révélées ? » L’analyse, qui a été menée sur des globules blancs, pourrait être complétée par des recherches sur d’autres tissus. La base donnée ne représente pas toute la population.

La fin de l’ADN « poubelle« 

En France, le Fichier national automatisé des empreintes génétiques (FNAEG) a été créé en 1998. Il se base sur l’analyse de 16 loci, la localisation physique du STR sur le gène, dont une grande partie sont les mêmes que ceux utilisés dans le CODIS américain. Des travaux sur une probable révélation d’informations grâce aux empreintes génétiques ont été réalisés par la chercheuse Catherine Bourgain, spécialisée en génétique à l’Inserm. « La distinction entre ADN-codant et non-codant est une vieille image adossée à celle de l’ADN qu’on disait ‘poubelle’ versus le reste des protéines », explique-t-elle à Sciences et Avenir. « Cette vieille image n’est plus alignée avec la façon dont on connaît l’ADN aujourd’hui. »Concrètement, il n’existe pas de risque imminent sur d’éventuelles révélations sur la santé des personnes dont l’ADN se trouve dans ces fichiers. « Mais imaginons qu’on change de régime démocratique, cette protection de la vie privée n’existerait plus. La technologie n’est plus une protection, un verrou comme on l’imaginait il y a encore quelques dizaines d’années. »

Alors, que fait ? changer les STR utilisés, au risque de chambouler l’entièreté des bases de données créées jusqu’à présent ? « Aujourd’hui, on ne peut plus choisir de nouveaux STR, reprend la spécialiste française. En effet, pour départager deux ADN, il est impératif d’avoir beaucoup de marqueurs, car certains peuvent être identiques. Il en faut donc beaucoup pour trouver des différences entre deux personnes. Mais aujourd’hui, on ne peut plus trouver 20 STR polymorphes, avec beaucoup d’allèles, pour lesquels on ne connaît aucune autre implication. » Rori Rholfs de San Francisco est arrivée à la même conclusion avec son équipe. « La législation pourrait évoluer pour les protéger. Il faudrait en réglementer la saisie, le stockage et le partage. » S’il est impossible de revenir en arrière, la seule solution restante est de mieux encadrer le profilage médico-légal.

Source: Sciencesetavenir.fr
laissez un commentaire