13 Eléments de génétique moléculaire.


Objectifs : Devenir capable de

Mots et concepts clefs :

protéine enzyme
ADN ARN
ribosome virus
 

Les protéines dans les cellules.

Haut de la page

Les protéines comme matériau de fabrication.

A part les virus, tous les êtres vivants sont formés d'une ou plusieurs cellules. L'organisme humain est formé de plusieurs centaines de milliards de cellules organisées en tissus spécialisés. Chacune de nos cellules est fabriquée à l'aide de " briques " de base : ce sont essentiellement des protéines qui constituent les matériaux de construction. Donc, pour fabriquer une nouvelle cellule ou se maintenir en vie, les cellules doivent fabriquer des protéines de structure.

D'autre part, chacune de ces cellules joue un rôle dans notre organisme :

Dans chacun des rôles cités plus haut, la cellule fabrique des protéines.

Les protéines comme enzymes.

Les protéines jouent, de plus, le rôle extrêmement important d'enzyme, de catalyseur biochimique. Il existe un certain nombre de substances que nos cellules doivent pouvoir fabriquer. Pour ce faire, elles utilisent une série d'outils chimiques que sont les enzymes. Celles-ci, présentes en faible quantité, catalysent certaines réactions chimiques de fabrication de nombreuses substances dans notre organisme. Les protéines assurent donc un rôle clef dans tous les êtres vivants.

Structure des protéines.

On a déjà indiqué plus haut que les protéines sont formées de l'enchaînement d'une longue série d'acides aminés choisis parmi les 20 qui existent dans la nature. Telle protéine qui joue un rôle bien précis dans l'organisme est toujours formée de la même succession d'acides aminés dans le même ordre bien précis. L'hémoglobine est une assez grosse protéine formée de l'association de quatre chaînes protéiques plus petites ; elle contient un total de 574 acides aminés dont l'ordre de succession est bien connu. Notre organisme est capable de fabriquer cette hémoglobine en fixant chacun des acides aminés à sa place dans la chaîne. Chez certaines personnes, il existe une erreur dans le " plan de montage ", si bien qu'un des acides aminés est remplacé par un autre. Cela se marque par une maladie génétique assez grave : l'anémie falciforme. Les malades ne dépassent guère l'âge de trente ans. Puisque la structure des protéines est parfaitement fixée, il doit exister dans les cellules qui les fabriquent un plan de montage parfaitement détaillé. Ce plan de montage se trouve dans le noyau des cellules, et plus particulièrement dans les chromosomes. Les gènes, portés par les chromosomes, ne sont " que " des plans de montage des protéines que la cellule doit pouvoir construire : ce sont les informations génétiques.

 

Nature des informations génétiques.

Haut de la page

Structure de l'ADN chromosomique.

Les informations génétiques sont portées par les chromosomes. Quand on analyse la structure d'un chromosome, on observe qu'il est formé d'un squelette protéique dans lequel on trouve une énorme molécule : l'ADN ou acide désoxyribonucléique. Si on déroulait tout l'ADN d'une cellule humaine, on obtiendrait un filament d'une longueur de ±1,5 m. En mettant bout à bout toutes les molécules d'ADN de toutes nos cellules, on fabriquerait un filament qui pourrait joindre la Terre à la Lune. La structure de la molécule d'ADN est complexe. Elle est formée de deux brins enroulés l'un autour de l'autre en une double hélice. On pourrait aussi comparer la forme de la molécule à celle d'une échelle qui serait torsadée sur elle-même. Chacun des montants de l'échelle est formé par la succession de groupes d'atomes de deux sortes :

Un montant a donc la structure suivante :

P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-.....

Les barreaux de l'échelle sont liés aux molécules de désoxyribose. Ils sont formés de molécules qui peuvent être de quatre types :

Pour des raisons chimiques que nous ne détaillerons pas, on appelle ces molécules des bases. L'ordre de succession des bases A, T, G et C dans l'échelle ne semble pas obéir à une règle simple. La structure d'une demi-échelle présenterait la forme suivante :

P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D
  |   |   |   |   |   |   |   |   |   |   |   |   |
  A   C   G   T   A   C   G   G   A   C   T   T   A

Des liaisons chimiques se réalisent entre les molécules d'adénine (A) et de thymine (T) ainsi qu'entre les molécules de cytosine (C) et de guanine (G). Les liaisons A-G et C-T ne sont pas possibles. Cette particularité détermine complètement la structure de l'autre demi-échelle. Puisqu'à un demi-barreau " A " ne peut correspondre qu'un demi-barreau " T " et à un demi-barreau " C " ne peut correspondre qu'un demi-barreau " G ", la demi-échelle complémentaire à celle de l'exemple permettra de concevoir une molécule d'ADN complète selon le schéma suivant :

P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D
  |   |   |   |   |   |   |   |   |   |   |   |   |
  A   C   G   T   A   C   G   G   A   C   T   T   A

  T   G   C   A   T   G   C   C   T   G   A   A   T
  |   |   |   |   |   |   |   |   |   |   |   |   |
P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D-P-D

L'ADN constitue le plan de montage des protéines.

L'ordre de succession des bases dans la molécule d'ADN n'est pas indifférent : il s'agit d'un message codé qui permet à la cellule qui contient cet ADN de fabriquer des molécules de protéines : l'ordre de succession des bases est le plan pour la succession des acides aminés. La molécule d'ADN constitue donc une espèce de message secret ; connaissant le code et " lisant " la molécule d'ADN, la cellule est capable de fabriquer une protéine. Le code génétique a été décrypté par les scientifiques. Hypothèse 1 : à UNE BASE de l'ADN correspond UN acide aminé dans la protéine correspondante.

Cette hypothèse doit rapidement être abandonnée : il n'existe que quatre bases et ce code ne permettrait de coder que pour quatre acides aminés ; or, il en existe 20.

Hypothèse 2 : à UNE PAIRE DE BASES de l'ADN correspond UN acide aminé dans la protéine.

Dans cette hypothèse, on pourrait coder pour 16 acides aminés, les 16 combinaisons étant indiquées dans le tableau ci-contre.

A-A C-A T-A G-A
A-T C-T T-T G-T
A-C C-C T-C G-C
A-G C-G T-G G-G

L'hypothèse doit donc être abandonnée. Hypothèse 3 : à UN TRIPLET DE BASES de l'ADN, correspond UN acide aminé dans la protéine. Le tableau ci-contre indique la signification du code génétique. Chaque acide aminé est représenté par l'abréviation " AAxx " où xx est une valeur conventionnelle propre à ce cours. On voit que trois triplets de bases n'ont aucune correspondance en acides aminés ; ils signifient simplement " fin de message ".

1ère position

2ème position

3ème position

 

T

C

A

G

 

T

AA1
AA1
AA2
AA2
AA3
AA3
AA3
AA3
AA4
AA4
STOP
STOP
AA5
AA5
STOP
AA9

T
C
A
G

C

AA2
AA2
AA2
AA2
AA6
AA6
AA6
AA6
AA7
AA7
AA18
AA18
AA8
AA8
AA8
AA8

T
C
A
G

A

AA10
AA10
AA10
AA11
AA1
AA12
AA12
AA12
AA19
AA19
AA14
AA14
AA3
AA3
AA8
AA8

T
C
A
G

G

AA15
AA15
AA15
AA15
AA16
AA16
AA16
AA16
AA13
AA13
AA20
AA20
AA17
AA17
AA17
AA17

T
C
A
G

Remarque : pour décoder la molécule d'ADN, la cellule ne lit qu'un des deux montants de la molécule d'ADN. On ignore la raison pour laquelle elle choisit un montant plutôt que l'autre.

On obtient cette fois 64 possibilités de combinaison des bases 3 par 3, c'est-à-dire plus qu'il n'en faut. On pourra donc se permettre d'avoir plusieurs combinaisons pour coder le même acide aminé.

 

Mécanisme de traduction de l'ADN.

Haut de la page

La fabrication des protéines est assurée par des ouvriers spécialisés répartis dans le cytoplasme de la cellule : les ribosomes. Ceux-ci reçoivent un plan de construction et, à partir de ce plan, fabriquent les molécules de protéines, maillon par maillon. L'ADN présent dans le noyau est un matériau extrêmement précieux. On a vu plus haut que la moindre erreur dans le message porté par l'ADN pouvait être fort dommageable pour la cellule et pour l'organisme contenant cette cellule. L'ADN ne sort donc jamais du noyau : les plans de construction livrés aux ribosomes ne sont donc que des copies de l'ADN appelées ARN (acide ribonucléique) messager. La structure de l'ARN est assez semblable à celle de l'ADN, mais en plus simple : la molécule d'ARN ressemble à une demi-échelle d'ADN, avec quelques variantes :

La structure de la molécule est donc du type suivant :

P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-P-R-
  |   |   |   |   |   |   |   |   |   |   |   |   |
  A   C   G   U   A   C   G   G   A   C   U   U   A

Les molécules d'ARN sont fabriquées dans le noyau cellulaire sur base de l'ADN. Ces molécules d'ARN migrent alors vers les ribosomes qui les décodent et fabriquent les protéines correspondantes. Lorsque la cellule doit fabriquer une grande quantité d'une certaine protéine, elle produit un grand nombre de molécules d'ARN messager ; celles-ci sont décodées par plusieurs ribosomes à la fois.

Les virus et les rétrovirus.

Les virus sont des êtres à la limite du vivant : ils sont constitués d'une coque formée de protéines qui entoure une petite molécule d'acide nucléique. Cet acide nucléique est de l'ADN dans le cas des virus et de l'ARN dans le cas des rétrovirus. Le virus ne possède aucune machinerie de fabrication de protéines ; donc, pour se multiplier, il doit utiliser la machinerie d'une cellule qu'il infecte. Le virus agit selon la stratégie du cheval de Troie. Il injecte son ADN dans la cellule cible ; cet ADN rejoint le noyau cellulaire et s'intègre à l'ADN de la cellule qui va l'utiliser comme son propre ADN. La cellule infectée va donc construire elle-même de nouveaux virus sur base des plans qui lui ont été fournis. Les rétrovirus opèrent de la même façon, si ce n'est que leur acide nucléique est de l'ARN. Celui-ci est alors transformé en ADN (à contre courant du cheminement normal ADN -> ARN, d'où leur nom de rétrovirus) qui s'intègre dans l'ADN de la cellule. Dans de très nombreux cas, l'ADN viral peut rester " dormant " dans l'ADN cellulaire durant une période qui peut être très longue (plusieurs années). C'est le cas, par exemple, du virus du SIDA : une personne infectée est séropositive, mais peut ne manifester aucun signe de la maladie pendant plusieurs années.

 

Exercices.

Haut de la page

Voici deux fragments d'ADN. Chacun correspond à un morceau d'un montant de l'échelle. fragment 1 : A A G A T C A T G T T G T A C C A T A A C T A A C fragment 2 : A T G C A T G C C G T A C T A G G G T T T T G A C C G Pour chacun des fragments :  

Textes de travail.

Haut de la page

De l'ADN aux protéines.

Une cellule d'organisme supérieur (eucaryote) comporte un noyau, dont les pores permettent le passage d'un certain nombre d'informations ; à l'intérieur du noyau, les chromosomes, donc les gènes ; et à la périphérie, toutes sortes de structures, de membranes, etc., assurant le transport des protéines synthétisées au-dehors et la communication du noyau avec l'extérieur de la cellule. Une cellule est donc bien un être extraordinairement complexe comportant de nombreux systèmes de communication et de régulation à la fois internes et externes. [...] Si l'on y regarde d'un peu plus près, on peut passer du niveau de l'ADN à celui des gènes. [...] On observe, premièrement, que dans les organismes supérieurs, de nombreux gènes ont une structure discontinue [...]. Deuxièmement, qu'il existe entre les gènes, à plusieurs endroits, des espaces importants apparemment vides, et l'on en a conclu qu'environ 90 % de l'ADN humain n'a pas de fonction génétique claire ou, du moins, ne code pas pour des protéines. Dire que ces 90 % sont complètement inutiles et n'ont pas de fonction est sans doute excessif, mais ils n'ont pas de fonction codante au sens où on l'entend habituellement. Si l'ADN est beaucoup plus dilué chez l'homme que dans la bactérie, par un facteur 1.000, il ne porte cependant que 20 fois plus de gènes. C'est d'ailleurs l'un des grands mystères de la biologie qu'un homme, qui est tout de même un être plus complexe qu'une bactérie, n'ait, probablement, que 20 fois plus de gènes ! On sait que les gènes sont transcrits en un acide ribonucléique (ARN) nommé " ARN messager ", c'est-à-dire une molécule qui transporte l'information à l'endroit où a lieu la synthèse de la protéine qu'ils codent. La totalité du gène est d'abord transcrite en une molécule d'ARN. Celle-ci subit un processus d'épissage qui en élimine les éléments de discontinuité et la transforme en ARN messager. Autrement dit, la séquence qui code pour la protéine dans un gène discontinu est interrompue par ces discontinuités mêmes, qu'on appelle des introns, et qui sont éliminées de façon précise pour donner l'ARN messager qui va guider la synthèse de la protéine et dans lequel la continuité a été restaurée par le processus d'épissage. Un gène, plus exactement la séquence d'un gène, comporte plusieurs milliers de caractères. Les gènes sont faits d'ADN et l'ADN de quatre bases -A, T, G, C- dont l'enchaînement est signifiant en termes d'information biologique. On dispose maintenant de techniques rapides, d'ailleurs en passe d'être automatisées, pour déterminer la séquence de ces gènes. Des progrès très importants ont été accomplis et d'autres améliorations sont attendues, de façon que la détermination d'une séquence de ce type, qui nécessitait plusieurs mois au début des années quatre-vingt, puisse être effectuée en quelques heures et, pourquoi pas, en quelques minutes. C'est la condition sine qua non pour qu'on puisse, à terme, déterminer la séquence complète des 3 milliards de paires de bases qui constituent le génome de l'homme. On trouve souvent, dans les organismes supérieurs, des familles de gènes dont les séquences sont comparables. Les homologies de séquences, qui définissent les familles de gènes, nous donnent la quasi-certitude que ces gènes sont apparus au cours de l'évolution par duplications et divergences. Parmi les 100.000 gènes du génome humain, certains peuvent être ainsi regroupés par homologie de séquences en quelques grandes familles, dont la plus remarquable est certainement celle des immunoglobulines qui comprend plusieurs milliers de membres. On peut aussi comparer les séquences de gènes provenant non plus d'un même organisme, mais d'espèces différentes. Par exemple, on peut comparer la séquence des gènes qui codent pour l'hémoglobine dans toute une série d'espèces, et l'on observe alors des homologies telles, qu'elles constituent la meilleure preuve, à ce jour, de la validité de la théorie de l'évolution. Ce n'est pas tout. Un gène code pour une protéine. Une protéine est constituée par l'enchaînement d'un certain nombre d'acides aminés (quelques centaines en général). Il existe 20 types d'acides aminés utilisés dans les protéines. Le jeu consiste alors à comprendre non seulement la nature du code génétique qui fait passer d'une séquence linéaire des bases A, T, G, C à une séquence linéaire des 20 acides aminés constituant les protéines, -on le sait depuis vingt ou trente ans maintenant-, mais surtout à voir comment ces protéines adoptent dans l'espace une ou plusieurs configurations ou un ensemble de configurations alternatives qui leur confèrent leurs propriétés biologiques. Les propriétés biologiques capitales se trouvent donc au niveau des protéines qui sont les vrais exécutants du programme génétique. De nombreuses protéines sont des enzymes : elles ont des activités catalytiques tout à fait remarquables qui permettent aux cellules de fonctionner. Il faut alors chercher à comprendre la manière dont fonctionnent les enzymes, et rendre compte de leurs activités catalytiques multiples, essentiellement en étudiant leurs structures spatiales très complexes et mystérieuses, avec leurs repliements, leurs espèces de poches où les molécules réagissantes viennent se lover.

Kourilsky P.
Les biotechnologies dans le champ du vivant
in Des technologies pour demain
Le Seuil, Paris, 1992

Établis une synthèse dessinée de ce texte. Chaque dessin est accompagné d'une très courte légende qui permet d'identifier le passage illustré.

Haut de la page

Pour le séquençage du génome humain.

L'autonomie d'un être vivant, sa reproduction et sa survie supposent la cohérence interne de son patrimoine génétique. Celui-ci est transmis sous la forme de molécules géantes, des acides désoxyribonucléiques (ADN), faits de la répétition de quatre motifs de base, les nucléotides, selon un enchaînement (la " séquence ") semblable à celui d'un texte alphabétique. Cet ADN doit être exprimé sous forme de molécules chimiquement différentes, permettant le fonctionnement du métabolisme (l'ensemble des transformations qui permettent d'édifier la cellule) et de la compartimentation (fabrication de membranes). En particulier, les réactions du métabolisme sont accélérées et catalysées par les protéines, qui sont aussi un enchaînement linéaire, mais de vingt motifs de base et non plus de quatre, les acides aminés. Le fil correspondant se replie dans l'espace de façon à former une architecture spécifique de chaque séquence d'acides aminés, et responsable de la fonction. Les règles de réécriture du patrimoine génétique sont totalement incluses dans la suite des nucléotides et des acides aminés qui leur correspondent. Mais la cohérence de cette information, dont une large part résulte de l'histoire évolutive de l'organisme, est encore inaccessible. On n'est pas vraiment en mesure d'identifier la nature des signaux qui dictent la mise en place dans le temps et dans l'espace des macromolécules conservant et exprimant le programme génétique. De la mémoire de l'ADN à celle de l'ordinateur. Les banques de données contiennent déjà 40 millions de nucléotides, provenant des séquences d'organismes variés. Mais il s'agit de données fragmentaires et hétéroclites, et la séquence d'un génome entier serait beaucoup plus riche d'enseignements. Cependant, malgré les nouvelles techniques de séquençage, la lourdeur d'un tel projet impose une grande circonspection dans le choix des organismes. Pour des raisons " spectaculaires " évidentes, et sous l'impulsion de Jim Watson (l'un des découvreurs, dans les années soixante, de la structure de l'ADN), on a surtout fait mention de projets concernant le génome humain : trois milliards de paires de nucléotides répartis en 46 chromosomes, parmi lesquels 3 % environ constituent les 50.000 à 100.000 gènes, le reste constituant en majorité des " archives " inutilisées actuellement. La construction modulaire de l'ADN, où des zones codantes (exons) alternent avec des zones non codantes (introns), se traduit par de nombreuses difficultés. Il est fréquent qu'un exon très court se trouve noyé au milieu d'un océan d'introns : la détermination de la séquence d'un fragment d'ADN, même long, peut alors se révéler très insuffisante pour définir le gène qu'il spécifie. A cette difficulté s'ajoute celle de caractériser ce qu'est un génome humain. La variabilité génétique des populations provient d'un polymorphisme très important dans les séquences génomiques des individus, y compris chez un individu lorsqu'on considère la même région d'un chromosome maternel et de sa contrepartie paternelle. Il sera difficile de distinguer ce qui revient aux erreurs expérimentales de ce qui est seulement une variation habituelle. Ainsi, ce qui n'est pas un encombrement rédhibitoire pour un génome le deviendra sans aucun doute pour le système informatique chargé du séquençage. D'où l'intérêt d'une cartographie physique des chromosomes, projet beaucoup plus accessible, au moins dans un premier temps, que le séquençage du génome lui-même. On pourrait obtenir ainsi la localisation précise de gènes identifiés, en particulier de gènes responsables de pathologies diverses. Cet objectif, qui pourrait déboucher sur l'invention de méthodes thérapeutiques nouvelles (tenant compte, on l'espère, de critères éthiques), est une motivation suffisante pour justifier l'étude du génome de l'homme, mammifère particulièrement mal adapté à l'étude génétique ! La réflexion scientifique prenant le pas sur la réflexion médiatique, et les génomes mammifères étant voisins les uns des autres, il semble raisonnable de séquencer un génome plus homogène, celui, par exemple, de la souris de laboratoire dont existent des lignées consanguines. Outre une diminution des difficultés mentionnées plus haut (gènes morcelés, archives, polymorphisme), une analyse fonctionnelle des gènes pourrait se faire par génétique " inverse " : cela consiste à remettre au sein de l'organisme le gène étudié sous forme défectueuse ou altérée, afin d'en comprendre le rôle -ce qui est évidemment impossible chez l'homme. Des gènes inattendus Le modèle souris est encore inaccessible par sa taille aux techniques actuelles du séquençage. Celui de la mouche drosophile, environ vingt fois plus petit, pourrait déjà permettre la découverte de gènes essentiels à la détermination embryonnaire ou à la différenciation cellulaire. Un ver minuscule, Coenorhabditis elegans, est spécialement prometteur à cet égard. En effet, contrairement aux mammifères, aux plantes, ou aux insectes un peu élaborés, C. elegans a des cellules dont le nombre, la disposition et le patron de différenciation sont absolument fixés par les gènes. II est enfin une plante, Arabidopsis thaliana, dont le génome est relativement petit, qui a été choisie comme modèle du monde végétal. Le cas de l'étude de la levure de boulanger, mise en place par la CEE, est exemplaire. Alors que la rumeur internationale faisait état de nombreuses discussions à propos des projets de séquençage du génome humain, André Goffeau de l'université de Louvain réussissait dès 1986 à convaincre ses collègues de s'associer pour séquencer le génome de la levure Saccharomyces cerevisiae. Ce génome, d'environ 15 millions de paires de nucléotides répartis en 16 chromosomes, se prête bien à la génétique inverse. Une association d'une quarantaine de laboratoires européens a déterminé la presque totalité de la séquence d'un des chromosomes dès 1990 et le tiers du génome devrait être séquencé d'ici 1995[A]. L'observation la plus remarquable issue de ce travail est que plus de la moitié des nouveaux gènes ainsi découverts ne ressemblent à rien de connu, ce qui était totalement inattendu. Les bactéries, enfin, sont les organismes qui se prêtent le mieux à l'étude. Le colibacille, dont le chromosome unique est formé de 4,75 millions de paires de nucléotides, est l'exemple le mieux connu. De très nombreux gènes en ont été séquencés, mais il lui reste malheureusement un handicap spécifique : bien qu'elle soit possible, la génétique inverse ne s'y réalise que très laborieusement. Pour cette raison une autre bactérie, Bacillus subtilis, est l'objet de projets concertés. Son génome est moins bien connu, mais plus de 700 gènes ont été localisés. Le séquençage " au hasard " a révélé l'existence d'un grand nombre de gènes (près de la moitié de ceux qui ont été identifiés) dont le produit ne s'apparente à aucun gène connu. Il s'agit d'une observation très remarquable qui démontre que les approches génétiques classiques ont laissé de côté un pan immense de l'étude des organismes. Le seul fait qu'on n'en aurait pas soupçonné l'existence si on n'avait pas commencé à mettre en place des projets de séquençage de grands génomes suffirait à justifier de tels projets.

Danchin A.
L'Etat des Sciences (op. cit.)
pp 227-229

[A] le séquençage complet du génome de Saccharomyces. cerevisiae a été terminé au début de l'année 1996.

Haut de la page

 

Contre le séquençage du génome humain.

La communauté scientifique internationale s'est massivement investie dans un programme de recherche ambitieux : séquencer un génome humain, c'est-à-dire en identifier tous les gènes. Le projet coûtera très cher et mobilisera de nombreux biologistes durant de longues années. Que peut-on en attendre ? Quand un être humain se reproduit, l'ADN (acide désoxyribonucléique) de ses chromosomes est répliqué et transmis avec une étonnante précision, mais parfois une erreur se glisse ici ou là, erreur souvent sans conséquence, parfois gênante ou grave, quelquefois bénéfique. Ainsi s'introduisent des variations ou " mutations " dans les populations humaines. Si l'on considère un gène particulier qui code pour une des dix ou vingt mille protéines différentes des cellules humaines, ce gène a une chance sur un million d'être incorrectement transmis d'un parent à son enfant. Cela semble faible. Or, un gène couvre environ un millionième du génome humain. En se reproduisant, chaque individu crée en moyenne une modification génomique. Le monde compte quatre milliards d'individus, tous différents génétiquement (à l'exception des vrais jumeaux), qui produiront, à la prochaine génération, quatre ou cinq milliards de nouveaux spécimens humains. Pour chaque gène, dix mille " déviants " (pas tous nouveaux, et pas tous différents les uns des autres) contribueront à l'enrichissement génétique de notre espèce. Le mode de reproduction sexuée fait que l'enfant possède chaque gène en deux exemplaires, l'un fourni par le père, l'autre par la mère. Si l'un des exemplaires est défectueux, l'autre pallie en général l'insuffisance. En cas de grave handicap, la cruelle loi de la sélection naturelle fait son oeuvre : l'individu meurt sans s'être reproduit, donc sans avoir transmis ses gènes défectueux aux générations futures. Le plus étonnant dans tout cela est que la vie s'accommode aussi bien d'une telle variabilité, et qu'une bonne moitié des combinaisons créées à partir des deux lots de chromosomes paternel et maternel produisent des individus viables. A l'inverse d'une mécanique de précision que le moindre grain de sable enraye, à l'inverse des programmes d'ordinateur qui disjonctent quand on y change le moindre symbole, le " programme " génétique des animaux ou des végétaux est d'une formidable tolérance aux altérations. Au lieu de l'organisation hiérarchique de type militaire qui prévaut chez les bactéries, la cellule des organismes supérieurs utilise une pluralité de dispositifs agissant de manière diffuse. Une protéine influence plusieurs autres protéines et reçoit en retour des signaux d'une multiplicité de partenaires. Pour comprendre les principes généraux des dispositifs par lesquels la cellule évalue ses états internes et ajuste son activité en fonction de ses besoins et des contraintes de l'environnement, il n'est nullement nécessaire de connaître la structure exacte de tous les gènes d'un génome humain particulier parmi les milliards de génomes réalisables ou déjà réalisés. Les gènes commandent à une multitude d'agents d'exécution, des protéines, dont la durée de vie est limitée, et qui agissent plus ou moins vite et parfois se trompent. Du message génétique à son expression concrète, il y a bien des niveaux d'étude dont on ne peut faire l'économie. La dimension temporelle en particulier, essentielle pour comprendre la biologie, est pratiquement illisible dans les informations génomiques. On avance que la connaissance exhaustive du génome humain ouvrira de nouvelles perspectives thérapeutiques. Pourquoi donc ? La connaissance des génomes de virus (grippe ou Sida) n'a amené aucun progrès thérapeutique, et pour cause : ces génomes sont tellement variables qu'aucun remède à leur niveau ne peut les gêner durablement. Et les données génétiques accumulées depuis trente ans sur les anémies humaines n'ont pas changé grand-chose au sort des malades. Les exigences de la science spectacle A supposer que la thérapie génique réussisse à soulager ponctuellement quelques malades richissimes ou tirés au sort, les laissera-t-on se reproduire et transmettre leurs gènes défectueux à leur descendance ? Inversement, s'il fallait éliminer les embryons porteurs de gènes suspects, où irait-on ? Va-t-on multiplier les diagnostics prénataux, nécessairement incertains, puisque tout nouvel individu est un déviant, et en arriver à ce qu'une femme avorte six fois avant de mettre au monde un enfant " garanti sans tare " ? Qui nous dit que le génial mathématicien français Evariste Galois, mort à vingt ans, ou Mozart, mort à trente-cinq, n'étaient pas porteurs d'une tare génétique à manifestation tardive ? Enfin, une déficience surmontée ne pourrait-elle pas amener un enrichissement de notre culture ? Comme le langage des signes développé par les sourds-muets. Autant de questions éthiques posées et non résolues qui conduisent à s'interroger sur les raisons, les enjeux et les conséquences potentielles d'un engagement massif dans la thérapie génique. Le projet de séquençage d'un génome humain n'ayant d'urgence ni fondamentale ni appliquée, il reste à expliquer pourquoi il s'est imposé. Avec le développement des biotechnologies, dans les années soixante-dix, de nombreux biologistes participent à la création de firmes privées, ou deviennent consultants et touchent de gros cachets. Ces firmes bénéficient de l'engouement boursier, mais n'ouvrent pas de nouveau marché. Vers 1983, c'est le désenchantement : le cours des actions fléchit, les firmes se font racheter par de grosses entreprises traditionnelles. C'est alors que naît le projet de séquençage du génome, lequel doit renflouer les firmes de biotechnologie par injection massive de fonds publics. En 1986, c'est la catastrophe nucléaire de Tchernobyl et l'explosion de la navette spatiale Challenger. Les politiciens se détournent des secteurs auxquels ils avaient accordé jusque-là leurs largesses : la physique nucléaire et l'exploration de l'espace. La route est ouverte aux biologistes. L'homme d'affaires et biologiste américain Walter Gilbert crée en 1987 la firme Genome Corporation pour exploiter le projet, et un cartel d'intérêts réussit à sensibiliser politiciens et journalistes. En raison des enjeux financiers, les biologistes qui sont dans leur très large majorité hostiles au projet n'ont pas droit de cité. D'autres s'y rallient publiquement, faisant passer leurs intérêts avant leurs convictions. Les crédits n'étant pas extensibles, des centaines de sujets de recherche couvrant des champs très larges de la biologie seront abandonnés, et le savoir qu'ils entretenaient sera perdu. Cet épisode de la science amène à se poser trois questions : 1. Les citoyens vont-ils prendre conscience qu'on les abuse et que des scientifiques manient la langue de bois comme des politiciens chevronnés ?
2. Quand la biologie moléculaire se relèvera-t-elle de cet épisode dévastateur ?
3. Evolue-t-on vers une nouvelle définition du statut social de la science, la société ne lui demandant plus de produire des connaissances, mais de fournir un spectacle de nature à nourrir son imaginaire ?

Ninio J.
L'Etat des Sciences (op. cit.)
pp. 451-453

A la lecture des deux textes précédents, établis une synthèse des arguments favorables et défavorables au séquençage du génome humain.
Dans la mesure du possible, oppose les arguments et donne ta conclusion personnelle en la justifiant.

Haut de la page

LES EMPREINTES GENETIQUES DES CRIMINELS

L'empreinte génétique permet l'identification de criminels aussi fréquemment, et peut-être plus sûrement que l'empreinte digitale. Nous pouvons recourir à la biologie moléculaire dès lors qu'un criminel laisse du matériel génétique, c'est-à-dire des cellules qui ont un noyau. Les empreintes génétiques sont particulièrement utiles pour les viols, car, dans ce cas, les empreintes digitales sont rarement exploitables. Les analyses biologiques sont effectuées à la demande d'une autorité, selon deux modes de saisine : la réquisition du procureur de la République ou des enquêteurs et l'expertise ordonnée par le juge d'instruction. La fiabilité des résultats dépend surtout du soin avec lequel les échantillons sont prélevés sur le lieu du crime et transportés jusqu'au laboratoire sans être contaminés ou dégradés. Les échantillons sont recueillis à partir de taches de sang ou de sperme par des inspecteurs de l'identité judiciaire, formés aux techniques de prélèvements : ce sont les " techniciens de la scène du crime " ; les quantités sont souvent faibles, et l'état de conservation parfois mauvais. Lorsque l'indice prélevé est censé être du sang, nous vérifions d'abord qu'il s'agit bien de sang, par des réactions chimiques simples, et que ce sang est humain. Puis nous déterminons son groupe sanguin (A, B, AB, ou 0) et son groupe Rhésus (positif ou négatif). Ces analyses sont rapides et peu coûteuses ; elles suffisent parfois à exclure un suspect. Les prélèvements sur les personnes vivantes (la victime d'un viol et les suspects) sont effectués par des personnes du milieu médical. L'ADN est extrait des noyaux des cellules (des globules blancs du sang ou des spermatozoïdes). Si on nous demande un résultat rapide (dans le cas d'une garde à vue), nous amplifions (par la technique d'amplification des gènes, dite PCR) les gènes codant le système HLA (c'est-à-dire codant les antigènes de surface des globules blancs) et nous déterminons leur groupe (A, B, C ou D); il nous arrive ainsi de disculper un suspect. Pour une identification plus précise, nous analysons le " polymorphisme de longueur des fragments de restriction " (RFLP). Le principe de cette technique repose sur l'existence, dans la molécule d'ADN, de régions non codantes formées par la répétition d'une séquence nucléotidique particulière, en un nombre d'exemplaires qui varie selon les individus. Chacun de nous possède deux versions (ou allèles) de ces portions d'ADN ; ces allèles, hérités des parents, ne contiennent pas le même nombre de séquences répétitives (polymorphisme) et sont donc de longueurs différentes. Deux êtres humains, qui ne sont pas jumeaux homozygotes, n'ont pratiquement aucune chance d'avoir les mêmes empreintes génétiques pour l'ensemble des séquences testées. La spécificité de ces séquences répétitives constitue le fondement de nos examens. Avant toute analyse de RFLP, nous vérifions la qualité de l'ADN : Si l'ADN est dégradé, c'est-à-dire fractionné par des micro-organismes ou divers facteurs physiques (soleil) ou chimiques (détergents), nous ne pouvons rien conclure sur les longueurs des fragments. En revanche, si l'échantillon est de bonne qualité, nous fragmentons l'ADN grâce à une enzyme de restriction, qui coupe la molécule en des régions spécifiques. Nous séparons ces fragments en fonction de leur longueur, par électrophorèse. Ces fragments d'ADN sont ensuite dénaturés et fixés sur une membrane de nylon. On ajoute alors une sonde spécifique : un brin d'ADN de séquence connue, marqué par un élément radioactif ; la sonde s'hybride aux segments d'ADN complémentaires. Une autoradiographie révèle la position des fragments qui incluent la séquence sondée. Si la sonde est " monolocus ", c'est-à-dire si elle s'hybride à une séquence présente en un site unique, on obtient, sur un film photographique, deux bandes au plus (les deux allèles). Nous comparons ensuite les deux bandes du suspect aux deux bandes du criminel. La première méthode d'empreinte génétique, mise au point en 1987 par l'Anglais A. Jeffreys, utilisait des sondes multilocus, dont la séquence correspond à plusieurs sites ; on obtenait une multitude de bandes. Les scientifiques préfèrent aujourd'hui les sondes monolocus : les résultats sont plus faciles à interpréter, notamment en cas de mélange de matériels génétiques (viol par exemple). Les techniques évoluent au rythme des progrès de la génétique moléculaire. Ainsi l'amplification des gènes est un outil intéressant Lorsque l'on a peu de matériel : on a obtenu des empreintes génétiques à partir de quelques cellules de la bouche relevées sur des mégots. Les prochains progrès du séquençage procureront encore de nouvelles possibilités. [...] La probabilité pour que deux personnes prises au hasard possèdent un allèle de même longueur est calculée à partir d'études statistiques d'apparition de ces allèles dans la population mondiale : cette probabilité est d'un millionième. Lors d'une identification, nous employons en moyenne cinq sondes successives, de façon à comparer environ dix allèles du suspect avec ceux du criminel. Trouver deux individus de même profil d'ADN devient alors fort improbable (un cas sur un nombre supérieur à la population mondiale).

CHERPIN M.-H.
Les empreintes génétiques des criminels
Dossier Pour la Science - La génétique humaine
Avril 1994
p. 116

Dans quels cas peut-on utiliser l'empreinte génétique lors d'une enquête policière ?
Quelles sont les conditions de validité et les limitations de la méthode ?
Quelles sont les performances de la méthode ?

Dernière modification: 02/07/2006