Viroïdes : Définition et caractéristiques
Contexte
Les viroïdes ont été découverts par le Dr Theodor Diener alors qu’il subissait des efforts pour identifier la cause d’une maladie des tubercules en fuseau de la pomme de terre. Dans un premier temps, on pensait que la maladie était causée par un virus. Des expériences visant à identifier l’hypothétique virus présumé ont donné des résultats inattendus. Les observations ont révélé que la plupart des agents infectieux présents dans les extraits de plantes malades ne sédimentaient pas en un culot lorsqu’ils étaient soumis à une force centrifuge suffisante pour sédimenter tous les virus connus. La centrifugation en gradient de densité et l’électrophorèse sur gel de polyacrylamide ont confirmé que l’agent infectieux était une particule non conventionnelle. Cette particule particulière était sensible au traitement par la ribonucléase (aucune infectivité) et insensible aux traitements par la désoxyribonucléase, le phénol, le chloroforme, le n-butanol ou l’éthanol. En 1967, il devient évident que l’agent de la maladie du fuseau de la pomme de terre n’était pas un virus, le terme « viroïde » a donc été proposé pour cet ARN infectieux libre.
Les viroïdes sont des parasites restreints aux plantes qui pourraient conduire à des conditions provoquant des pertes importantes dans les cultures. Les viroïdes sont constitués d’ARN monocaténaire, circulaire et de faible poids moléculaire (246-496 nt), ils ne possèdent cependant pas d’enveloppe protéique ou membranaire et, compte tenu de leur structure secondaire complexe, ils possèdent des propriétés inhabituelles telles que la résistance à la digestion et à la dénaturation par les ribonucléases. Les viroïdes ne codent aucune protéine pour assurer des fonctions spécifiques, leur mécanisme d’infection systémique est basé sur la séquestration de la machinerie de synthèse des acides nucléiques de la cellule hôte et l’interaction avec des facteurs génétiques de l’hôte, et la réplication autonome par des mécanismes de réplication en cercle roulant (les taux de réplication peuvent dépasser les taux de dégradation).
Les intermédiaires de réplication impliquent des ARNdb et sont traités en trois étapes de base : la synthèse de longues chaînes (unités multiples) médiée par les ARN polymérases ADN-dépendantes de l’hôte, qui sont ensuite transformées en monomères et enfin ligaturées en unités circulaires Référence. Les questions les plus intrigantes qui demeurent concernant les maladies viroïdes sont :1) comment se répliquent-ils de manière autonome dans les plantes hôtes (base moléculaire de la gamme d’hôtes des viroïdes) en échappant aux mécanismes de défense contre l’infection, 2) comment les viroïdes se propagent-ils de manière systémique (quels facteurs de l’hôte participent à des étapes spécifiques du cycle de réplication et du trafic) et 3) comment les viroïdes provoquent-ils des symptômes de la maladie (quelles sont les cibles des déterminants de la pathogénicité des viroïdes) sans coder de protéines.
Schéma de classification
Les analyses comparatives des structures primaires et secondaires ont permis de classer les viroïdes en deux familles ; ces familles présentent des différences significatives dans leurs structures secondaires, leurs voies de réplication et leur localisation subcellulaire
La famille des Pospiviroidae (la plupart des viroïdes) est un acronyme dérivé du viroïde du tubercule en fuseau de la pomme de terre, l’espèce type représentative. Les viroïdes qui appartiennent à cette famille adoptent une structure secondaire en forme de quasi-tige ou de tige, avec des régions d’ARNdb séparées par des boucles internes à chaîne unique non appariées, dans lesquelles on peut distinguer cinq domaines structurels (référence). La région centrale conservée (CCR) qui contient des sites conservés parmi les espèces du même genre, et joue un rôle dans la réplication/le traitement du viroïde, les domaines terminaux gauche et droit (TL, TR) liés à la duplication et au mouvement du viroïde, le domaine variable (V) qui est le plus différent parmi les espèces de viroïdes du même genre, et le domaine de pathogénicité (P) contenant des éléments structurels qui contribuent substantiellement à la régulation de l’expression des symptômes
Au sein de ces domaines, il y en a trois qui sont conservés parmi les espèces : 1) le CCR, formé par deux séries opposées de nucléotides qui sont flanquées de séquences inverses répétées (la branche inférieure et la branche supérieure), 2) la région conservée terminale (TCR), située sur la branche supérieure du domaine terminal gauche, et 3) l’épingle à cheveux conservée terminale (TCH), qui est également située sur le domaine terminal gauche. La séquence de la RCC, et la présence ou l’absence de la RCT et de la TCH (les deux régions ne coexistent pas simultanément) ont permis de regrouper les espèces de viroïdes de cette famille en cinq genres (le type de RCC sert à définir le genre). Les espèces sont principalement définies sur la base de leur structure primaire. Un niveau arbitraire de 90% d’identité de séquence est accepté pour séparer les espèces des souches
Famille des avsunviroidae. Les trois motifs conservés mentionnés ci-dessus ne sont pas présents dans quatre espèces de viroïdes qui appartiennent à la deuxième famille appelée Avsunviroidae, qui porte le nom de l’espèce type, ASBVd. La classification de ces espèces est basée sur la composition G+ C et les prédictions de structure secondaire, sur la morphologie du ribozyme hammerhead (HHRz) et sur l’insolubilité au LiCl. Ces espèces présentent la propriété que les brins des deux polarités peuvent subir un auto clivage par les ribozymes hammerhead, et de plus, deux d’entre elles (ASBVd, PLMVd) adoptent des structures secondaires ramifiées et des éléments de structure tertiaire qui aident à stabiliser la structure.
La classification des viroïdes en deux familles est également un avenant important d’un autre point de vue qui est lié à la réplication. Les membres de la famille Pospiviroidae se répliquent et s’accumulent dans le noyau et le nucléole selon un mécanisme de roulement asymétrique, et les enzymes de l’hôte qui pourraient être impliquées dans la réplication des membres de cette famille sont des enzymes ayant une activité nucléasique spécifiquement des membres de la famille RNase III, une enzyme différente de la seule ligase caractérisée chez les plantes, et l’ADN polymérase ARN-dépendante II ; tandis que les membres de la famille Avsunviroidae se répliquent et s’accumulent dans le chloroplaste et la réplication se déroule via un mécanisme symétrique en cercle de roulement en utilisant une ARN polymérase semblable à la NEP (nucleus-encoded plastid), agissent comme des ribozymes auto-catalytiques réalisées par des motifs hammerhead contenus dans les brins des deux polarités, et ont été postulés comme possédant également la propriété d’auto-ligature
La base de données d’ARN subviral (http://subviral.med.uottawa.ca/cgi-bin/home.cgi ) contient des informations actualisées et elle dispose d’une compilation disponible de quarante-trois génomes complets pour les viroïdes, dont 4700 séquences variantes sont rapportées. La famille Pospiviroidae est représentée par vingt-sept espèces et la famille Avsunviroidae par quatre espèces ; plusieurs autres espèces n’ont pas été classées.
Analyse fonctionnelle du génome
La taille du génome des viroïdes varie entre 246 et 491 nucléotides, mais malgré son génome minimal et l’absence de capacité de codage, ils modulent la réplication et dirigent leur déplacement intracellulaire, intercellulaire et à longue distance. Il est également reconnu qu’ils activent les mécanismes de défense de la plante et que dans la plupart des cas, ces mécanismes de défense sont insuffisants pour éviter l’expression des symptômes. La molécule d’ARN du viroïde a de nombreuses fonctions biologiques associées condensées dans sa courte séquence et, sans coder pour des protéines, le génome d’un viroïde doit exprimer directement des fonctions biologiques. Des études antérieures ont montré que presque tous les nucléotides sont fonctionnels et soumis à la sélection naturelle. Des avancées significatives dans la compréhension des relations viroïdes-hôtes résulteront d’une dissection complète de la fonction des motifs du génome viroïde, et de la compréhension de leur interaction avec des facteurs cellulaires particuliers.
3.1. Pospiviroidae : Domaines conservés, motifs de séquence et épingles à cheveux
Comme nous l’avons vu précédemment, les espèces de type Pospiviroidae adoptent une structure secondaire en forme de bâtonnet. La structure secondaire est devenue évidente après le séquençage de la souche intermédiaire PSTVd (PSTVd-DI), par des prédictions thermodynamiques et par microscopie électronique . Plus tard, cette structure en bâtonnets a été proposée pour la plupart des espèces de Pospiviroidae. La présence de cinq domaines structurels a été révélée en faisant une analyse comparative des séquences.
TR, TL.- Ces domaines sont interchangeables entre les viroïdes et peuvent jouer un rôle dans les réarrangements de l’ARN au cours de l’évolution des viroïdes. Ces domaines sont également impliqués dans le mouvement des viroïdes dans les plantes ; .
TL.- L’extrémité terminale gauche de la plupart des espèces de Pospiviroid et d’Apscaviroid contient une répétition imparfaite ; dans le PSTVd, les séquences respectives sont des nt 341-358 et des nt 2-21. Chaque répétition est un palindrome imparfait qui permet la formation d’une structure en forme de tige ou de Y. Le viroïde de l’irésine (IrVd) ne possède pas cette séquence répétée, il a été proposé que ce viroïde puisse être issu de la délétion d’une des répétitions dans cette région d’un viroïde ancestral. Par mutagenèse dirigée et inoculation médiée par Agrobacterium, les corrélations de cette région avec les premières étapes de la transcription ont été déterminées (.
P (Pathogénicité).- Cette région présente un tronçon d’oligopurine dans le brin supérieur et le tronçon d’oligopyrimidine correspondant dans le brin inférieur de la plupart des pospiviroïdes. Cet appariement résultant constitue une région structurelle qui présente une faible stabilité thermodynamique. Après le séquençage des variants de pathogénicité du PSTVd, seules de légères variations de la séquence dans cette région ont été associées à l’expression des symptômes, et cette région a été nommée VMR (Virulence Modulating Region). Ce domaine est associé à l’expression des symptômes et caractérisé par une séquence oligo (A5-6). La pathogénicité des viroïdes a longtemps été analysée en ce qui concerne la structure unique de l’ARN génomique, à forte paires de bases. Les changements de séquence situés dans ce domaine ont des effets spectaculaires sur l’expression des symptômes du PSTVd ( . Cependant, les changements dans les quatre autres domaines structurels peuvent également avoir des effets significatifs sur le développement des symptômes . Seuls 40 des 359 nucléotides du génome du PSTVd représentent le domaine de modulation de la pathogénicité. Les segments de 40-60 nt dans le brin supérieur et de 200-321 nt dans le brin inférieur, constituent une région partiellement double brin. La liaison de la protéine kinase (PKR) activée par l’ARNdb à la région P a été découverte précédemment comme un événement pathogène primaire. Cependant, des travaux ultérieurs ont dévoilé un scénario plus complexe contrôlé par d’autres déterminants dans les cinq domaines.
CCR.- C’est la région la plus conservée parmi les viroïdes. Ce domaine central conservé est formé par deux tronçons de nucléotides conservés dans les brins supérieur et inférieur, flanqués d’une répétition inversée imparfaite dans le brin supérieur. Ce domaine est crucial pour le mécanisme proposé pour la réplication et le traitement des transcriptions d’ARN PSTVd (+) de longueur supérieure à l’unité. La structure responsable de la transformation est une structure à quatre hélices avec un site de clivage/ligature entre les nucléotides G95 et G96 .
V (Variable).-En tant que región la plus variable, cette région présente la plus grande variabilité de séquence entre les viroïdes étroitement apparentés. Elle contient une boîte G:C avec un minimum de trois paires G:C dont la fonction est encore inconnue. Les limites du domaine V ont été définies par un changement de la faible homologie de séquence avec les domaines C et TR adjacents.
TR.- Les duplications de séquence de l’extrémité terminale droite sur le plus petit variant CCCVd donnent lieu à des molécules plus longues ; ces molécules existent sous des formes dimériques et circulaires. Un petit motif purine/pyrimidine dans ce domaine, qui est conservé chez tous les membres du genre Pospiviroid, a été proposé comme médiateur du transport systémique. À partir de courbes de fusion optique et d’études cinétiques, il a été conclu que les viroïdes se dénaturent à des températures élevées non physiologiques dans une transition hautement coopérative due à la dissociation de la structure native en forme de tige qui permet la formation de structures ramifiées stables. Ces épingles à cheveux stables ne font pas partie de la structure en bâtonnet.
La boucle E.- Au centre du CCR se trouve une boucle interne particulière (98-102, 256-261 PSTVd). Cette boucle présente une homologie avec la boucle E de l’ARN 5S eucaryote. L’irradiation UV directe des feuilles de tomates infectées par le PSTVd et l’analyse de l’ARN ont montré que la boucle E est également formée in vivo. Dans la structure de traitement, le site de clivage est situé à proximité d’une tétralope contenant la séquence phylogénétiquement conservée -GAAA- qui fait également partie de la boucle E.
Le domaine de traitement de la boucle E édite le traitement des viroïdes, avec un ARN linéaire de 148 nucléotides couvrant le cœur du domaine CCR et comprenant une duplication de 17 nucléotides du brin supérieur. Les mutations situées dans ce motif modifient la spécificité de l’hôte ou la pathogénicité du viroïde. Ce motif est impliqué dans les interactions ARN-ARN et ARN-protéine et on le trouve dans un large éventail d’ARN dans la nature. Les sites de clivage dans la structure donnent deux nucléotides 3′ dans chaque brin. Les ARN de classe III montrent une nette préférence pour les substrats ayant une structure secondaire compacte. Les transcrits monomères (+) CEVd qui s’accumulent dans Arabidopsis thaliana ont ces terminaisons (Gas, et al. 2008). La preuve in vitro de sa relation avec le processus de ligature du viroïde pendant la réplication a été obtenue par l’incubation de l’ARN du PSTVd (+) avec une courte répétition du brin supérieur du CCR. En raison de la présence de la forme circulaire, il a été proposé que le clivage enzymatique et la ligature résultent de la séquence conservée – GAAA- (Baumstark, et al. 1997). De manière remarquable, le motif de la boucle E peut également être impliqué dans la spécificité de l’hôte, la pathogénicité du viroïde (Qi et Ding, 2003), et l’accumulation de la progéniture (Zhong, et al. 2006). Il a été reconnu que cette boucle fait partie du site de liaison de deux protéines : le facteur de transcription IIIA qui active la transcription de l’ARNr 5S, et la protéine ribosomique L5 associée au traitement post-transcriptionnel de l’ARN du nucléoplasme au nucléole. Des données récentes ont montré que L5 et TFIIIA d’Arabidopsis thaliana lient l’ARN PSTVd (+) avec la même affinité qu’ils lient leur ARN 5S, alors que l’affinité de l’ARN viroïde chloroplastique est plus faible (Eiras, et al. 2011) ; cependant, la boucle E n’est pas conservée chez tous les membres des Pospiviroidae et il reste à déterminer si des éléments alternatifs ont une fonction similaire.
Hairpin I.-. Chez les pospiviroïdes, les hostuviroïdes et les cocadviroïdes, le brin supérieur du CCR est capable de former une épingle à cheveux thermodynamiquement stable de neuf paires de bases nommée Hairpin I. La boucle de l’épingle à cheveux I a 14-15 nucléotides et c’est une séquence palindrome. Les résultats obtenus dans un système in vivo utilisant des lignées d’Arabidopsis thaliana exprimant des transcrits dimères de CEVd ont révélé que le site de clivage des brins (+) se trouve au niveau du CCR supérieur (Daros et Flores 2004a ; Gas, et al. 2007) dans une position homologue à celle du PSTVd (Baumstark, et al. 1997). Cette séquence conservée a été en outre impliquée dans l’importation du PSTVd dans le noyau (Abraitiene, et al. 2008 ; Zhao, et al. 2001).
Hairpin II.- Ce motif est situé dans le domaine V et TL. L’hélice a une longueur de 11-12 nucléotides et sa composition est riche en contenu G-C. Cette structure est absente dans CCCVd (Hadidi 2003). La mutagenèse dirigée du PSTVd a montré que ce motif est critique pour l’infectivité et qu’il agit comme un élément fonctionnel des intermédiaires de réplication du brin (-) (Loss, et al. 1991 ; Qu, et al. 1993). Sa pertinence fonctionnelle repose sur son rôle critique dans l’infectivité et il est hautement conservé parmi les Pospiviroidae. Le motif de l’épingle à cheveux II est adopté par un repliement séquentiel des intermédiaires du brin (-), et il est essentiel pour son activité de modèle dans la synthèse du brin (+) lors des événements de réplication (Candresse, et al. 2001).
Hairpin III.-. Cette épingle à cheveux n’a été trouvée que dans le PSTVd (Henco, et al. 1979), et un motif épingle à cheveux IV a été identifié dans le CLVd (Owens, et al. 2003), cependant, leurs rôles fonctionnels restent inconnus.
3.2. Avsunviroidae : déterminants de pathogénicité, ribozymes en tête de marteau et éléments de haute structure
ASBVd a été initialement proposé pour se replier dans une conformation allongée (Symons 1981), cependant, des rapports ultérieurs ont montré que le domaine terminal gauche est bifurqué (Gast, et al. 1996). D’autres espèces viroïdes appartenant à cette famille ont également montré des conformations stables prévisibles multibranchées et des preuves de ce type de conformations in vivo (Ambros, et al. 1998 ; Ambros, et al. 1999 ; Pelchat, et al. 2000 ; Rodio, et al. 2006 ; Yazarlou, et al. 2012). L’espèce du genre avsunviroid ne présente pas de similitude de séquence remarquable avec le genre Pelamoviroid ; seules les séquences conservées du HHRz sont partagées. L’ASBVd est un viroïde unique avec une teneur en G-C de seulement ~38% alors que la teneur en G-C du PLMVd est supérieure à 52% (http://www.ncbi.nlm.nih.gov ).
Déterminants du pouvoir pathogène.- En utilisant la génétique inverse, il a été montré que la nature de la séquence tétraloop (qui ferme la tige formée entre les nucléotides 62 et 100) détermine l’expression des symptômes du CChMVd. La tétraline (GAAA) connue comme déterminant asymptomatique et la tétraline (UUUC) reconnue comme effecteur symptomatique représentent les deux exemples majeurs. L’analyse d’une population de clones d’ADNc a montré que les souches symptomatiques présentent une insertion de 12-13 nucléotides par rapport aux souches asymptomatiques. La boucle de nucléotides qui ferme les hélices I et II est située à l’extérieur du HHR et contribue sous sélection à un épissage plus rapide de l’ARN pour permettre un autoclivage catalytique efficace.
Hammerhead Ribozymes.-.L’activité catalytique de ces ARN réside dans la capacité de leurs deux brins de polarité à se replier en structures hammerhead, qui facilitent la scission d’une liaison phosphodiester spécifique par transestérification qui donne des terminaisons 5′-hydroxyle et 2′,2′ phosphodiester cyclique (Hutchins, et al. 1986 ; Prody, et al. 1986). Les HHRzs favorisent l’auto excision en brins de longueur unitaire des intermédiaires multimériques ES (Flores, et al. 2001). Ces ribozymes forment, plutôt que d’être composés par, un noyau central conservé flanqué de trois hélices double-brin (I, II et III), généralement coiffé de courtes boucles (1, 2, 3), ressemblant à un Y dans lequel les hélices II et III sont pratiquement colinéaires (Martick et Scott 2006).
Des études précédentes prédites par des analyses in vitro et in vivo ont confirmé le contact physique entre les boucles 1 et 2 et ont montré que cette interaction est critique à de faibles niveaux physiologiques de Mg2+ (De la Pena et al, 2003 ; Khvorova et al., 2003). On ignore si l’étape de ligature est également médiée in vivo par ces motifs. Des preuves in vitro ont montré qu’ils ont la capacité d’effectuer cette réaction (Przybilski, et al. 2005 ; Przybilski et Hammann 2007a ; Przybilski et Hammann 2007b).
Eléments de haute structure.-. Les covariations entre les boucles en épingle à cheveux de la structure secondaire la plus stable pour la séquence PLMVd ont une interaction potentielle d’appariement de bases entre ces deux épingles à cheveux, suggérant l’adoption au moins dans certaines variantes d’interactions de type kissing-loop (Ambros et Flores 1998 ; Ambros, et al. 1998). De récents sondages in vitro confirment cette interaction (Dube, et al. 2010). Des approches similaires à celles du PSTVd, ont révélé qu’un autre élément de structure tertiaire entre deux nucléotides conservés est situé dans la séquence du brin (+) du PLMVd. Des feuilles infectées par le PLMVd et irradiées par des UV ont confirmé que cet élément de structure tertiaire existe in vivo (Hernandez, et al. 2006), mais son rôle fonctionnel reste inconnu. La forme linéaire monomérique ELVd (+) a le potentiel pour le trafic vers le noyau et ensuite vers les plastes, où la réplication a lieu, ce qui suggère que le trafic pourrait être régulé par un motif ARN restreint au domaine terminal gauche d’ELVd (Pallas, et al. 2012).