Une méthode d'apprentissage profond pour la détection de cibles miARN/isomiR

Nouvelles

MaisonMaison / Nouvelles / Une méthode d'apprentissage profond pour la détection de cibles miARN/isomiR

Jun 23, 2023

Une méthode d'apprentissage profond pour la détection de cibles miARN/isomiR

Scientific Reports volume 12, Numéro d'article : 10618 (2022) Citer cet article 2211 Accès 2 Citations 3 Détails des métriques Altmetric Identification précise des cibles de microARN (miARN) au niveau de la paire de bases

Rapports scientifiques volume 12, Numéro d'article : 10618 (2022) Citer cet article

2211 Accès

2 citations

3 Altmétrique

Détails des métriques

L’identification précise des cibles de microARN (miARN) avec une résolution de paires de bases est un problème ouvert depuis plus d’une décennie. La découverte récente des isoformes de miARN (isomiR) ajoute encore plus de complexité à ce problème. Malgré l’existence de nombreuses méthodes, aucune ne prend en compte les isomiR, et leurs performances sont encore sous-optimales. Nous émettons l'hypothèse qu'en prenant en compte les interactions isomiR-ARNm et en appliquant un modèle d'apprentissage en profondeur pour étudier les caractéristiques de l'interaction miARN-ARNm, nous pourrions améliorer la précision des prédictions des cibles miARN. Nous avons développé un outil d'apprentissage en profondeur appelé DMISO pour capturer les caractéristiques complexes des interactions miARN/isomiR-ARNm. Sur la base d'une validation croisée décuplée, DMISO a montré une précision (95 %) et un rappel (90 %) élevés. Évalué sur trois ensembles de données indépendants, DMISO avait des performances supérieures à cinq outils, dont trois outils conventionnels populaires et deux outils basés sur l'apprentissage en profondeur récemment développés. En appliquant deux stratégies d'interprétation de caractéristiques populaires, nous avons démontré l'importance des régions de miARN autres que leurs graines et la contribution potentielle des motifs de liaison à l'ARN au sein des miARN/isomiR et des ARNm aux interactions miARN/isomiR-ARNm.

Les microARN (miARN) sont des ARN non codants simple brin longs d'environ 22 nucléotides (nt) qui jouent un rôle important dans la régulation des gènes et la progression de la maladie1,2,3,4,5. Au cours de la biogenèse des miARN métazoaires, les gènes des miARN sont transcrits en pri-miARN, qui sont coupés par les enzymes Drosha et DGCR8 pour créer les pré-miARN structurés en épingle à cheveux. Les pré-miARN sont ensuite exportés vers le cytoplasme et traités par l'enzyme Dicer pour produire les miARN duplex. Enfin, les miARN sont matures à partir de l’un ou des deux brins des miARN duplex. Ces miARN matures se lient directement et interagissent avec leurs ARNm cibles dans différents types de cellules via des choix de sites cibles spécifiques au contexte, ce qui entraîne la dégradation et/ou la répression de la traduction des ARNm cibles1,2,3. Il est donc important d’étudier comment les miARN sélectionnent leurs sites cibles et identifient leurs ARNm cibles.

La découverte de différents types d’isoformes de miARN (isomiR) rend l’étude globale des sites cibles et des gènes cibles des miARN plus difficile, tout en étant fascinante6. Au cours de la biogenèse des miARN métazoaires, les isomiR sont créés par le clivage imprécis des pri-miARN et/ou des pré-miARN7, l'ajout/suppression de nt vers/des extrémités des miARN matures8,9 et la modification d'un ou plusieurs nt au milieu. de miARN matures. De manière correspondante, les isomiR résultantes sont classées respectivement en isomiR d’addition, de délétion et polymorphes. Sur la base de l'extrémité modifiée, les isomiR d'addition et de suppression peuvent être regroupées en isomiR 3 'et en isomiR 5'. Les isomiR 3 'sont plus abondants et partagent la même région de graine (positions 2 à 7) que leurs miARN d'origine, tandis que les isomiR 5' ont des régions de graine différentes et donc des ARNm cibles différents. Les isomiR résultants peuvent également être des hybrides des types mentionnés ci-dessus.

Les isomiR répandus dans différents types de cellules appellent à revisiter le problème de sélection du site cible des miARN et d’identification de l’ARNm cible10,11,12,13. Dans n’importe quelle condition expérimentale donnée, il existe probablement divers changements dans la séquence et l’expression des miARN individuels. La diversité implique l’existence de différents isomiR d’abondance variée et de miARN conventionnels interagissant activement avec leurs gènes cibles respectifs dans des conditions expérimentales. Des études antérieures ont montré qu'un tel mélange de miARN et de leurs isomiR dans des conditions expérimentales spécifiques est courant au lieu d'artefacts de séquençage14,15. Les méthodes et outils disponibles pour la prédiction des cibles miARN ne prennent en compte que les interactions miARN-ARNm, ce qui peut, sans le savoir, prendre en compte les interactions isomiR-ARNm pour les interactions miARN-ARNm lors de l'entraînement et ainsi entraîner des taux de faux positifs élevés et des performances sous-optimales16,17. Il est donc essentiel d’étudier ensemble les isomiR et les miARN pour identifier leur site cible et leur ARNm cible.

 95%) miRNAs. Moreover, this choice enabled enough data for training the deep learning models. We allowed a maximum gap or distance of 4 nt between the mapped miRNA portion and the mapped mRNA portion in a chimeric read as previously18. The miRNA and mRNA portion of a chimeric read may be mapped to multiple miRNA and mRNA transcripts, respectively. If a read was mappable to multiple miRNA or mRNA transcripts, to retain the most significant miRNA–mRNA pair, we used the following criteria in order: (1) the pair with the smaller BLAST e-values; and (2) the pair with the larger BLAST bit scores if the e-values were the same./p>