banner

Nouvelles

Sep 14, 2023

Variation du nombre de copies

Communications Biology volume 6, Article number: 189 (2023) Citer cet article

733 accès

2 Altmétrique

Détails des métriques

Les variations du nombre de copies (CNV) sont depuis longtemps reconnues comme des facteurs pathogènes des cardiopathies congénitales (CHD). Peu de CNV associés à CHD pourraient être interprétés comme un effet de dosage en raison de la perturbation des séquences codantes. De nouvelles preuves ont mis en évidence les rôles régulateurs des longs ARN non codants (ARNlnc) dans le développement cardiaque. Considérant qu'il reste inexploré si les lncARN dans les CNV (CNV-lncRNA) pourraient contribuer à l'étiologie des CNV associés à la CHD. Ici, nous avons construit des réseaux de coexpression impliquant des CNV-lncRNA dans les CNV associés à la CHD et les gènes codant pour les protéines en utilisant les données transcriptomiques du développement des organes humains, et avons montré que les CNV-lncRNA dans 10 des CNV non syndromiques associés à la CHD se sont regroupés dans le module corrélé cardiaque le plus significatif, et avait une coexpression hautement corrélée avec plusieurs gènes clés de CHD. HSALNG0104472 dans la région 15q11.2 a été identifié comme un hub CNV-lncRNA avec une expression biaisée par le cœur et validé expérimentalement. Nos résultats indiquent que HSALNG0104472 devrait être un effecteur principal responsable des anomalies cardiaques de la délétion 15q11.2 en régulant la différenciation des cardiomyocytes. Nos résultats suggèrent que les CNV-lncRNA pourraient potentiellement contribuer aux pathologies d'une proportion maximale de 68,4 % (13/19) des NVC non syndromiques associés à une maladie coronarienne. Ces résultats ont indiqué que l'explication de la pathogenèse des CNV associés à la CHD devrait tenir compte des régions non codantes.

La cardiopathie congénitale (CHD) est l'anomalie congénitale la plus courante dans le monde, avec une incidence de 6 à 13 sur 1000 naissances vivantes1,2,3. Malgré les progrès de la correction chirurgicale et des soins cliniques garantissant que la plupart des patients survivent jusqu'à l'âge adulte, la maladie coronarienne reste une cause majeure de mortalité liée aux nouveau-nés. Les étiologies de CHD étaient multifactionnelles. À ce jour, environ 20 à 30 % des cas de coronaropathie pourraient être identifiés avec des facteurs environnementaux ou génétiques, bien que ce nombre puisse changer avec l'application à grande échelle de nouvelles méthodes de test telles que le séquençage de nouvelle génération (NGS)4,5. La plus grande étude de séquençage de nouvelle génération de la cohorte CHD a indiqué que les étiologies génétiques pouvaient être identifiées pour 1/3 des patients atteints de CHD ; les variants de novo (DNV) et les variants autosomiques récessifs héréditaires représentent respectivement 8 % et 2 % des patients6. Les variations du nombre de copies (CNV) sont des sources importantes d'étiologies génétiques de CHD. Des NVC pathogènes ont été enregistrés dans 3 à 25 % des cas de coronaropathie syndromique et 3 à 10 % des cas isolés de coronaropathie4. La pathogénicité des CNV impliquant des séquences codantes était généralement interprétée en fonction de leur effet sur le dosage des gènes. Malgré le succès d'une telle stratégie dans de nombreuses maladies, les pathologies de la plupart des NVC associés à une maladie coronarienne sont restées indéterminées4,5,7.

L'organogenèse du cœur est un processus complexe impliquant la différenciation, la spécification et la migration de plusieurs lignées cellulaires, ce qui nécessite des réseaux de régulation génétique élaborés initialisés et régis par des facteurs de transcription (TF) déterminant la lignée centrale, notamment NKX2-5, MESP1, GATA4, GATA6 et TBX55. . Au cours des deux dernières décennies, de nombreuses études ont révélé qu'une grande partie du génome non codant (les transcrits primaires et les transcrits traités couvrent respectivement 74,7 % et 62,1 % du génome humain) était transcrite8. Les ARN longs non codants (lncRNA), qui sont définis comme des transcrits de plus de 200 nucléotides sans potentiel de codage, apparaissent comme des composants clés dans les réseaux de régulation des gènes contrôlant le destin cellulaire au cours du développement8,9. Depuis que l'ARNlnc Braveheart (Bhvt) associé au développement cardiovasculaire a été découvert chez la souris10, des dizaines d'ARNlnc tels que Fendrr11, Chast12, HBL113, Uph14, Hdn15, BANCR16 et lncExACT117 se sont avérés impliqués dans les processus de développement cardiaque dans des modèles cellulaires et animaux. La CHD se caractérise par sa grande hétérogénéité génétique, ce qui a rendu la découverte d'ARNlnc pathogéniques extrêmement difficile. Pourtant, bénéficiant des preuves accumulées qui ont établi l'association robuste des CNV avec CHD, les CNV pathogènes récurrents ont fourni une source naturelle pour lier les lncRNA aux phénotypes de la maladie.

La plupart des CNV affectent les régions génomiques englobant les lncARN. La contribution des lncRNAs dans la pathogenèse liée à la CNV a été impliquée dans plusieurs études neurologiques. Meng et al. ont étudié les lncARN dans 10 régions de CNV associées au risque de schizophrénie et ont identifié le DGCR5 dans 22q11.2 comme un gène central régulant les gènes liés à la schizophrénie18. Alinejad-Rokny et al. ont identifié 47 NVC récurrents associés à des troubles du spectre autistique et ont montré que les gènes codants enrichis dans le cerveau et les lncARN étaient surreprésentés dans ces régions19. Récemment, une étude de séquençage du génome entier basée sur un trio de 749 proposants CHD a démontré un enrichissement des variantes de novo réglementaires non codantes (DNV) potentiellement perturbatrices, ce qui a souligné l'importance des variations non codantes dans l'étude CHD. Meerschaut et al. ont effectué une réévaluation rétrospective de 138 CNV avec une pathogénicité inconnue et ont proposé la pertinence potentielle des éléments de régulation des gènes non codants dans la pathogenèse de la coronaropathie liée aux CNV21. Considérant que, les contributions des lncRNAs situés dans les régions CNV (CNV-lncRNAs) aux étiologies de CHD n'ont pas été systématiquement évaluées.

Nous avons émis l'hypothèse que les CNV associés à CHD pourraient perturber certains, sinon tous, des CNV-lncRNA, ce qui dérèglerait par conséquent leurs gènes cibles et contribuerait aux étiologies de CHD. Pour tester notre hypothèse, nous avons résumé les CNV récurrents associés à la CHD et récupéré les CNV-lncRNA candidats situés dans ces régions. Le profil de coexpression intégré de ces CNV-lncARN et des gènes codant pour les protéines a été construit sur la base d'une analyse pondérée du réseau de coexpression génique (WGCNA)22 des données transcriptomiques du développement des organes humains de LncExpDB23. Nous avons identifié deux modules significativement corrélés avec les tissus cardiaques, dont l'un a montré un enrichissement des gènes CHD connus. Il a été remarqué que les CNV-lncRNA de 52,6 % (10/19) de tous les CNV associés à une maladie coronarienne non syndromique se sont regroupés dans le module cardiaque le plus significatif. Le hub CNV-lncRNA HSALNG0104472 de ce module était situé dans la région 15q11.2, dont la suppression s'était précédemment avérée associée à une connexion veineuse pulmonaire anormale totale (TAPVC)24. Nous avons ensuite mené des expériences in vitro pour valider l'effet régulateur potentiel de HSALNG0104472 sur les gènes CHD connus et mis en évidence son rôle potentiel dans le développement cardiaque (Fig. 1).

a 19 CC non syndromiques récurrentes et 21 CC syndromiques associées NVC ont été résumées. Nous avons récupéré les CNV-lncARN candidats qui étaient situés dans ces régions et exprimés au cours du développement cardiaque sur la base des données transcriptomiques de développement des organes humains (n ​​= 313) de LncExpDB. b Une analyse pondérée du réseau de coexpression génique (WGCNA) a été réalisée pour caractériser le profil de coexpression des CNV-lncRNA et des gènes codant pour les protéines sur la base des données transcriptomiques du développement des organes humains. Des analyses en aval, y compris des analyses de voies, des analyses d'enrichissement et des analyses d'expression différentielle, ont été effectuées pour identifier les modules associés à la CHD et les CNV-lncRNA hub. Des réseaux de régulation CNV-lncRNA-miARN-ARNm ont également été identifiés sur la base des données d'interaction des miARN et du mécanisme moléculaire de l'ARN endogène (ARNce) concurrent. c Les relations de coexpression dans le module noir non syndromique associé au cœur ont été validées sur la base d'ensembles de données de différenciation des cardiomyocytes in vitro (n = 297) de LncExpDB. d L'analyse du poids relatif (RWA) a révélé des rôles importants du moyeu CNV-lncRNA HSALNG0104472 dans la régulation de plusieurs gènes clés de CHD. e Des expériences in vitro ont été réalisées pour valider la régulation prédite du hub CNV-lncRNA HSALNG0104472.

Au total, 19 CNV, dont deux délétions, six duplications et 11 délétions/duplications, ont été définies comme des NVC non syndromiques récurrents associés à une maladie coronarienne (Fig. 2a ; Tableau 1 ; Fig. 1a supplémentaire ; et Tableau supplémentaire 1)25,26,27,28, 29,30. Un total de 568 candidats CNV-lncRNA répondant au critère ainsi que 19957 gènes codant pour les protéines ont été utilisés pour une enquête plus approfondie (Données supplémentaires 1). Nous avons également étendu notre analyse à 21 CNV associés à une maladie coronarienne syndromique4 (tableau supplémentaire 2). En comparaison, la plupart des CNV syndromiques associés à la CHD (19/21) étaient des délétions, et les 2 autres CNV pouvaient être soit une délétion, soit une duplication (Fig. 1b supplémentaire; Tableau supplémentaire 2). Quatre CNV (délétion/duplication 1q21.1, délétion/duplication 8p23.1, délétion/duplication 16p12.2 et délétion/duplication 22q11.21) étaient associées à des cas de coronaropathie non syndromiques et syndromiques (Fig. 2a).

a La distribution des NVC associées récurrentes non syndromiques (n = 19) et syndromiques (n = 21) sur les chromosomes humains est indiquée. Les couleurs des bandes représentent les types de cas de coronaropathie dans lesquels des NVC ont été signalés. Les couleurs des polices représentent les types CNV. b Des modules de coexpression positivement corrélés au cœur (r> 0, 6, n = 2) (les modules noir et vert foncé) construits avec un ensemble de données de développement d'organes humains (n ​​= 313) ont été identifiés (données supplémentaires 1). L'axe y représente différents modules de coexpression CNV-lncRNA. Les valeurs du coefficient de corrélation de Pearson (r) avec le tissu cardiaque sont indiquées sur l'axe des x. Les lignes pointillées rouges indiquent |r| = 0,6. Les tailles des nœuds représentent le nombre de CNV-lncRNA dans chaque module. Les couleurs des nœuds représentent les valeurs de −log10(Padj). La valeur P ajustée a été calculée avec la fonction corPvalueStudent dans le package WGCNA R. c Les annotations fonctionnelles des modules de coexpression positivement corrélés au cœur sont présentées (Données supplémentaires 2). Les barres horizontales représentent les termes GO et les couleurs des barres représentent différents modules de coexpression CNV-lncRNA. Pour chaque module positivement corrélé au cœur, les cinq principaux termes GO (classés par Padj) sont répertoriés sur l'axe y. Les valeurs de −log10(Padj) sont indiquées sur l'axe des x. La ligne pointillée rouge indique un Padj de 0,05. d Classifications des CNV-lncRNAs dans le module noir. Les comptages pour chaque classe de CNV-lncARN sont indiqués entre parenthèses. e Conservation de la séquence des CNV-lncARN dans le module noir (Données supplémentaires 3).

WGCNA a été réalisée sur les données transcriptomiques de développement d'organes humains de LncExpDB pour construire des modules de coexpression impliquant des candidats CNV-lncRNA associés à une CHD non syndromique et des gènes codant pour des protéines. Nous avons identifié un total de 43 modules de coexpression, dont 34 contenaient 511 des 568 candidats CNV-lncRNA. Les 57 candidats CNV-lncRNA restants ne se sont regroupés dans aucun module de coexpression (Données supplémentaires 1). De plus, 13 modules contenaient au moins un hub CNV-lncRNA avec appartenance au module (MM) ≥ 0,8 et P < 0,05 (Données supplémentaires 1). Nous avons ensuite calculé les coefficients de corrélation de Pearson entre les modules et les tissus cardiaques (les informations sur les traits quantifiés des échantillons sont répertoriées dans les données supplémentaires 1) et avons révélé que deux modules (noir et vert foncé) présentaient une corrélation positive significative (r > 0,6, P < 0,05 ; figure 2b).

Les gènes codant pour les protéines dans deux modules de coexpression corrélés au cœur ont été utilisés pour mettre en œuvre des analyses d'enrichissement fonctionnel avec les voies Gene Ontology (GO) et Kyoto Encyclopedia of Genes and Genomes (KEGG). De manière notable, le module noir, qui était le plus significativement corrélé au cœur (r = 0,88, P = 3,20 × 10−104), était lié au processus du système musculaire (Padj = 3,35 × 10−47, Padj représente la valeur P ajustée), le muscle contraction (Padj = 3,55 × 10−42), processus cardiaque (Padj = 1,14 × 10−33), contraction cardiaque (Padj = 1,14 × 10−33) et développement du tissu musculaire (Padj = 3,04 × 10−32) (Fig. .2c). Ces gènes étaient également enrichis dans les voies KEGG de la cardiomyopathie hypertrophique (Padj = 7,62 × 10−13), de la cardiomyopathie dilatée (Padj = 1,87 × 10−12), de la contraction du muscle cardiaque (Padj = 1,15 × 10−9), de la signalisation adrénergique dans les cardiomyocytes (Padj = 4,24 × 10−9) et cardiomyopathie ventriculaire droite arythmogène (Padj = 3,97 × 10−7) (Données supplémentaires 2). Valeurs d'expression moyennes des CNV-lncRNA dans les échantillons de développement cardiaque (n = 50) pour le module noir également classé au premier rang des 34 modules contenant des CNV-lncRNA (classé 3e sur 34, tpm moyen = 7,17 ; Données supplémentaires 1). Sur la base des emplacements génomiques par rapport aux gènes codant pour les protéines voisines, les lncARN pourraient être classés comme intergéniques, introniques (sens), introniques (antisens), chevauchants (sens), chevauchants (antisens), sens et antisens31. Les lncRNA sens, intergéniques et antisens représentaient la plupart des CNV-lncRNA (28/30) dans le module noir (Fig. 2d). La conservation de la séquence de 30 CNV-lncARN dans le module noir a été identifiée selon les données d'alignement de LncBook v2.032 (Fig. 2e; Données supplémentaires 3). Une forte proportion de CNV-lncARN contenus dans le module noir était fortement corrélée à plusieurs gènes CHD bien caractérisés tels que HAND1, HAND2, NKX2-5, TBX5, GATA6 et MYH6 (Fig. 3a). Ces lncARN se répartissaient dans 52, 6% (10/19) des NVC non syndromiques récurrents associés à une maladie coronarienne (Fig. 3a). En outre, les corrélations des modules avec le stade de développement et le sexe ont également été calculées (Fig. 2 supplémentaire et données supplémentaires 1, 2). Selon le locus génomique des CNV-lncRNA et les enregistrements de CNV associés à une CHD non syndromique spécifique, qui incluaient le phénotype des patients, nous avons identifié 34 associations potentielles entre les CNV-lncRNA et les sous-types de CHD dans le module noir (Fig. 3b et données supplémentaires 4 ).

a Les CNV associés non syndromiques (n = 19), les CNV-lncARN co-exprimés (n = 30, répartis dans 10 CNV) et 12 gènes CHD dans le module noir corrélé au cœur sont représentés dans le graphique circos. Les couleurs des CNV représentent les types de CNV. Les couleurs des lignes représentent le coefficient de corrélation de Pearson (calculé avec un ensemble de données de développement d'organes humains, n = 313) de chaque paire de gènes. Deux CNV-lncRNA hub dans le module noir sont en caractères gras. b Corrélations entre les CNV-lncRNA et les sous-types CHD dans le module noir. Ces relations sont identifiées sur la base de l'intersection des CNV-lncRNA et des CNV non syndromiques associés à la CHD (Données supplémentaires 4).

Pour étudier l'association potentielle entre les modules de coexpression corrélés au cœur et la CHD, nous avons effectué des tests hypergéométriques pour des analyses d'enrichissement de ces modules par rapport à quatre listes de gènes liés à la CHD (Données supplémentaires 5) : un ensemble de 22 gènes responsables de causes monogéniques de CHD isolée, un ensemble de 69 gènes associés à des conditions monogéniques avec CHD5 syndromique, un ensemble de 66 gènes avec des variantes de perte de fonction (LOF) pour CHD et un ensemble de 80 gènes avec des variantes faux-sens dommageables (DMV) pour CHD27. Les résultats ont indiqué que deux modules (noir : P = 2,12 × 10−11 et saumon : P = 0,04) ont été enrichis pour les gènes CHD isolés ; deux modules (turquoise : P = 3,97 × 10−6 et blanc : P = 0,03) ont été enrichis pour les gènes CHD syndromiques ; trois modules (rose : P = 2,94 × 10−5, noir : P = 1,34 × 10−3 et turquoise : P = 6,27 × 10−3) ont été enrichis pour les gènes LOF CHD, et cinq modules (noir : P = 5,62 × 10−5, rose : P = 3,02 × 10−3, turquoise : P = 5,35 × 10−3, orange : P = 6,78 × 10−3 et orange foncé : P = 0,05) ont été enrichis en gènes DMV CHD ( Données supplémentaires 5). Il est particulièrement intéressant de noter que les modules noir et turquoise ont considérablement enrichi respectivement trois des quatre ensembles de gènes CHD (Fig. 4a – d et données supplémentaires 5). De plus, nous avons constaté qu'un certain nombre de voies, liées au développement du cœur, étaient significativement enrichies en modules noirs et turquoises, suggérant une relation importante entre ces modules et le développement du cœur (Fig. 4e et Données supplémentaires 2).

Deux modules associés au cœur, noir et turquoise, qui ont considérablement enrichi trois des quatre ensembles de gènes CHD sont présentés. Les gènes Hub CNV-lncRNA et CHD dans les modules de coexpression noir (a) et turquoise (b) sont répertoriés (Données supplémentaires 1 et 5). Hub CNV-lncRNAs sont mis en évidence avec un bord rouge. Les sous-ensembles de gènes CHD sont indiqués dans différentes couleurs. Les tailles des nœuds représentent la valeur d'appartenance au module de gène (MM) dans le module correspondant (Données supplémentaires 5). Le test hypergéométrique a été utilisé pour calculer la signification statistique de l'enrichissement des gènes codant pour les protéines coexprimées dans les modules noir (c) et turquoise (d) par rapport à quatre ensembles de gènes CHD. Les ensembles de gènes CHD sont indiqués dans différentes couleurs. Un enrichissement significatif (PH < 0,05, PH représente la valeur P hypergéométrique) a été montré avec la valeur PH en rouge. Les gènes codant pour les protéines qui sont allés pour WGCNA (n = 19 957) ont été utilisés comme liste de gènes de fond. e Voies liées au développement cardiaque dans les modules noir et turquoise (Données supplémentaires 2). L'axe horizontal représente les termes GO. Les couleurs des points indiquent différents modules. La taille des points représente le nombre de gènes de chaque module impliqué dans les termes GO correspondants. Les valeurs de −log10(Padj) sont indiquées sur l'axe des x. La ligne pointillée rouge indique un Padj de 0,05.

L'ARN endogène concurrent (ARNce) a été reconnu comme un mécanisme moléculaire important sous-jacent à l'expression de l'ARNm régulé par l'interaction lncARN-miARN. Auparavant, nous avons identifié avec succès des réseaux de régulation lncRNA-miARN-ARNm dans les tissus cardiaques de patients atteints de tétralogie de Fallot33 en mettant en œuvre une méthode d'inférence causale34. Dans la présente étude, nous avons également appliqué cette analyse aux données transcriptomiques du développement des organes humains (n ​​= 313). Un total de 10 CNV-lncARN centraux médiant les réseaux d'ARNc ont été identifiés (Fig. 3 supplémentaire; Données supplémentaires 6). Ces CNV-lncRNA distribués dans le module jaune (HSALNG0063477), le module turquoise (HSALNG0112753, HSALNG0044817, HSALNG0006725), le module grey60 (HSALNG0022874), le module bleu (HSALNG0110179) et le module orange (HSALNG0022140). HSALNG0096627, HSALNG0019873, HSALNG0044901 ne se sont regroupés dans aucun module de coexpression et ont été étiquetés en gris. Considérant qu'aucun des gènes CHD connus n'était impliqué dans ces réseaux d'ARNc. De plus, les CNV-lncRNA et les ARNm, qui partageaient une relation régulatrice éponge lncRNA-ARNm, étaient rarement distribués dans le même module de coexpression (Données supplémentaires 1 et 6).

La coronaropathie est fréquemment survenue sous forme de syndrome, et une contribution génétique partagée a été découverte pour la coronaropathie et d'autres anomalies, en particulier les troubles neurodéveloppementaux. Nous avons remarqué que parmi les gènes CHD non syndromiques et syndromiques (n = 88 ; données supplémentaires 7), 13,6 % (12/88) présentaient une expression maximale dans les tissus cardiaques. Étonnamment, 33,0 % (29/88) ont montré une expression maximale dans les tissus du cerveau et du cervelet (cerveau : 19, cervelet : 10, données supplémentaires 7). Des analyses d'expression différentielle ont été effectuées pour ces gènes CHD et ont impliqué des CNV-lncRNA entre des échantillons de développement cardiaques (n = 50) et cérébraux (n = 87) (Fig. 4 supplémentaire). Nous avons trouvé 21 gènes régulés positivement par le cœur (| log2FoldChange | ≥ 1, Padj < 0, 05) et 8 gènes régulés positivement par le cerveau dans la liste connue des gènes CHD (Fig. 5a-c; Données supplémentaires 7).

Les gènes CHD régulés positivement (|log2FoldChange| ≥ 1, Padj < 0,05) dans les échantillons de développement du cœur (21 gènes) et du cerveau (8 gènes) (échantillons de cœur : n = 50, échantillons de cerveau : n = 87) sont présentés dans la carte thermique (a) . Pour chaque cluster, les termes GO Biological Process et Padj statistiquement enrichis sont affichés sur le panneau. Les diagrammes circulaires montrent le type de CHD lié à chaque groupe de gènes CHD exprimés de manière différentielle (b). Les principaux gènes CHD exprimés de manière différentielle (c) et les CNV-lncRNA (d) pour chaque groupe sont étiquetés dans des parcelles de volcan (classées par log2FoldChange). Les axes x et y représentent respectivement log2FoldChange (cœur vs cerveau) et −log10(Padj). Les points rouges représentent des gènes significativement régulés positivement dans le cœur (log2FoldChange ≥ 1, Padj < 0,05). Les points bleus représentent des gènes significativement régulés positivement dans le cerveau (log2FoldChange ≤ -1, Padj < 0,05). Les points gris représentent les gènes qui ne sont pas exprimés de manière différentielle. La ligne pointillée rouge horizontale et verticale indique Padj = 0,05 et |log2FoldChange| = 1, respectivement. Les diagrammes circulaires à côté de chaque groupe montrent la distribution des gènes dans les modules de coexpression construits par WGCNA syndromique. Seuls les modules avec la proportion de gènes la plus élevée de chaque cluster sont colorés.

Nous avons en outre incorporé 21 CNV associés à une maladie coronarienne syndromique pour une analyse comparative (tableau supplémentaire 2). Avec les mêmes critères que l'analyse précédente, 1500 CNV-lncRNAs ont été sélectionnés pour WGCNA avec les 19957 gènes codant pour la protéine (Données supplémentaires 1). Des modules respectifs pour les CC syndromiques et non syndromiques ont été identifiés (Données supplémentaires 8). Nous avons ensuite testé la corrélation entre les modules syndromiques et sept organes. Le module brun syndromique (r = 0,73) avec 57 CNV-lncARN et le module magenta (r = 0,71) avec 28 étaient fortement corrélés avec le cerveau, et le module vert syndromique (r = 0,87) avec 120 CNV-lncARN était fortement corrélé avec le cervelet (Fig. 6 et données supplémentaires 8). Le module jaune syndromique (s-jaune) doit correspondre au module noir non syndromique : (1) Le module s-jaune a montré les corrélations les plus élevées avec le tissu cardiaque (r_heart = 0,83) (Figs. 2, 6) ; (2) La plupart (84,89%, 579/682) des gènes du module noir non syndromique sont apparus dans le module s-jaune (Données supplémentaires 8); (3) Les gènes de deux modules ont été enrichis dans les mêmes fonctions (Données supplémentaires 8). Les types de gènes et la conservation de la séquence des CNV-lncARN dans les modules s-jaune et s-turquoise ont été identifiés (Figs. 5 et 6 supplémentaires; et Données supplémentaires 1 et 3). Une analyse d'expression différentielle a également été réalisée pour 1500 CNV-lncARN entre les échantillons de cœur et de cerveau. Nous avons trouvé 221 CNV-lncRNA régulés positivement par le cœur (|log2FoldChange| ≥ 1) et 205 CNV-lnc régulés positivement par le cerveau. (Fig. 5d et données supplémentaires 7). Pour étudier plus avant la relation entre les maladies coronariennes et les troubles neurodéveloppementaux, nous avons décrit la distribution des gènes représentatifs liés aux troubles du spectre autistique35 et testé leur enrichissement dans les modules syndromiques WGCNA. Les résultats ont indiqué que les gènes codant pour les protéines dans les modules syndromiques turquoise (P = 7,66 × 10−14), brun (P = 9,18 × 10−7) et mediumpurple3 (P = 6,96 × 10−4) étaient significativement enrichis dans le spectre de l'autisme gènes liés au trouble (données supplémentaires 9). Il était intéressant de noter que le module turquoise non syndromique (correspondant à la s-turquoise) enrichit de manière significative les ensembles de gènes de CHD et de troubles du spectre autistique (Fig. 4d et données supplémentaires 5 et 9). Ce module contenait une proportion élevée de CNV-lncRNA régulés à la hausse dans le cerveau et de gènes CHD syndromiques, qui étaient liés au développement de plusieurs systèmes et au maintien de la population de cellules souches (Fig. 5 et données supplémentaires 7).

Le coefficient de corrélation de Pearson (r) entre 45 modules de coexpression et les traits d'échantillon (types de tissus) a été calculé dans le WGCNA syndromique (données supplémentaires 8). Seules les corrélations significatives (|r| > 0,6, Padj < 0,05) sont étiquetées. Les couleurs représentent la valeur et la direction du coefficient de corrélation. **Padj < 0,01.

Selon les analyses ci-dessus, HSALNG0104472 a été identifié comme un hub CNV-lncRNA (valeur d'appartenance au module du module noir non syndromique = 0,83 ; données supplémentaires 1) dans le module noir non syndromique corrélé au cœur (Fig. 2b), et a montré la plupart expression biaisée dans les échantillons de cœur par rapport aux échantillons de cerveau (Fig. 5d et données supplémentaires 7). L'analyse du poids relatif (RWA) a également révélé son rôle important dans la régulation de plusieurs gènes clés de CHD (Fig. 7a et données supplémentaires 10). De plus, la plupart de ces relations de coexpression entre les gènes HSALNG0104472 et CHD ont également été observées dans les cellules souches pluripotentes induites (iPSC) sur la base d'ensembles de données de différenciation des cardiomyocytes in vitro (n = 297) (Fig. 7b; Fig. 7 supplémentaire; et Données supplémentaires 11).

a Le poids relatif des CNV-lncRNA (n = 30) par rapport aux principaux gènes CHD dans le module noir non syndromique est indiqué (Données supplémentaires 10). Les valeurs du poids relatif remis à l'échelle (en pourcentage de la variance prédite dans la variable critère attribuée à chaque prédicteur, dans les limites de l'erreur d'arrondi des poids remis à l'échelle des prédicteurs dans une somme de test à 100 %) sont indiquées sur l'axe y, qui représentent l'effet réglementaire. La valeur d'expression moyenne (transcriptions par million, tpm) des CNV-lncRNA dans les échantillons cardiaques en développement (n = 50) est indiquée sur l'axe des x. Les lignes pointillées rouges indiquent la valeur moyenne de chaque axe. Les points rouges représentent des prédicteurs significatifs. Les points gris représentent des prédicteurs non significatifs. b Modèles d'expression de HSALNG0104472 et 8 gènes CHD régulés prédits dans le module noir non syndromique lors de la différenciation in vitro des iPSC humains en cardiomyocytes (n = 297) (Données supplémentaires 11). Les axes x et y représentent le stade de différenciation des cardiomyocytes (jour) et la valeur d'expression moyenne (tpm) de chaque stade, respectivement. La ligne centrale représente une valeur médiane. Les limites de la boîte représentent les quartiles supérieur et inférieur. Les moustaches représentent 1,5x l'intervalle interquartile. Les points représentent les valeurs aberrantes.

La surexpression et l'inactivation de HSALNG0104472 ont été réalisées dans la lignée cellulaire de cardiomyocytes humains adultes (AC16). Nos résultats suggèrent que l'inactivation de HSALNG0104472 affecte de manière significative l'expression de 1310 gènes codant pour les protéines (|log2FoldChange| ≥ 1, Padj <0,05), qui sont enrichis dans des voies telles que la régulation du développement vasculaire et la régulation de l'angiogenèse (Données supplémentaires 12). Néanmoins, aucun des gènes CHD, qui devaient être régulés par les CNV-lncRNA, n'apparaissait dans la liste des gènes d'expression différentielle (Données supplémentaires 12). En outre, la surexpression de HSALNG0104472 n'a pas montré d'effet significatif sur l'expression génique dans les cellules AC16 (Fig. 8 supplémentaire).

L'inactivation réussie du shRNA de HSALNG0104472 a été réalisée dans des iPSC, et l'expression de NKX2-5, ACTC1 et TBX20 a été significativement régulée à la baisse (Fig. 9a supplémentaire et données supplémentaires 13). Une apparition retardée de cardiomyocytes battants a été observée dans les CSPi HSALNG0104472-knockdown induits in vitro (au jour 9) par rapport aux groupes témoins (au jour 7) (Fig. 10 supplémentaire). Le shRNA-knockdown de HSALNG0104472 dans les iPSC a affecté de manière significative le comportement de battement des cardiomyocytes différenciés (au jour 18). La fréquence de battement du groupe renversé était de 24 fois par minute contre 57 fois par minute dans le groupe témoin. (Film supplémentaire 1 et 2). Une régulation négative significative de GATA6 a été détectée (Fig. 9b supplémentaire et données supplémentaires 13). L'effet knock-down de HSALNG0104472 sur la différenciation des cardiomyocytes a été validé par la transduction d'un Smart Silencer contenant de petits ARN interférents et des oligonucléotides antisens dans des iPSC après induction de la différenciation des cardiomyocytes (Fig. 8a). L'analyse par cytométrie en flux à l'aide du marqueur cardiomyocyte cardiaque troponine T (cTnT) a indiqué que l'inactivation de HSALNG0104472 réduisait de manière significative l'efficacité de la différenciation des cardiomyocytes (P = 0, 006; Fig. 8b, Fig. 11 à 16 supplémentaires et Données supplémentaires 13). Nous avons également validé l'effet HSALNG0104472-knockdown dans les cardiomyocytes différenciés (au jour 18) par transfection transitoire. Le dosage immunofluorescent des cardiomyocytes a indiqué une réduction de la troponine cardiaque I (cTnI) et l'absence de sarcomère myocardique mature résultant de la réduction de HSALNG0104472 (Fig. 8c).

a Pour les groupes knockdown et contrôle HSALNG0104472, 3 points dans le temps au cours de la différenciation des CSPi humains en cardiomyocytes ont été capturés. Barre d'échelle, 40 μm. b Pour les groupes de knockdown et de contrôle HSALNG0104472, la quantification des cardiomyocytes (au jour 8 après l'induction) contenant de la troponine T cardiaque (cTnT) est indiquée (Figs. 11 à 16 supplémentaires et données supplémentaires 13). Les barres d'erreur montrent la moyenne ± SD de trois expériences biologiquement indépendantes. Le test t de Student bilatéral a été utilisé pour la comparaison entre deux groupes. **P < 0,01. c Immunofluorescence de marqueurs de sarcomères cardiaques dans les cardiomyocytes induits. DAPI (bleu), cTnl (rouge) et α-Actinine (vert). Barre d'échelle, 15 μm. troponine I cardiaque cTnl.

Les NVC étaient reconnues depuis longtemps comme des causes importantes de coronaropathie. Étant donné que les CNV varient considérablement en taille et présentent toujours de multiples effets phénotypiques, l'identification du gène pertinent ou de l'intervalle critique d'un CNV pathogène spécifique pour la maladie coronarienne restait difficile4. Dans les applications cliniques, une idée naturelle pour interpréter la pathogénicité des CNV serait les effets de dosage des gènes résultant de la perturbation des séquences codantes. Malheureusement, jusqu'à présent, seuls 2 (22q11.2 : TBX1 et 8p23.1 : GATA4) des 19 NVC non syndromiques avaient été documentés comme contenant un gène pertinent codant pour une protéine responsable de malformations cardiaques (Tableau 1). De toute évidence, une telle stratégie consistant à identifier des gènes codant pour des protéines sensibles à la dose serait loin d'être suffisante pour élucider les étiologies des maladies coronariennes causées par les CNV.

Les régions codant pour les protéines n'occupent que ~ 2% du génome humain. En revanche, un total de 60 à 70 % du génome humain pourrait être transcrit8. Par conséquent, il serait raisonnable d'examiner les effets des ARN non codants dans les étiologies de la NVC associée à la coronaropathie. Au cours des dernières années, les lncRNA ont été impliqués dans l'orchestration de l'expression génique dans les processus de développement cardiaque. Dans la présente étude, nous avons étudié les rôles régulateurs potentiels des CNV-lncRNA et leur contribution aux étiologies des maladies coronariennes causées par les CNV. Grâce au WGCNA, nous avons identifié deux modules de coexpression corrélés au tissu cardiaque contenant un total de 35 CNV-lncRNA (Données supplémentaires 1). Les analyses d'enrichissement fonctionnel ont indiqué que ces modules étaient liés à des processus biologiques tels que le processus cardiaque, le développement musculaire et le métabolisme énergétique, qui avaient été reconnus comme des composants importants du processus de développement cardiaque (Fig. 2c). Le module noir non syndromique, qui présentait la plus forte corrélation avec les tissus cardiaques, contenait la moitié (11/22, P = 2,12 × 10−11) des gènes CHD non syndromiques bien caractérisés, mais seulement 2 des 69 gènes CHD syndromiques ( P = 0,66). En outre, les gènes codant pour les protéines dans le module noir ont également été enrichis dans les ensembles de gènes CHD LOF (P = 1, 34 × 10-3) et DMV (P = 5, 62 × 10-5) (Fig. 4a, c et données supplémentaires 5) , qui ont été obtenus selon des découvertes de variantes rares à grande échelle en utilisant le séquençage de nouvelle génération36. Pris ensemble, ces résultats ont indiqué que le module noir non syndromique avait une disposition à affecter les phénotypes cardiaques. En outre, plus de la moitié (52, 63%, 10/19) des NVC non syndromiques récurrents associés à une maladie coronarienne comprenaient au moins un ARNlnc coexprimé avec plusieurs gènes clés de la maladie coronarienne dans le module noir non syndromique (Fig. 3a).

Le module noir non syndromique contenait 2 CNV-lncRNA hub (HSALNG0104472 en 15q11.2 et HSALNG0137903 en Xp11.22) (Fig. 4a et données supplémentaires 1). L'analyse du poids relatif (RWA) a montré que HSALNG0104472 avait un effet significatif sur la régulation de l'expression des 12 gènes CHD coexprimés dans le module noir non syndromique, et HSALNG0137903 entraînait de manière significative la régulation de 10 gènes CHD coexprimés à l'exception de MYH6 et SMAD6 (Fig. 7a et données supplémentaires 10). La délétion 15q11.2 a été signalée à plusieurs reprises comme contribuant à des anomalies du développement neurologique. Cependant, son association avec CHD était controversée37. Nous avons récemment révélé que la suppression de 15q11.2 était associée à TAPVC, une forme rare et grave de CHD24. Alors que les gènes critiques de la délétion 15q11.2 responsables des malformations cardiaques restaient inconnus. Fait intéressant, parmi les 30 CNV-lncRNA du module noir non syndromique, HSALNG0104472 a montré l'expression la plus significativement biaisée dans le cœur en développement par rapport au cerveau (Fig. 5d et données supplémentaires 7). Nous avons ensuite effectué des expériences de surexpression et d'inactivation dans des lignées cellulaires de cardiomyocytes pour étudier les effets régulateurs de HSALNG0104472. La surexpression de HSALNG0104472 n'a pas entraîné de perturbation significative de l'expression génique dans les lignées cellulaires AC16. Avec le knockdown de HSALNG0104472 dans AC16, nous avons identifié des gènes régulés à la baisse impliqués dans des voies telles que la régulation positive de l'angiogenèse, la régulation positive du développement vasculaire et la régulation du développement vasculaire. Néanmoins, nous n'avons pas pu valider sans ambiguïté la relation de coexpression entre HSALNG0104472 et les gènes CHD identifiés dans le module noir non syndromique (Données supplémentaires 12). Nous avons émis l'hypothèse qu'une telle incohérence devrait être attribuée au fait que les modules de coexpression ont été construits sur la base d'ensembles de données de développement, alors que AC16 représente une lignée cellulaire de cardiomyocytes humains adultes. Une validation supplémentaire à l'aide du système de différenciation des iPSC-cardiomyocytes a indiqué des effets régulateurs spécifiques au stade de HSALNG0104472 sur les gènes CHD (NKX2-5, ACTC1 et TBX20 dans les iPSC et GATA6 dans les cardiomyocytes différenciés, Fig. 9 supplémentaire). La région de délétion 15q11.2 englobe principalement 4 gènes codant pour les protéines : TUBGCP5, CYFIP1, NIPA1 et NIPA2. Dans cette étude, notre analyse différentielle de l'expression génique entre les tissus cardiaques et cérébraux en développement a indiqué que NIPA1 était préférentiellement exprimé dans les tissus cérébraux en développement, alors que les trois autres gènes ne présentaient pas d'expression différentielle significative (Données supplémentaires 7). Étant donné que seuls TUBGCP5 et NIPA1 étaient exprimés dans le cœur fœtal, nous avons précédemment créé des iPSC knock-out TUBGCP5 et prouvé que la réduction de TUBGCP5 affecterait la différenciation des cardiomyocytes24. Ici, nous avons prouvé que le CNV-lncRNA HSALNG0104472 s'exprime spécifiquement dans les tissus cardiaques en développement et que sa réduction générerait un impact plus sévère sur la différenciation des cardiomyocytes. Par conséquent, HSALNG0104472 devrait être un effecteur majeur pour les malformations cardiaques résultant de la suppression 15q11.2.

La découverte récente de nombreux nouveaux gènes CHD a bénéficié d'applications de séquençage de nouvelle génération à grande échelle sur des cohortes CHD. Étant donné que la plupart des preuves de ces gènes (telles que résumées dans les ensembles de gènes LOF et DMV, données supplémentaires 5) étaient liées à des variantes rares, il était raisonnable que ces gènes soient enrichis en beaucoup plus de modules de coexpression. Par conséquent, la découverte de variants rares basée sur le séquençage de nouvelle génération a remarquablement élargi nos connaissances sur les étiologies génétiques de la maladie coronarienne. Ces résultats étaient également cohérents avec l'hétérogénéité génétique universelle de la coronaropathie. Les ensembles de gènes de CHD syndromiques et non syndromiques ont également été enrichis dans différents modules, suggérant une divergence de base moléculaire sous-jacente aux CHD syndromiques et non syndromiques (Fig. 4 et données supplémentaires 5). Par conséquent, nous avons étendu notre analyse aux lncARN dans les CNV syndromiques associés à la CHD. Par rapport aux coronaropathies non syndromiques, presque toutes les NVC associées à une coronaropathie syndromique étaient des délétions4. En général, les suppressions devraient être plus délétères que les duplications4. D'autre part, un nombre considérable de syndromes de délétion récurrents présentaient une pénétrance réduite ou une variabilité clinique élevée7. Les CNV associés à la CHD syndromique contenaient plus d'ARNlnc et d'ARNlnc de CNV hub, qui étaient impliqués dans plus de deux fois (29/13) autant de modules que la CHD non syndromique (Données supplémentaires 1 et 8). Grâce à des analyses différentielles de l'expression génique des 88 gènes CHD syndromiques et non syndromiques et des CNV-lncRNA dans des échantillons de développement cardiaque et cérébral, nous avons identifié respectivement 21 et 8 gènes régulés positivement dans le cœur et le cerveau. Les gènes régulés positivement par le cœur étaient liés au développement cardiaque et les gènes régulés positivement par le cerveau étaient liés au développement de plusieurs systèmes (Fig. 5a – c). De manière frappante, les gènes codant pour les protéines cardiaques régulées positivement et les CNV-lncRNA étaient les plus enrichis en module s-jaune, qui correspondait au module noir non syndromique (Fig. 5c, d et données supplémentaires 7). Le plus grand module turquoise a été enrichi dans les ensembles de gènes syndromiques CHD, LOF et DMV CHD (Fig. 4b, d et données supplémentaires 5). Nous avons révélé qu'une grande partie des CNV-lncRNA syndromiques régulés à la hausse dans le cerveau étaient regroupés dans le module correspondant (s-turquoise) (Fig. 5d et données supplémentaires 7). Le trouble du spectre autistique représentait un trouble neurodéveloppemental avec une base génétique partagée de CHD. Nous avons testé les gènes des troubles du spectre autistique dans les modules de coexpression syndromique (Données supplémentaires 9). En somme, ces découvertes ont mis en évidence l'importance des CNV-lncRNA au sein du module turquoise (s-turquoise) dans les étiologies de la maladie coronarienne syndromique avec anomalies neurodéveloppementales.

Des facteurs environnementaux pourraient être associés à jusqu'à 30 % des cas de coronaropathie, alors que des causes environnementales solitaires ne sont identifiables que dans 2 % des cas4. Il a été suggéré que la plupart des cas de coronaropathie inexpliqués étaient causés par des interactions de facteurs génétiques et environnementaux, qui pourraient être modulés par des régulateurs épigénétiques. De plus en plus de preuves de l'implication des lncARN dans le développement cardiaque suggèrent que leur dérégulation sous-jacente à la coronaropathie devrait être sérieusement prise en compte. Contrairement aux ARNm et aux miARN, les lncARN ont évolué rapidement du point de vue des niveaux de séquence et d'expression. Cependant, leurs spécificités tissulaires sont souvent conservées. Les LncRNA pourraient soit réprimer, soit activer l'expression des gènes en cis ou en trans. Selon nos analyses, la plupart des CNV-lncRNA étaient fortement corrélés avec des gènes CHD connus en dehors de leurs régions CNV correspondantes (Fig. 3a), fonctionnant ainsi en trans. Mécaniquement, les lncARN pourraient être classés en ARNlnc de signalisation, ARNlnc leurres, ARNlnc guides, ARNlnc d'échafaudage et ARNlnc amplificateurs. Auparavant, nous avons construit avec succès des réseaux de régulation des gènes lncRNA-miARN-ARNm dans les tissus cardiaques avec CHD33. Dans la présente étude, nous avons également identifié des hub CNV-lncRNA qui pourraient piloter le réseau de régulation lncRNA-miRNA-mRNA (Fig. 3 supplémentaire). Cependant, aucun des ARNm cibles ne figurait dans la liste connue des gènes CHD (Données supplémentaires 5).

La pathogénicité des CNV a été le plus souvent interprétée sur la base de leur effet sur le dosage des gènes en perturbant les séquences codantes, et cette approche a été appliquée avec succès dans la découverte de gènes causals pour les CNV dans les maladies mendéliennes7. Malgré le succès d'une telle stratégie, les pathologies de la plupart des NVC associées à une maladie coronarienne sont longtemps restées indéterminées. Étant donné que la plupart des CNV affectent également les régions génomiques des lncRNA, les mécanismes pathogènes impliquant les lncRNA régulateurs doivent être sérieusement pris en compte. Étonnamment, même si nous ne considérions que le module (module noir non syndromique) qui était le plus significativement corrélé avec les tissus cardiaques, plus de la moitié des CNV associés à une maladie coronarienne non syndromique (52,6 %, 10/19) contenaient au moins un lncRNA présentant une forte coexpression et corrélation avec plusieurs gènes clés de CHD (Fig. 3a). Parmi les 10 CNV contenant des lncRNA susmentionnés, 1q21.1, 2q24.1, 2q35, 2q37.1, 8p23.1 et 13q14.11 englobaient également les lncRNA(s) hub impliqués dans le mécanisme de l'ARNc. Outre ces CNV, trois autres CNV associées à une maladie coronarienne non syndromique (5q31.1, 16p12.2 et 16q23.1) contenaient également des lncARN hub impliqués dans les analyses d'ARNc (Fig. 3a et données supplémentaires 6). Bien que les gènes CHD n'aient pas été identifiés comme cibles des ARNlnc hub pour le réseau d'ARNce, nous ne pouvions pas ignorer l'effet du mécanisme d'ARNce en raison de ses rôles régulateurs omniprésents dans le développement cardiaque38. Au total, les CNV-lncRNA pourraient potentiellement contribuer aux pathologies d'une proportion maximale de 68, 4% (13/19) des CNV non syndromiques associés à la CHD (Fig. 3a; Tableau 1; et Données supplémentaires 6).

D'autres investigations sont nécessaires car il y a plusieurs limites à notre recherche. Tout d'abord, les lncRNA causaux qui pourraient expliquer les cas de coronaropathie résultant de CNV devraient être identifiés à partir des réseaux de coexpression, ce qui était également la motivation initiale de ce travail. Deuxièmement, nous avons utilisé quatre ensembles de gènes CHD connus dans les analyses (Données supplémentaires 5). Les résultats pourraient être incomplets étant donné que la liste des gènes CHD ne cesse de s'allonger. De plus, bien que nous ayons regroupé les ARNm et les CNV-lncRNA en modules pour simplifier les analyses, les CNV-lncRNA et les ARNm pourraient avoir des interactions inter-modules complexes d'un point de vue temporel et spatial. Le hub CNV-lncRNA HSALNG0104472, par exemple, dont l'effet régulateur incohérent sur les gènes CHD connus a été observé dans les iPSC et les cardiomyocytes différenciés (c. ont indiqué les rôles spécifiques au stade de HSALNG0104472 (Fig. 9 supplémentaire et données supplémentaires 13). Enfin, le manque d'investigation mécaniste approfondie est une limite de l'étude. Dans l'ensemble, nous avons fourni des preuves que les CNV-lncRNA régulaient potentiellement les modèles d'expression de gènes CHD bien établis. L'intégration d'ensembles de données multidimensionnels est nécessaire pour révéler leurs mécanismes moléculaires dans la coronaropathie. Cependant, des travaux supplémentaires sont encore nécessaires pour révéler pleinement les rôles régulateurs des CNV-lncRNAs dans CHD. L'amélioration des modèles cellulaires et in vitro/in vivo ainsi que l'accumulation de données génétiques cliniques devraient être nécessaires pour nous aider à atteindre cet objectif. Étant donné que la plupart des CNV-lncRNA ne sont pas conservés au cours de l'évolution, des modèles in vitro tels que les organoïdes cardiaques sont apparus comme des outils potentiels pour fournir des informations sur leurs mécanismes moléculaires.

En conclusion, pour déterminer si les lncRNA contribuent à la pathogénicité des CNV conduisant à la CHD, nous avons construit un réseau de coexpression pour les CNV-lncRNA associés à la CHD et les gènes codant pour les protéines à l'aide de données de développement d'organes humains. Nos résultats suggèrent que les gènes CHD connus pourraient être régulés par plusieurs ARNlnc dans les régions CNV associées aux CHD non syndromiques et syndromiques. Pour le module noir non syndromique qui s'est principalement enrichi en gènes CHD non syndromiques, nous avons validé les rôles régulateurs d'un hub CNV-lncRNA HSALNG0104472 dans la région 15q11.2. Il a été révélé que HSALNG0104472 devrait être un effecteur principal responsable des anomalies cardiaques de la délétion 15q11.2 en régulant la différenciation des cardiomyocytes. Nos résultats ont mis en évidence la contribution potentielle des lncRNAs à la pathogénicité des CNV associés à CHD.

Nous avons cherché à révéler la contribution potentielle des lncRNAs à la pathogénicité des CNV associés à CHD. Les CNV associées à la CHD non syndromique et syndromique ont été extraites de CHDGKB39 et d'une revue récente sur CHD4, respectivement. Nous avons d'abord restreint notre analyse aux NVC non syndromiques récurrentes qui ont été rapportées dans au moins trois cas. Nous avons construit des réseaux de coexpression pour les 568 CNV-lncRNA non syndromiques et 19 957 gènes codant pour les protéines à l'aide des données transcriptomiques de développement d'organes humains (n ​​= 313) de LncExpDB23. Les matrices d'expression génique (valeur tpm) des 313 échantillons ont été utilisées pour WGCNA, ce qui a permis l'identification de relations de coexpression robustes impliquant les CNV-lncRNA.

Pour révéler la base moléculaire sous-jacente aux différences entre CHD non syndromique et syndromique, nous avons effectué un autre WGCNA avec 1500 CNV-lncRNAs associés à CHD non syndromique et syndromique. Nous avons également identifié des gènes CHD exprimés de manière différentielle et des CNV-lncRNA entre des échantillons de cerveau (n = 87) et de cœur (n = 50).

Les modules WGCNA identifiés étaient corrélés au sexe, au stade de développement et aux sept organes avec le package WGCNA R. Nous nous sommes principalement concentrés sur les modules significativement corrélés avec les tissus cardiaques. HSALNG0104472, un hub CNV-lncRNA dans 15q11.2, a montré une coexpression et une corrélation élevées avec plusieurs gènes CHD clés. Nous avons ensuite réalisé une série d'expériences cellulaires pour valider ses effets régulateurs potentiels dans les cardiomyocytes.

La lignée iPSC a été générée à partir d'une femme en bonne santé dans notre étude précédente24. Le consentement éclairé a été obtenu du participant. Le comité d'éthique du SCMC a examiné et approuvé cette étude (SCMCIRB-K2022182-1). Toutes les procédures effectuées dans les études impliquant des participants humains étaient conformes aux normes éthiques du comité de recherche institutionnel et/ou national et à la Déclaration d'Helsinki de 1964 et à ses amendements ultérieurs ou à des normes éthiques comparables.

Les CNV non syndromiques ont été collectées auprès de CHDGKB39. Étant donné que les NVC récurrentes avaient beaucoup plus d'implications cliniques, nous n'avons utilisé que les 19 NVC signalés dans au moins trois cas pour notre analyse (tableau 1). De plus, 21 VNC syndromiques ont été résumées à partir de la récente revue4 pour une analyse comparative. Les lncARN annotés23,31 qui ont été cartographiés dans ces régions génomiques avec une valeur d'expression maximale (transcriptions par million, tpm) ≥ 1 dans les 50 échantillons de développement cardiaque ont été considérés comme exprimés pendant le développement cardiaque. BEDTools v2.29.2 a été utilisé pour la récupération de CNV-lncRNA40. Les données d'expression génique traitées impliquant ces gènes pour les 313 échantillons de tissus de développement d'organes humains fournis par LncExpDB ont été utilisées pour l'analyse de la coexpression. Le package R WGCNA v1.7022 a été utilisé pour la construction du réseau de coexpression et l'identification des modules. La corrélation de Pearson a été utilisée pour calculer les corrélations d'expression génique par paires et les corrélations module-trait. Pour les corrélations module-trait, la valeur P ajustée a été calculée avec la fonction corPvalueStudent dans le package WGCNA R. La valeur de puissance a été fixée à six pour la construction du réseau de coexpression. Les paramètres de la fonction blockwiseModules étaient les suivants : maxBlockSize = 6000, TOMType = "unsigned", minModuleSize = 30, reassignThreshold = 0, mergeCutHeight = 0,25, numericLabels = T et pamRespectsDendro = F. La valeur d'appartenance au module (MM), qui était utilisé comme estimation de la corrélation entre un gène/lncRNA et le gène propre du module correspondant, a été utilisé pour définir les CNV-lncRNA hub. Les gènes codant pour les protéines dans chaque module ont été utilisés comme entrée pour l'analyse d'enrichissement de l'ontologie génétique (GO) et les analyses d'enrichissement de la voie de l'encyclopédie des gènes et des génomes de Kyoto (KEGG) avec le package R clusterProfiler v3.1041.

Nous avons récupéré 598537 lncRNA-miRNA et 331604 preuves d'interaction miRNA-mRNA de LncBook25, NPInter42, miRTarBase43 et TarBase44. En intégrant les preuves d'interactions avec les données d'expression génique des échantillons de développement cardiaque (n = 50), nous avons construit le réseau de régulation lncRNA-miARN-ARNm en utilisant LncmiRSRN v3.034 pour estimer la contribution du mécanisme de l'ARNc à la pathogénicité des CHD non syndromiques associées CNV.

La lignée iPSC générée à partir d'une femme en bonne santé dans notre laboratoire24 a été utilisée pour des expériences de différenciation des cardiomyocytes. Les iPSC (1 × 106) ont été inoculés dans des plaques à 6 puits pré-enduites de Matrigel (BD Bioscience, Heidelberg, Allemagne). Les CSPi ont été ensemencées et cultivées avec du milieu E8. Lorsque les CSPi ont atteint la confluence de 80 % à 90 %, la différenciation des cardiomyocytes induite in vitro a été réalisée avec le kit CardioEasy (Cellapybio, Pékin, Chine) en suivant le protocole. Les efficacités de différenciation des cardiomyocytes ont été quantifiées par cytométrie en flux (Voir rubrique "Evaluation de l'efficacité de différenciation des cardiomyocytes").

Pour la coloration immunofluorescente, les cellules ont été fixées avec du PBS contenant 4 % de paraformaldéhyde pendant 20 minutes à température ambiante. Après lavage avec du PBS, les cellules ont été bloquées pendant 30 minutes avec du PBS contenant 5 % de sérum bovin. La coloration avec des anticorps primaires : troponine I cardiaque (cTnI) (RRID : AB_2532494, ThermoFisher, Waltham, MA, États-Unis), α-Actinine (RRID : AB_2692251, ThermoFisher, Waltham, MA, États-Unis) diluée dans un tampon de blocage a été effectuée pendant une nuit à Température de −4 °C. Des anticorps secondaires ont été utilisés le lendemain, après coloration au DAPI pour détecter le noyau cellulaire. Les images fluorescentes ont été acquises à l'aide d'un microscope confocal laser (Leica TCS SP8).

L'ARN cellulaire total a été isolé avec le réactif TRIzol (Ambion, Austin, TX, États-Unis) selon le protocole. La concentration et l'intégrité de l'ARN ont été mesurées à l'aide du système Agilent Bioanalyzer 2100. Les échantillons avec RIN ≥ 7 ont été qualifiés pour la construction de la bibliothèque de séquençage. Nous avons préparé les bibliothèques de séquençage à l'aide du kit de préparation d'ARNm-seq Lib pour Illumina (ABclonal Technology Co., Wuhan, Chine) avec des adaptateurs pour la plate-forme BGI. Le séquençage a été réalisé sur le DNBSEQ-T7. Les données ont été traitées comme suit : analyse de la qualité et filtrage de la qualité de base avec FastQC v0.11.9 (https://www.bioinformatics.babraham.ac.uk/projects/fastqc) et Trim Galore v0.6.6 (https://github. com/FelixKrueger/TrimGalore), suppression de l'ARNr avec SortMeRNA v4.3.445, alignement avec STAR v2.7.1046, comptage des lectures avec featureCounts47 implémenté dans le package Subread v2.0.3, analyse de l'expression différentielle et analyse des composants principaux avec DESeq2 v1.3248, et fonctionnel analyse d'enrichissement avec clusterProfiler v3.1041. Pour l'analyse de l'expression différentielle, le nombre brut de gènes a été normalisé avec la fonction rlog dans DESeq2 v1.3248.

Les données d'expression génique de LncExpDB23 ont été générées par une annotation complète pour les lncARN de l'ensemble de données original d'échantillons de développement (n = 313, cerveau : 55, cervelet : 59, cœur : 50, rein : 40, foie : 50, ovaire : 18 et testis : 41) recueillies auprès de ArrayExpress (E-MTAB-6814). L'échantillonnage des tissus a commencé à quatre semaines après la conception, puis a été échantillonné chaque semaine jusqu'à 20 semaines après la conception, à l'exception de 14, 15 et 17 semaines après la conception. Les tissus postnatals ont été prélevés chez les nouveau-nés, les nourrissons (6 à 9 mois), les tout-petits (2 à 4 ans), les enfants d'âge scolaire (7 à 9 ans), les adolescents (13 à 19 ans) et les adultes (~ 65 ans). Le développement des reins a été échantillonné jusqu'à l'âge de 8 ans et le développement des ovaires n'a été échantillonné qu'avant la naissance49.

Les données transcriptomiques traitées (n = 297) de la différenciation des cardiomyocytes in vitro à partir de LncExpDB23 ont été utilisées pour valider la relation de coexpression hautement corrélée entre les CNV-lncRNA et les gènes CHD dans le module noir non syndromique identifié par WGCNA. Les données originales ont été collectées à partir du Gene Expression Omnibus (GEO) sous l'accession GSE122380. Les données originales ont été générées à partir de la différenciation des cardiomyocytes des lignées iPSC de 19 individus de la population Yoruba HapMap50.

Des exemples de traits dans les données sur le développement des organes humains ont été collectés à partir de LncExpDB23. Les variables catégorielles (sexe et tissu) des échantillons ont été quantifiées en 1 et 0. Pour le sexe, le sexe masculin a été quantifié en 1 et la femme a été quantifiée en 0. Pour 7 organes (cœur, par exemple), les échantillons de cœur ont été quantifiés en 1 tandis que les autres échantillons ont été quantifiés en 0. Les variables continues (stade de développement) des échantillons ont été quantifiées en semaine selon les règles suivantes : Pour les échantillons d'embryons (avant la naissance), la valeur du stade de développement est égale au nombre de semaines après la conception (par exemple, si l'embryon avait 10 semaines, la valeur était de 10.). Pour les échantillons prélevés après la naissance, la valeur du stade de développement est égale à 40 (valeur estimée de grossesse humaine de 40 semaines) plus l'âge (compte en semaines). 1 an a été calculé comme 52 semaines, 1 mois comme 1/12 ans et 1 semaine comme 7 jours. (Par exemple, pour un échantillon à 6 mois après la naissance, la valeur du stade de développement était de 40 + 6/12 × 52 = 66 ; pour un échantillon à 7 jours après la naissance, la valeur du stade de développement était de 40 + 7/7 = 41. ) (Données supplémentaires 1).

Les détails (y compris le sous-type de CHD) des NVC récurrents non syndromiques associés à la CHD ont été recueillis auprès de CHDGKB39. Après avoir filtré les enregistrements CNV sans informations de coordonnées CNV spécifiques, les coordonnées d'origine de chaque enregistrement CNV ont été converties en assemblage hg38 à l'aide de l'outil de levage dans UCSC (http://genome.ucsc.edu)51. Les coordonnées de tous les CNV-lncARN (assemblage hg38) ont été extraites de LncExpDB23. Nous avons pris l'intersection des coordonnées pour identifier l'association entre le CNV-lncRNA et le sous-type CHD.

L'analyse du poids relatif (RWA), également connue sous le nom d'analyse du pilote, a été réalisée avec le package RWA Web et R52 pour identifier les principaux pilotes CNV-lncRNA dans le module noir non syndromique. Pour chaque analyse RWA, le gène CHD a été utilisé comme variable de réponse et les CNV-lncRNA ont été utilisés comme prédicteurs. R2 a estimé la contribution d'un groupe de prédicteurs à la variable de réponse. Lorsque 0 n'était pas inclus dans les intervalles de confiance, le poids relatif était considéré comme significatif. Sinon, le poids relatif n'était pas significativement l'un de l'autre. Voir plus de détails sur le Web RWA.

Pour les expériences de surexpression, la longueur totale du transcrit (HSALNT0217290) pour HSALNG0104472 a été clonée dans le vecteur lentiviral PCDH-CMV-MCS-EF1a-gfp-T2A-puro, le vecteur vide a été utilisé comme contrôle. Pour les expériences de knockdown stables utilisant le shRNA, une séquence complémentaire (AGGGAACCAGCTTCAGAACTCAAGAGGTTCTGAAGCTGGTTCCCTTTTTTT) ciblant le transcrit HSALNG0104472 a été insérée dans le vecteur lentiviral pLVX-shRNA2-zsGreen-PGK-puro. La séquence de brouillage correspondante (CGTATACCCGGAACAAAGGTCAAGAGCCTTTGTTCCGGGTATACGTTTTTT) a été utilisée comme contrôle. Les plasmides lentiviraux construits ont été respectivement transfectés dans des cellules HEK293 avec les plasmides d'emballage psPAX2 et pMD2·G par Lipofectamine 2000 (Invitrogen, Carlsbad, CA, USA) pour produire le virus. Les AC16/iPSC ont été infectés par les lentivirus après un traitement à la puromycine pendant plusieurs jours pour obtenir les lignées cellulaires de surexpression et de knockdown. Des expériences de knockdown ont également été répétées par transfection transitoire avec un Smart Silencer (mélange de petits ARN interférents et d'oligonucléotides antisens ciblant HSALNG010447, synthétisé par RiboBio, Guang Zhou, Chine). Le Smart Silencer a été transfecté dans des iPSC ou des cardiomyocytes avec la Lipofectamine RNAiMAX (Invitrogen, Carlsbad, CA, USA). Les séquences de silencieux ont été répertoriées dans le tableau supplémentaire 3.

Un total de 1 µg d'ARN cellulaire a été utilisé comme matrice pour la préparation d'ADNc avec le kit de réactifs PrimeScript RT (Takara, Dalian, Chine). La transcription inverse quantitative qPCR (RT-qPCR) a été réalisée avec le kit TB Green Premix Ex Taq II (Takara, Dalian, Chine) sur le système de détection PCR en temps réel CFX 96 (Bio-Rad Laboratories, Inc., Hercules, CA, États-Unis). Les niveaux d'expression relative des gènes ont été calculés sur la base de la méthode 2−∆∆Ct. Au moins trois expériences biologiquement indépendantes ont été menées pour chaque groupe. GAPDH a été utilisé comme gène de référence interne. Les paires d'amorces RT-qPCR ont été répertoriées dans le tableau supplémentaire 4.

La cytométrie en flux a été utilisée pour évaluer le rendement relatif des cardiomyocytes et l'efficacité de la différenciation cellulaire en mesurant le nombre de cellules exprimant des protéines cardiaques spécifiques de la troponine T cardiaque (cTnT). Cardiac Troponin T Polyclonal Antibody PE Conjugated (Catalog No: #C90559PE) a été utilisé pour cibler les cardiomyocytes. Pour la préparation des échantillons, digérer les cardiomyocytes avec des enzymes digestives douces pendant 5 min. Ajouter un volume égal de milieu de culture cellulaire pour arrêter la réaction. Centrifugeuse à 25 ° C 800 × g pendant 5 minutes et remettre en suspension les cellules avec du PBS pour laver les cellules 2 fois à la même procédure. Aliquoter 1 × 106 cellules de l'échantillon prétraité dans 100 ul par volume dans un tube à essai de 5 ml par test. Ajouter Cardiac Troponin T Polyclonal Antibody PE Conjugated à la dilution appropriée (1:100) dans les tubes à essai. Incuber à 37 °C pendant 1 heure. Laver par centrifugation dans 2-3 ml de tampon de lavage (PBS avec 0,1% de FBS). Remettre en suspension les cellules dans 0,3 à 0,5 ml de PBS et analyser sur cytomètre en flux. Le cytomètre en flux BD FACSCanto™ a été utilisé pour les tests de différenciation des cardiomyocytes. Le pourcentage de cellules a été évalué par le logiciel BD FACSDiva™ v8.0.1. L'abondance des fractions positives et négatives a été déterminée par comptage des cellules après le tri. La stratégie de déclenchement a été présentée dans les informations supplémentaires (Fig. 10 supplémentaire).

Un seuil de valeur P ajustée < 0,05 a été utilisé pour l'analyse différentielle de l'expression génique. Les valeurs P ont été ajustées pour des tests multiples en utilisant la méthode Benjamini-Hochberg. Des tests hypergéométriques ont été utilisés pour estimer l'importance de l'enrichissement des gènes CHD connus dans les modules de coexpression. Le test t de Student bilatéral a été utilisé pour la comparaison entre les deux groupes. Au moins trois expériences biologiquement indépendantes ont été menées pour chaque groupe.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données brutes RNAseq pour les expériences de surexpression et de knockdown sur HSALNG0104472 dans les cardiomyocytes AC16 qui appuient les résultats de cette étude sont librement disponibles dans GEO : GSE201076. Toutes les données sont disponibles dans le texte principal ou dans les documents complémentaires. Le plasmide pour la surexpression et l'inactivation de HSALNG0104472 a été déposé chez Addgene (197902, 197989 et 197991).

GBD 2017 Collaborateurs pour les cardiopathies congénitales. Fardeau mondial, régional et national des cardiopathies congénitales, 1990-2017 : une analyse systématique pour l'étude sur la charge mondiale de morbidité 2017. Lancet Child Adolesc. Santé 4, 185–200 (2020).

Article Google Scholar

Liu, Y. et al. Prévalence mondiale à la naissance des malformations cardiaques congénitales 1970-2017 : revue systématique mise à jour et méta-analyse de 260 études. Int J. Épidémiol. 48, 455–463 (2019).

Article PubMed PubMed Central Google Scholar

Leirgul, E. et al. Prévalence à la naissance des malformations cardiaques congénitales en Norvège 1994-2009 - une étude nationale. Suis. Heart J. 168, 956–964 (2014).

Article PubMed Google Scholar

Pierpont, ME et al. Base génétique de la cardiopathie congénitale : revisitée : une déclaration scientifique de l'American Heart Association. Diffusion 138, e653–e711 (2018).

Article PubMed PubMed Central Google Scholar

Nees, SN & Chung, WK Base génétique de la cardiopathie congénitale humaine. Cold Spring Harb. Perspective. Biol. https://doi.org/10.1101/cshperspect.a036749 (2020).

Jin, SC et al. Contribution de rares variantes héréditaires et de novo dans 2 871 probants de maladies cardiaques congénitales. Nat. Genet. 49, 1593-1601 (2017).

Article CAS PubMed PubMed Central Google Scholar

Spielmann, M., Lupianez, DG & Mundlos, S. Variation structurelle du génome 3D. Nat. Révérend Genet. 19, 453–467 (2018).

Article CAS PubMed Google Scholar

Djebali, S. et al. Paysage de la transcription dans les cellules humaines. Nature 489, 101-108 (2012).

Article CAS PubMed PubMed Central Google Scholar

Batista, PJ & Chang, HY Longs ARN non codants : codes d'adresse cellulaire dans le développement et la maladie. Cellule 152, 1298-1307 (2013).

Article CAS PubMed PubMed Central Google Scholar

Klattenhoff, CA et al. Braveheart, un long ARN non codant nécessaire à l'engagement de la lignée cardiovasculaire. Cellule 152, 570–583 (2013).

Article CAS PubMed PubMed Central Google Scholar

Grote, P. et al. L'ARNlnc spécifique aux tissus Fendrr est un régulateur essentiel du développement du cœur et de la paroi corporelle chez la souris. Dév. Cellule 24, 206-214 (2013).

Article CAS PubMed PubMed Central Google Scholar

Viereck, J. et al. L'ARN long non codant Chast favorise le remodelage cardiaque. Sci. Trad. Méd. 8, 326ra322 (2016).

Article Google Scholar

Liu, J., Li, Y., Lin, B., Sheng, Y. & Yang, L. HBL1 est un long ARN humain non codant qui module le développement des cardiomyocytes à partir de cellules souches pluripotentes en neutralisant MIR1. Dév. Cellule 42, 333–348 e335 (2017).

Article CAS PubMed PubMed Central Google Scholar

Anderson, KM et al. La transcription de l'ARN non codant contrôle l'expression de Hand2 et le développement cardiaque. Nature 539, 433–436 (2016).

Article CAS PubMed PubMed Central Google Scholar

Ritter, N. et al. Le locus lncRNA régule les programmes génétiques cardiaques et est essentiel au développement précoce de la souris. Dév. Cellule 50, 644–657.e648 (2019).

Article CAS PubMed Google Scholar

Wilson, KD et al. LncRNA BANCR dérivé de rétrovirus endogène favorise la migration des cardiomyocytes chez les humains et les primates non humains. Dév. Cellule 54, 694–709.e699 (2020).

Article CAS PubMed PubMed Central Google Scholar

Li, H. et al. lncExACT1 et DCHS2 régulent la croissance cardiaque physiologique et pathologique. Circulation. https://doi.org/10.1161/CIRCULATIONAHA.121.056850 (2022).

Meng, Q. et al. Le long ARN non codant du DGCR5 peut réguler l'expression de plusieurs gènes liés à la schizophrénie. Sci. Trad. Méd. https://doi.org/10.1126/scitranslmed.aat6912 (2018).

Alinejad-Rokny, H., Heng, JIT & Forrest, ARR Les gènes codants enrichis par le cerveau et les longs gènes d'ARN non codants sont surreprésentés dans les CNV récurrentes des troubles neurodéveloppementaux. Cell Rep. 33, 108307 (2020).

Article CAS PubMed Google Scholar

Richter, F. et al. Les analyses génomiques impliquent des variants de novo non codants dans les cardiopathies congénitales. Nat. Genet. 52, 769–777 (2020).

Article CAS PubMed PubMed Central Google Scholar

Meerschaut, I. et al. Une réévaluation des variations du nombre de copies dans les malformations cardiaques congénitales : imager l'ensemble du génome. Gènes (Bâle). https://doi.org/10.3390/genes12071048 (2021).

Langfelder, P. & Horvath, S. WGCNA : un package R pour l'analyse de réseau de corrélation pondérée. BMC Bioinform. 9, 559 (2008).

Article Google Scholar

Li, Z. et al. LncExpDB : une base de données d'expression d'ARN longs non codants humains. Nucleic Acids Res. 49, D962–D968 (2021).

Article CAS PubMed Google Scholar

Li, X. et al. La délétion 15q11.2 est enrichie chez les patients présentant une connexion veineuse pulmonaire totalement anormale. J. Med. Genet. https://doi.org/10.1136/jmedgenet-2019-106608 (2020).

Soemedi, R. et al. Contribution des variantes mondiales rares du nombre de copies au risque de cardiopathie congénitale sporadique. Suis. J. Hum. Genet. 91, 489-501 (2012).

Article CAS PubMed PubMed Central Google Scholar

Silversides, CK et al. Les variations rares du nombre de copies chez les adultes atteints de tétralogie de Fallot impliquent de nouvelles voies génétiques à risque. PLoS Genet. 8, e1002843 (2012).

Article CAS PubMed PubMed Central Google Scholar

Xie, L. et al. Rares variantes du nombre de copies de novo chez les patients atteints d'atrésie pulmonaire congénitale. PLoS ONE 9, e96471 (2014).

Article PubMed PubMed Central Google Scholar

Glessner, JT et al. Augmentation de la fréquence des variantes du nombre de copies de novo dans les cardiopathies congénitales par analyse intégrative de la matrice de polymorphisme nucléotidique unique et des données de séquence d'exome. Circ. Rés. 115, 884–896 (2014).

Article CAS PubMed PubMed Central Google Scholar

Sanchez-Castro, M. et al. La recherche de variants rares en nombre de copies dans les malformations cardiaques congénitales identifie de nouveaux gènes candidats et un rôle potentiel pour FOXC1 chez les patients atteints de coarctation de l'aorte. Circ. Cardiovasculaire. Genet. 9, 86–94 (2016).

Article CAS PubMed Google Scholar

Costain, G. et al. Les variations du nombre de copies rares à l'échelle du génome contribuent au risque génétique de transposition des grandes artères. Int. J. Cardiol. 204, 115-121 (2016).

Article PubMed Google Scholar

Ma, L. et al. LncBook : une base de connaissances organisée sur les longs ARN humains non codants. Nucleic Acids Res. 47, D128–D134 (2019).

Article CAS PubMed Google Scholar

Li, Z. et al. LncBook 2.0 : intégration d'ARN humains longs non codants avec des annotations multi-omiques. Nucleic Acids Res. https://doi.org/10.1093/nar/gkac999 (2022).

Zhang, X. et al. FGD5-AS1 est un hub lncRNA ceRNA dans les cœurs avec tétralogie de fallot qui régule les gènes des maladies cardiaques congénitales de manière transcriptionnelle et épigénétique. Devant. Cellule Dév. Biol. 9, 630634 (2021).

Article PubMed PubMed Central Google Scholar

Zhang, J., Liu, L., Li, J. & Le, TD LncmiRSRN : identification et analyse d'un long réseau de régulation d'éponge miARN lié à l'ARN non codant dans le cancer humain. Bioinformatique 34, 4232–4240 (2018).

Article CAS PubMed Google Scholar

Abrahams, BS et al. SFARI Gene 2.0 : une base de connaissances axée sur la communauté pour les troubles du spectre autistique (TSA). Mol. Autisme 4, 36 (2013).

Article PubMed PubMed Central Google Scholar

Morton, SU, Quiat, D., Seidman, JG & Seidman, CE Frontières génomiques dans les cardiopathies congénitales. Nat. Rév. Cardiol. 19, 26–42 (2022).

Article PubMed Google Scholar

Zhao, W. et al. Analyse à haute résolution des variantes du nombre de copies chez les adultes atteints de cardiopathie congénitale simple à modérée. Suis. J. Med. Genet. A 161A, 3087–3094 (2013).

Article PubMed Google Scholar

Alexanian, M. & Ounzain, S. Longs ARN non codants dans le développement cardiaque. Cold Spring Harb. Perspective. Biol. https://doi.org/10.1101/cshperspect.a037374 (2020).

Yang, L. et al. CHDGKB : une base de connaissances pour la compréhension systématique des variations génétiques associées aux cardiopathies congénitales non syndromiques. Base de données (Oxford). https://doi.org/10.1093/database/baaa048 (2020).

Quinlan, AR & Hall, IM BEDTools : une suite flexible d'utilitaires pour comparer les caractéristiques génomiques. Bioinformatique 26, 841–842 (2010).

Article CAS PubMed PubMed Central Google Scholar

Yu, G., Wang, LG, Han, Y. & He, QY clusterProfiler : un package R pour comparer des thèmes biologiques entre des clusters de gènes. OMICS 16, 284–287 (2012).

Article CAS PubMed PubMed Central Google Scholar

Hao, Y. et al. NPInter v3.0 : une base de données améliorée des interactions non codantes associées à l'ARN. Base de données (Oxford). https://doi.org/10.1093/database/baw057 (2016).

Chou, CH et al. miRTarBase update 2018 : une ressource pour les interactions microARN-cible validées expérimentalement. Nucleic Acids Res. 46, D296–D302 (2018).

Article CAS PubMed Google Scholar

Vlachos, IS et al. DIANA-TarBase v7.0 : indexation de plus d'un demi-million d'interactions miARN:ARNm supportées expérimentalement. Nucleic Acids Res. 43, D153–D159 (2015).

Article CAS PubMed Google Scholar

Kopylova, E., Noe, L. & Touzet, H. SortMeRNA : filtrage rapide et précis des ARN ribosomiques dans les données métatranscriptomiques. Bioinformatique 28, 3211–3217 (2012).

Article CAS PubMed Google Scholar

Dobin, A. et al. STAR : aligneur RNA-seq universel ultrarapide. Bioinformatique 29, 15-21 (2013).

Article CAS PubMed Google Scholar

Liao, Y., Smyth, GK & Shi, W. featureCounts : un programme efficace à usage général pour attribuer des lectures de séquences à des caractéristiques génomiques. Bioinformatique 30, 923–930 (2014).

Article CAS PubMed Google Scholar

Love, MI, Huber, W. & Anders, S. Estimation modérée du changement de pli et de la dispersion des données ARN-seq avec DESeq2. Génome Biol. 15, 550 (2014).

Article PubMed PubMed Central Google Scholar

Cardoso-Moreira, M. et al. Expression génique à travers le développement d'organes de mammifères. Nature 571, 505–509 (2019).

Article CAS PubMed PubMed Central Google Scholar

Strober, BJ et al. Régulation génétique dynamique de l'expression des gènes au cours de la différenciation cellulaire. Sciences 364, 1287-1290 (2019).

Article CAS PubMed PubMed Central Google Scholar

Kent, WJ et al. Le navigateur du génome humain à l'UCSC. Génome Res. 12, 996–1006 (2002).

Article CAS PubMed PubMed Central Google Scholar

Tonidandel, S. & LeBreton, JM RWA Web : un outil gratuit, complet, basé sur le Web et convivial pour les analyses de poids relatif. J.Bus. Psychol. 30, 207-216 (2015).

Article Google Scholar

Sicko, RJ et al. Variantes génétiques dans l'anomalie isolée d'ebstein impliquées dans les voies de développement du myocarde. PLoS ONE 11, e0165174 (2016).

Article PubMed PubMed Central Google Scholar

Yagi, H. et al. Rôle de TBX1 dans le syndrome humain del22q11.2. Lancette 362, 1366-1373 (2003).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions tous les participants pour leur collaboration à cette recherche. Nous remercions également Mme MJ Zhou de Fresenius Medical Care pour l'édition du texte anglais d'un brouillon de ce manuscrit. Ce travail a été soutenu par le programme national de R&D clé de Chine [2021YFC2701104 à Qh.F.] ; Fondation nationale des sciences naturelles de Chine [82172352 à BW, 82072372 à Qh.F.] ; Commission scientifique, technologique et économique de Pudong [PKJ2022-Y04 à BW] ; National Facility for Translational Medicine (Shanghai) [TMSK-2021-133 à BW] ; et Shanghai Municipal Science and Technology [20JC1418500, 21Y31900300 et 20dz2260900 à Qh.F.].

Ces auteurs ont contribué à parts égales : Yibo Lu, Qing Fang, Ming Qi.

Institut de médecine translationnelle pédiatrique, Centre médical pour enfants de Shanghai, École de médecine, Université Jiao Tong de Shanghai, Shanghai, Chine

Yibo Lu, Qing Fang, Ming Qi, Xingyu Zhang, Yuwan Lin, Ying Xiang, Qihua Fu et Bo Wang

Département de génétique médicale et laboratoire de diagnostic moléculaire, Shanghai Children's Medical Center, School of Medicine, Shanghai Jiao Tong University, Shanghai, Chine

Xiaoliang Li

Shanghai Key Laboratory of Clinical Molecular Diagnostics for Pediatrics, Shanghai, Chine

Ying Xiang, Qihua Fu et Bo Wang

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Yb.L. et BW a contribué à la revue de la littérature, à la conception de l'étude, à la collecte des données, à l'analyse des données, à l'interprétation des données et à la rédaction du manuscrit ; QF, MQ, XL, Yw.L. et XZ ont contribué à la collecte de données, à la validation expérimentale, à l'interprétation des données et à la préparation du manuscrit ; YX, Qh.F. et BW ont contribué à la supervision de tous les aspects de l'étude et de la préparation du manuscrit. Les auteurs ont lu et approuvé le manuscrit final.

Correspondance avec Ying Xiang, Qihua Fu ou Bo Wang.

Les auteurs ne déclarent aucun intérêt concurrent.

Communications Biology remercie Marlin Touma et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Rédacteur en chef de la manipulation principale : George Inglis. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Lu, Y., Fang, Q., Qi, M. et al. Les lncRNA associés à la variation du nombre de copies peuvent contribuer aux étiologies des cardiopathies congénitales. Commun Biol 6, 189 (2023). https://doi.org/10.1038/s42003-023-04565-z

Télécharger la citation

Reçu : 23 juin 2022

Accepté : 08 février 2023

Publié: 17 février 2023

DOI : https://doi.org/10.1038/s42003-023-04565-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.

PARTAGER