banner
Maison / Blog / HighAltitudeOmicsDB, une ressource intégrée pour les hautes
Blog

HighAltitudeOmicsDB, une ressource intégrée pour les hautes

Apr 03, 2023Apr 03, 2023

Rapports scientifiques volume 13, Numéro d'article : 9307 (2023) Citer cet article

Détails des métriques

Des millions de personnes dans le monde visitent, vivent ou travaillent dans l'environnement hypoxique rencontré à haute altitude et il est important de comprendre les réponses biomoléculaires à ce stress. Cela aiderait à concevoir des stratégies d'atténuation des maladies de haute altitude. Malgré un certain nombre d'études couvrant plus de 100 ans, les mécanismes complexes contrôlant l'acclimatation à l'hypoxie restent largement inconnus. Pour identifier les marqueurs diagnostiques, thérapeutiques et prédictifs potentiels du stress HA, il est important de comparer et d'analyser de manière exhaustive ces études. Dans ce but, HighAltitudeOmicsDB est une ressource unique qui fournit une compilation complète, organisée, conviviale et détaillée de divers gènes/protéines qui ont été expérimentalement validés pour être associés à diverses conditions d'AH, leurs interactions protéine-protéine (IPP) et leurs gènes. similitudes sémantiques de l'ontologie (GO). Pour chaque entrée de la base de données, HighAltitudeOmicsDB stocke en outre le niveau de régulation (régulation à la hausse/à la baisse), le changement de pli, le groupe de contrôle de l'étude, la durée et l'altitude d'exposition, le tissu d'expression, l'organisme source, le niveau d'hypoxie, la méthode de validation expérimentale, le lieu /pays d'étude, origine ethnique, situation géographique, etc. La base de données rassemble également des informations sur l'association maladie et médicament, le niveau d'expression spécifique au tissu, les associations des voies GO et KEGG. La ressource Web est une plate-forme de serveur unique qui offre des réseaux PPI interactifs et des matrices de similarité sémantique GO parmi les interacteurs. Ces caractéristiques uniques aident à offrir des informations mécanistes sur la pathologie de la maladie. Par conséquent, HighAltitudeOmicsDB est une plate-forme unique pour les chercheurs travaillant dans ce domaine pour explorer, récupérer, comparer et analyser les gènes/protéines associés à HA, leurs réseaux PPI et les similitudes sémantiques GO. La base de données est disponible sur http://www.altitudeomicsdb.in.

Un grand pourcentage de la population mondiale vit dans des zones de haute altitude (HA) et beaucoup visitent également les montagnes au-dessus de 2500 m pour des activités de plein air telles que la randonnée, l'escalade et d'autres sports d'aventure. L'ascension rapide à haute altitude entraîne une diminution instantanée de la pression barométrique. La concentration en oxygène reste la même mais le nombre de molécules d'oxygène par respiration est réduit ; par exemple à une altitude de 3600 m, la pression barométrique diminue à 483 mmHg et < 40% des molécules d'oxygène sont disponibles pour respirer. Puisque la quantité d'oxygène nécessaire à l'activité est la même, le corps doit s'adapter à avoir moins d'oxygène ou hypoxie hypobare1 . Certains résidents des basses terres s'adaptent à la disponibilité réduite d'oxygène à haute altitude grâce à un processus connu sous le nom d'acclimatation, mais certains souffrent de divers troubles comme le mal aigu des montagnes (AMS), l'œdème cérébral de haute altitude (HACE) et l'œdème pulmonaire de haute altitude (HAPE) etc.2,3. C'est pourquoi la recherche pour l'identification des signes précoces de ces altérations physiologiques prend de l'ampleur. Une comparaison récente des profils protéiques des atterrisseurs bas avec leur induction à haute altitude a identifié des protéines exprimées de manière différentielle comme les protéines sériques Irisin, Myostatine, Acute Precursor Proteins (APPs), Apolipoprotein A1 etc. pendant l'acclimatation HA4. Ces protéines sont associées à des processus liés à l'énergie, à la régénération des muscles squelettiques, à des réponses inflammatoires et à d'autres réponses moléculaires caractéristiques à haute altitude5,6. Ces protéines sont désormais proposées comme biomarqueurs pour prédire l'acclimatation précoce des individus à haute altitude. La recherche de nouveaux biomarqueurs protéiques dans les échantillons bas et natifs à l'aide du profilage peptidique est devenue une méthode importante pour identifier des marqueurs diagnostiques ou thérapeutiques potentiels3,6. L'identification des protéines différentiellement exprimées qui jouent un rôle clé dans le processus d'acclimatation a aidé à découvrir les mécanismes responsables de l'acclimatation à HA. Une étude pangénomique a découvert des protéines plasmatiques qui ont le potentiel de prédire l'homéostasie vasculaire pendant HAPE7. De même, une étude transcriptomique a indiqué la modulation de multiples voies et protéines impliquées dans la phase précoce de l'exposition à l'hypoxie hypobare comme VIM, CORO1A, CD37, STMN1 etc.8. Bien qu'il existe une énorme littérature disponible qui a rapporté des profils «-omiques» d'humains et d'animaux exposés à haute altitude; le véritable défi reste d'intégrer toutes ces études pour produire une compréhension holistique des mécanismes en constante évolution impliqués dans les adaptations fonctionnelles des cellules, des tissus et des organes, ainsi que de l'organisme entier dans l'environnement hypoxique de haute altitude. Par conséquent, nous avons développé HighAltitudeOmicsDB où toutes ces données dispersées sont collectées, conservées, analysées et visualisées. La base de données contient actuellement ~ 1300 associations de protéines qui ont été sélectionnées manuellement à partir de publications évaluées par des pairs dont il a été prouvé expérimentalement qu'elles sont régulées par le stress HA. La base de données stocke l'association de chaque protéine avec le stress HA en termes de niveau de régulation (régulation à la hausse/à la baisse), de changement de pli, du groupe de contrôle de l'étude, de la durée et de l'altitude d'exposition, du tissu d'expression, de l'organisme source, du niveau de hypoxie, méthode de validation expérimentale, lieu/pays d'étude, origine ethnique, situation géographique, etc. La base de données indique également s'il a été prouvé expérimentalement que la protéine est associée en tant que biomarqueur HA et fournit un lien vers la publication correspondante. La base de données est également liée à d'autres bases de données telles que le symbole officiel des protéines, les alias protéiques, l'emplacement chromosomique, la longueur, l'identifiant Uniprot, le numéro de la Commission des enzymes (CE), l'identifiant Pfam (Protein Family Information), l'identifiant Protein DataBank (PDB), le Integrative Protein Signature Database (InterPro) ID, Single Nucleotide Polymorphism Database (dbSNP) Id. La base de données présente également des informations fonctionnelles sur les protéines telles que l'annotation GO et l'association des voies de l'Encyclopédie des gènes et des génomes de Kyoto (KEGG) ; leur association avec d'autres maladies et médicaments. La base de données fournit également des interactions de réseau protéine-protéine de chaque protéine avec ses 50 principaux partenaires d'interaction. Le réseau peut être visualisé de manière interactive sur le serveur Web. De plus, HighAltitudeOmicsDB calcule la similarité sémantique des gènes avec ces 50 interacteurs pour identifier les protéines fonctionnellement liées. La base de données stocke en outre les facteurs de transcription interagissant avec le gène et leur type de régulation (répression, activation, distale, proximale, etc.). De plus, les miARN interagissant avec le gène sont également répertoriés. Ainsi, HighAltitudeOmicsDB est une plateforme intégrée unique pour explorer, récupérer, comparer et évaluer les gènes/protéines associés au stress HA, leurs réseaux PPI et la similarité sémantique et la régulation par les facteurs de transcription et les miARN. Cela aidera à découvrir la diaphonie sous-jacente entre les protéines qui existe pour s'acclimater à HA et fournira également des informations mécanistes dans ces réponses moléculaires complexes. Il sera ainsi utile pour identifier des candidats biomarqueurs moléculaires nouveaux et robustes qui peuvent encore aider au développement de nouvelles stratégies diagnostiques, pronostiques et thérapeutiques pour les troubles de haute altitude.

Une combinaison de divers mots-clés tels que "haute altitude", "protéine", "gène", "omics", "hypobaric-hypoxia", "anoxia" a été utilisée pour une extraction approfondie de la littérature à partir de PubMed et des moteurs de recherche Google9. Les publications ont été examinées manuellement pour identifier les gènes/protéines exprimés de manière différentielle. Après avoir supprimé la redondance et la duplicité, une liste complète des protéines qui se sont révélées être différentiellement exprimées (DE) à HA a été organisée à partir de ces publications. Pour chaque protéine DE, ses informations associées ont également été récupérées, notamment ; 'Nom de la protéine', 'Symbole officiel de la protéine', 'Alias', 'Human Entrez ID' homologue, 'Organisme source', 'Tissu d'expression', 'niveau d'hypoxie', 'altitude', 'durée de l'expérience' , « Niveau de réglementation », « Changement de pli », « Détails de l'expérience », « Situation géographique », « Ethnie », « Groupe de contrôle », « Associé en tant que biomarqueur ». Études dans lesquelles l'organisme source était autre qu'humain, le gène/protéine humain homologue a été identifié à l'aide de la protéine BLAST par rapport à la base de données Uniprot. La protéine humaine homologue avec la plus grande similarité de séquence et le moins E-score a été sélectionnée. Le seuil minimum a été considéré comme > 80 % de similarité de séquence par paire. De cette façon, même pour les expériences menées sur différents organismes expérimentaux (souris/rats/yak/oiseau/crapaud/mouton), l'équivalence/traduction humaine serait plus facile. La collection a été stockée au format de fichier JavaScript Object Notation (JSON) et stockée dans MongoDB10 .

Pour chaque protéine, des détails supplémentaires tels que le symbole officiel de la protéine, les alias de la protéine, l'emplacement chromosomique, la longueur, l'Uniprot ID11, le numéro de la Commission des enzymes (CE)12, l'information sur la famille des protéines (Pfam) ID13, la banque de données sur les protéines (PDB) ID14, la base de données de signature intégrative des protéines (InterPro ) Id15, Single Nucleotide Polymorphism Database (dbSNP) Id16 a été collecté pour aider à la réticulation avec d'autres bases de données. Pour chaque protéine, son enrichissement fonctionnel GO et son annotation de voie ont été effectués respectivement par la base de données pour l'annotation, la visualisation et la découverte intégrée (DAVID) et l'outil de mappage KEGG17,18.

Pour chaque protéine de la base de données, ses 50 principaux interacteurs protéiques ont été identifiés par le serveur Web de l'outil de recherche pour la récupération des protéines en interaction (STRING)19. La rigueur de la recherche a été maintenue au niveau le plus élevé (0,9) et le filtre a été placé pour permettre un maximum de 50 protéines associées en tant qu'interacteur direct de la protéine interrogée. La base de données STRING construit le réseau d'interactions protéine-protéine sur la base de sept sources d'informations, à savoir le voisinage sur le chromosome, la fusion de gènes, la co-occurrence phylogénétique, l'homologie, la co-expression, l'interaction déterminée expérimentalement, l'exploration de texte automatisée annotée dans la base de données. Le fichier d'interaction a été téléchargé à partir de la base de données STRING et a été stocké au format JSON.

Pour rendre la base de données plus informative, plusieurs autres attributs ont également été ajoutés ; les associations protéine-maladie ont été extraites de DisGeNET20 ; relation protéine-médicament de la base de données DGIdb 3.021. Tous ces attributs étaient également stockés dans des fichiers JSON.

Les comparaisons sémantiques basées sur l'annotation Gene Ontology (GO) entre les gènes sont une approche innovante pour évaluer quantitativement les similitudes fonctionnelles entre eux. Ils ont été largement utilisés dans diverses analyses bioinformatiques22,23. Plus le score de similarité sémantique est élevé, plus la probabilité que deux gènes/protéines aient une fonction moléculaire similaire ou soit impliquée dans un processus biologique commun est élevée. Un faible score de similarité sémantique montre deux gènes conférant des fonctions moléculaires différentes. Pour identifier la similarité sémantique, chaque protéine de la HighAltitudeOmicsDB et ses 50 principales protéines à interaction directe ont été soumises à l'algorithme GOSemSim R23. GOSemSim est un package R pour le calcul de similarité sémantique entre les termes GO, les ensembles de termes GO, les produits géniques et les clusters de gènes23 . Les résultats ont été représentés dans une matrice 51 × 51. Tous ces fichiers matriciels ont également été stockés au format de fichier JSON.

Tous les fichiers JSON construits ont été transférés vers la collection de bases de données MongoDB et téléchargés sur le serveur localhost à l'aide de pymongo. Les commandes de requête du serveur ont été effectuées dans la boussole MongoDB. La bibliothèque Vis.js a été spécifiquement utilisée pour afficher le réseau d'interactions protéine-protéine24. Les identifiants tels que Human Entrez ID, Uniprot ID, Protein Official Symbol, EC Number, PDB_ID, InterPro ID, Pfam ID, dbSNP ID et les PMID de référence présents dans tous les tableaux sont liés aux bases de données correspondantes pour fournir des détails supplémentaires. L'interface Web comporte également une page "Contactez-nous" qui comprend un formulaire de soumission de données pour la soumission de toute nouvelle donnée par l'utilisateur. Il serait examiné et ajouté régulièrement à la base de données.

HighAltitudeOmicsDB est une ressource conviviale et gratuite qui ne nécessite aucune inscription préalable. Il s'agit d'une ressource complète, non redondante et organisée manuellement de gènes/protéines dont les niveaux d'expression sont validés expérimentalement pour être associés au stress de haute altitude. La base de données peut être consultée à l'aide des options "Parcourir" et "Rechercher".

L'option "Parcourir" permet à l'utilisateur de choisir facilement un ou plusieurs gènes/protéines dans la base de données à partir d'un menu déroulant. Alternativement, l'utilisateur peut télécharger un fichier contenant les symboles officiels des protéines ou saisir les symboles officiels des protéines. En cliquant sur le bouton « Parcourir » adjacent, vous accédez à un format tabulaire qui renvoie à la page de la protéine individuelle. Si la liste d'utilisateurs contient des symboles de protéines qui ne figurent pas dans la base de données, un tableau séparé mettant en évidence les mêmes est également fourni (Fig. 1).

La page d'accueil et l'option de navigation du serveur Web.

L'option "Rechercher" de la base de données offre plusieurs options pour explorer la base de données en fonction des intérêts de recherche des utilisateurs. La recherche par chromosome permet de cliquer sur n'importe quel numéro de chromosome humain et d'identifier les protéines de HighAltitudeOmicsDB qui se trouvent sur le chromosome respectif. La recherche par "durée d'expérience" permet d'identifier la liste des gènes/protéines dont l'expression évolue en heures/jours/semaines/mois/années. La recherche par "Tissu d'expression" ouvre un menu déroulant à partir duquel l'utilisateur peut choisir le tissu d'intérêt (Fig. 2). La recherche par « ethnicité », « organisme source », « niveau de réglementation », « emplacement géographique » ouvre de la même manière un menu déroulant à partir duquel l'utilisateur peut choisir l'ethnicité, l'organisme source, la régulation à la hausse/à la baisse et l'emplacement respectivement, et obtenez une liste tabulaire des gènes/protéines qui sont hyperliés à la page d'informations détaillées respective de la protéine (comme indiqué dans les sections suivantes).

Capture d'écran du module "Recherche".

De plus, l'option « Associé en tant que biomarqueur » conduit à une liste tabulaire de protéines qui ont été proposées/validées en tant que biomarqueurs moléculaires pour le stress HA. Les symboles de protéines sont hyperliés à la page de protéines respective qui fournit un lien vers PubMed qui valide la protéine en tant que biomarqueur. De plus, pour récupérer les protéines qui sont DE de manière dépendante de l'altitude, un curseur interactif pour l'utilisateur (allant de 2200 à 9800 mt) est fourni. L'utilisateur peut définir les valeurs du curseur et récupérer les gènes/protéines associés à une plage d'altitude définie. Ceci a été combiné avec des options (AND/OR) avec le temps d'exposition à l'HA et le niveau de régulation (Up/Down). L'utilisateur peut ainsi être en mesure de faire des requêtes combinées comme des protéines régulées à la hausse/à la baisse exprimées en jours à une altitude de 2200 à 4500 mt. La liste de ces protéines peut être téléchargée au format Excel/PDF pour une analyse plus approfondie.

Le serveur Web permet également d'explorer les protéines de HighAltitudeOmicsDB associées à un facteur de transcription (TF) particulier, un miARN, une maladie, un médicament, la voie GO ou KEGG (Fig. 3).

Capture d'écran du "Module de recherche".

Les détails de la protéine et de son association avec HA sont fournis dans la page d'informations détaillées qui peut être divisée en six sections (Fig. 4).

Base de connaissances

Détails de la page d'information sur les protéines.

Il s'agit de la première section de la base de données qui donne des informations générales sur la protéine comme le symbole officiel de la protéine, les alias, l'emplacement chromosomique, la longueur, l'identifiant Uniprot, le numéro CE, l'identifiant Pfam, l'identifiant PDB, l'identifiant InterPro, l'identifiant dbSNP qui permet la réticulation vers bases de données supplémentaires facilement et rapidement. L'identifiant Uniprot est lié à la base de données Uniprot.

Interactions et sémantique

Les 50 principaux interacteurs protéiques directs de chaque protéine sont identifiés à partir de la base de données STRING à l'aide des seuils décrits dans la section méthodologie. Le réseau est affiché dans un format interactif pour l'utilisateur avec des fonctionnalités de traduction, de zoom avant et de zoom arrière. Les nœuds sont codés par couleur (jaune : la protéine étudiée ; bleu : les 50 meilleurs interacteurs). Les bords sont également codés par couleur (jaune : interactions entre la protéine étudiée et ses 50 interacteurs directs ; bleu : interactions entre les 50 meilleurs interacteurs). Le réseau peut être facilement téléchargé au format .sif qui peut être facilement visualisé dans un logiciel de visualisation de réseau comme Cytoscape, Bina, etc. La liste des interactions entre eux et leur score combiné est facilement fournie sous forme de tableau qui peut être téléchargé en Excel/ Format PDF. Le tableau est également fourni avec une option de « recherche » pour rechercher facilement la protéine d'intérêt.

Le score de similarité sémantique GO par paires a été calculé entre la protéine étudiée et ses 50 principales protéines interagissantes, comme décrit dans la section méthodologie. Les résultats sont visualisés sous la forme d'une matrice 51 × 51. Le score de similarité sémantique GO > 0,8 est surligné en rouge dans la matrice. Si une protéine parmi les 50 meilleurs interacteurs fait également partie de HighAltitudeOmicsDB, le symbole de la protéine dans la matrice est lié à la page d'informations détaillées sur les protéines dans la base de données. Cela aide à identifier les centres fonctionnels de protéines qui seraient associés à HA stress et pourrait donc éclairer les bases moléculaires de l'acclimatation/adaptation.

Association avec la haute altitude

Pour chaque protéine, son association avec le stress HA est compilée sous forme de tableau. Les détails sont présentés comme le symbole de la protéine humaine, l'organisme source (organisme dans lequel l'étude a été réalisée), le tissu d'expression, le niveau d'hypoxie, l'altitude, la durée de l'expérience, le niveau d'expression, le changement de pli, les détails de l'expérience, l'emplacement géographique, l'ethnicité, l'expression du groupe témoin, les détails du groupe témoin et le document de référence. Le groupe témoin est défini sur la base du plan d'étude, par exemple, certaines études avaient des habitants des basses terres comme groupes témoins et des protéines exprimées de manière différentielle ont été identifiées chez les natifs de l'HA ou les habitants des basses terres qui montent à -HA. Dans certaines autres études, les natifs HA ont été considérés comme des témoins et des protéines exprimées de manière différentielle ont été identifiées dans les basses terres. Ainsi, le groupe de contrôle varie selon l'étude et a été clairement mentionné dans la base de données. L'association de la protéine en tant que biomarqueur est également compilée, c'est-à-dire que si la protéine a déjà été validée expérimentalement comme biomarqueur, l'entrée dans la colonne sera être "Oui" sinon "Non". Un lien hypertexte vers la publication respective qui prouve cette association est également facilement fourni. Les changements d'expression d'une protéine dans différentes durées, tissus et conditions d'altitude peuvent être facilement explorés, comparés et analysés dans ce format.

Association avec les TF et les miARN

Les facteurs de transcription et les miARN sont les deux molécules régulatrices transcriptionnelles et post-transcriptionnelles les plus importantes qui ajustent l'expression des gènes. Ainsi, la liste des TF et des miARN connus pour réguler la protéine étudiée est présentée sous forme de tableau. Le tableau d'association TF répertorie le symbole TF (hyperlien vers la base de données Genecards), son identifiant Entrez, le symbole et l'identifiant Entrez de la protéine étudiée, le type d'association, le lien vers la publication qui a confirmé cette association et la base de données à partir de laquelle l'association est extraite. Les tableaux sont téléchargeables au format Excel/CSV et dotés d'une option de « recherche » pour explorer le tableau avec un mot-clé défini par l'utilisateur (Fig. 5).

Capture d'écran de la page d'informations sur les protéines.

De même, le tableau d'association miARN-gène répertorie l'ID miARN miRTarBase, le miARN, le symbole et l'ID Entrez de la protéine étudiée, l'expérience (essai de rapporteur luciférase/western blot/PCR/immunohistochimie, etc.), le type de support et le lien vers la publication respective ( hyperlien vers PubMed) qui a confirmé cette association. Les tableaux peuvent être téléchargés au format Excel/CSV. Le tableau est également fourni avec une option de « recherche » pour explorer le tableau avec un mot-clé défini par l'utilisateur.

Gene Ontology et annotations de la voie KEGG

Les annotations Gene Ontology sont présentées sous forme de tableau. L'identifiant GO, le terme GO et le type GO sont répertoriés. Le GO ID est également lié à QuickGO qui fournit des annotations GO détaillées25. Les annotations de la voie KEGG sont également compilées et présentées sous la forme KEGG ID et KEGG Term. L'identifiant KEGG est lié à la base de données KEGG qui fournit des détails supplémentaires sur les voies respectives.

Ces deux tableaux peuvent être téléchargés au format Excel/CSV et disposent d'une option de « recherche » intégrée pour la recherche par mot-clé.

Association de protéines avec d'autres maladies et médicaments

Cette section fournit des détails sur l'association médicament-maladie. Les informations sont représentées sous forme de tableaux appartenant respectivement à chaque catégorie (Fig. 4). Le premier tableau montre des informations sur le gène cible et son médicament associé. Ce type d'informations peut aider les utilisateurs à guider/concevoir toute expérience de ciblage de médicaments à base de gènes/protéines. Ces deux tableaux sont équipés de l'option "recherche" qui facilite la recherche de termes définis par l'utilisateur dans de longs tableaux. Les tableaux peuvent également être téléchargés au format Excel/PDF.

HighAltitudeOmicsDB contient ~ 1300 associations de 820 protéines qui ont été trouvées exprimées de manière différentielle à haute altitude. Un examen détaillé de la base de données montre que toutes les protéines proviennent d'études expérimentales dans 25 tissus (Fig. 6a). Ces tissus proviennent de 7 espèces animales, à savoir l'homme, le mouton, le rat, la souris, le yack, l'oiseau et le crapaud (Fig. 6b). Les humains en tant qu'organismes sources peuvent être davantage caractérisés en fonction de leur appartenance ethnique, c'est-à-dire les Américains, les Tibétains, les Han-Chinois, les Italiens, les Népalais, les Ladakhis et les Allemands. La durée d'exposition dépend de l'organisme source et varie de 0,5 h à 110 jours pour la population indigène.

Statistiques HighAltitudeOmicsDB (a) Distribution des protéines de haute altitude selon leur tissu d'expression. (b) Distribution des protéines de haute altitude étudiées dans différents organismes sources.

La base de données contient deux types d'annotations fonctionnelles : l'enrichissement des voies GO et KEGG. L'enrichissement GO montre «Processus métabolique» (GO: 0,042,572), «Outer Dynein Arm Assembly» (GO: 0,036,158), «Response To Reactive Oxygen Species» (GO: 0,000,302) comme processus biologiques supérieurs (Fig. 7a). Le « processus métabolique » est fortement associé à la perte de poids en raison du mécanisme d'adaptation à haute altitude26. À haute altitude, l'induction de l'hypoxie hypobare active la protéine HIF qui régule davantage les gènes responsables de la médiation des changements dans le métabolisme cellulaire/énergétique conduisant à la perte de poids due à l'augmentation de la dépense énergétique27. Le deuxième processus biologique «Outer Dynein Arm Assembly» est le processus d'assemblage axonémique. L'augmentation de la longueur et de la densité des cils de type axonème due à l'hypoxie a été associée à la mort cellulaire28. Enfin, la «réponse aux espèces réactives de l'oxygène» est le reflet de l'état redox de la cellule, et les perturbations de l'état redox dues à l'hypoxie hypobare peuvent entraîner un stress oxydatif et des dommages à l'ADN3. De même, des termes tels que « activité fructose-bisphosphate aldolase », « activité oxydoréductase », « agissant sur des donneurs appariés », « incorporation ou réduction d'oxygène moléculaire », « activité oxydoréductase », « agissant sur le peroxyde en tant qu'accepteur », « activité de transfert d'électrons ' et 'ATP Binding', etc. se révèlent être les principales fonctions moléculaires des protéines présentes dans la base de données (Fig. 7b). Toutes les fonctions moléculaires sont des étapes directes ou des mécanismes de rétroaction associés à la phosphorylation oxydative (respiration aérobie). Des études cliniques récentes ont révélé que les habitants des hautes terres ont un pourcentage élevé de mitochondries dans leur tissu musculaire gastrocnémien, ce qui facilite l'adaptation à un environnement à forte dépense énergétique29. « Signalosome COP9 » et « Actomyosine » sont les deux termes de composants cellulaires les plus enrichis dans les ensembles de protéines exprimées de manière différentielle présentes dans la base de données (Fig. 7c). Le signalosome COP9 fait partie du complexe de dégradation protéasomique de l'ubiquitine qui contrôle l'expression de pVHL, HIF-1α et d'autres facteurs de transcription sensibles à l'oxygène régulés pendant l'hypoxie hypobare30. Alors que l'actomyosine est un cytosquelette du complexe de fibres actine-myosine présent dans différents tissus musculaires comme le muscle squelettique. La composition en fibres musculaires des animaux adultes et des humains est nettement altérée lors d'une exposition chronique à haute altitude.

Caractérisation fonctionnelle des protéines de haute altitude différentiellement exprimées (a) GO : processus biologiques. (b) GO : fonctions moléculaires (c) GO : compartiment cellulaire et (d) enrichissement de la voie KEGG.

L'enrichissement de la voie KEGG montre «hsa00910: métabolisme de l'azote» comme la voie la plus enrichie dans l'ensemble de protéines HA exprimées de manière différentielle (Fig. 7d). Le métabolisme de l'azote est un processus de production d'oxydes d'azote et ces oxydes tels que l'azote, le nitrite, le nitrate jouent un rôle important dans la réponse d'adaptation à haute altitude31. L'annotation fonctionnelle globale a révélé l'association des protéines présentes dans la base de données avec les réponses au stress hypoxique hypobare, ce qui confirme l'exhaustivité et la spécificité de la base de données.

Lors d'une ascension en haute altitude, le corps subit des stress environnementaux extrêmes comme l'hypoxie, l'hypoxémie, le stress dû au froid, etc. qui entraînent de nombreux changements physiologiques dans le corps pour son acclimatation au stress HA. Des changements physiologiques déséquilibrés peuvent entraîner des anomalies ou des maladies telles que l'œdème pulmonaire de haute altitude (OPHA), l'œdème cérébral de haute altitude (OCHA), les troubles cardiovasculaires (MCV), l'hypothermie, l'atrophie musculaire et différents types de troubles métaboliques pouvant mettre la vie en danger. Pour identifier des cibles diagnostiques, pronostiques ou thérapeutiques, les différentes biomolécules qui sont régulées dans le stress HA doivent être étudiées de manière holistique. Dans ce but, HighAltitudeOmicsDB fournit une ressource de référence complète d'études d'expression de gènes/protéines associées à des conditions de haute altitude. Il contient des informations sur environ ~ 1300 associations de protéines pour la méta-analyse traitant non seulement des maladies associées à la haute altitude, mais aussi des conditions extrêmes similaires comme le stress dû au froid. La recherche aide l'utilisateur à filtrer les données en fonction de fonctionnalités uniques et combinées. L'utilisateur peut choisir des caractéristiques directement associées à la haute altitude ou indirectement. La recherche combinée aide à extraire un ensemble de données spécifique et aide à réduire la stochasticité des données. Toutes ces caractéristiques augmentent les chances d'une revue et d'une méta-analyse systématiques complètes. La ressource Web n'est pas seulement un référentiel de protéines spécifique à HA ; il peut effectuer une analyse unique qui peut aider à comparer et à analyser les données génomiques/transcriptomiques/protéomiques. La base de données fournit les interactions du réseau PPI de chaque protéine avec ses 50 principaux partenaires d'interaction. Ces réseaux PPI se sont avérés utiles pour éclairer les mécanismes fonctionnels des anomalies dans les conditions HA32,33,34. HighAltitudeOmicsDB pourrait accélérer l'identification de la découverte de biomarqueurs grâce à l'analyse de la matrice de similarité sémantique des gènes. Les rapports de la littérature prouvent que la similarité sémantique est un outil important pour l'identification de biomarqueurs, en particulier à haute altitude35.

HighAltitudeOmicsDB est une ressource interactive et une plate-forme de serveur qui capture et organise les connaissances sur les gènes/protéines associés au stress HA. Il fournit une vue complète des différentes études liées à l'AH ; offre les annotations et la visualisation des réseaux PPI et des similitudes sémantiques associées aux gènes/protéines dans la base de données. HighAltitudeOmicsDB est le premier référentiel de ressources complètes et organisées manuellement de gènes/protéines HA exprimés de manière différentielle qui ont été extraits à l'aide de l'exploration de texte et d'une vaste étude de la littérature. Les informations permettent à l'utilisateur de parcourir les biomolécules en fonction de différents filtres de requête dans la base de données, c'est-à-dire le niveau d'expression ; durée de l'expérience; l'altitude et l'organisme source. HighAltitudeOmicsDB englobe également des informations associées aux protéines telles que la régulation du TF et des miARN, l'association protéine-maladie, l'association protéine-médicament. Par conséquent, la base d'informations de HighAltitudeOmicsDB est très importante et facilite l'utilisation de ces informations pour concevoir des expériences dirigées pour la validation. HighAltitudeOmicsDB identifie également les IPP pour chaque protéine de la base de données et calcule la similarité sémantique GO entre elles. Cette fonctionnalité unique permet d'identifier des centres spécifiques de protéines en interaction liées au stress HA. L'analyse des réseaux et des similitudes PPI permettrait à l'utilisateur de déduire des informations mécanistes pendant HA stress. Le serveur Web offre également une corrélation fonctionnelle des protéines. La corrélation fonctionnelle comprend à la fois l'enrichissement GO et l'enrichissement de la voie KEGG. Les données associées aux protéines peuvent être téléchargées à partir de la base de données au format Excel/PDF pour une analyse plus approfondie.

Les données de la base de données (représentées sous forme de tableaux) sont facilement téléchargeables au format Excel/CSV sur le serveur web. Tout autre ensemble de données utilisé et/ou analysé au cours de l'étude en cours sera disponible auprès de l'auteur correspondant sur demande raisonnable.

Simonson, adaptation de TS Altitude : un aperçu à travers différentes lentilles. Haute Alt. Méd. Biol. 16(2), 125–137 (2015).

Article CAS PubMed PubMed Central Google Scholar

Basnyat, B. & Murdoch, DR Maladie de haute altitude. Lancet 361 (9373), 1967–1974 (2003).

Article PubMed Google Scholar

Ahmad, Y. et al. Un aperçu des changements dans le protéome plasmatique humain lors de l'adaptation à l'hypoxie hypobare. PLoS ONE 8(7), e67548 (2013).

Article CAS PubMed PubMed Central Google Scholar

Wang, C. et al. Exploration des protéines de phase aiguë et des cytokines inflammatoires dans le diagnostic précoce du mal aigu des montagnes. Haute Alt. Méd. Biol. 19(2), 170–177 (2018).

Article CAS PubMed Google Scholar

Sliwicka, E. et al. Niveaux sériques d'irisine et de myostatine après 2 semaines d'escalade en haute altitude. PLoS ONE 12(7), e0181259 (2017).

Article PubMed PubMed Central Google Scholar

Ahmad, Y. et al. Identification de l'haptoglobine et de l'apolipoprotéine AI comme biomarqueurs de l'œdème pulmonaire de haute altitude. Intégr. Génome. 11(3), 407–417 (2011).

Article CAS Google Scholar

Sharma, M., Singh, SB et Sarkar, S. L'analyse de l'expression à l'échelle du génome suggère une perturbation de l'homéostasie vasculaire lors d'un œdème pulmonaire de haute altitude. PLoS ONE 9(1), e85902 (2014).

Article PubMed PubMed Central Google Scholar

Gaur, P. et al. L'analyse du transcriptome temporel suggère une modulation de plusieurs voies et d'un réseau de gènes impliqués dans l'interaction cellule-cellule au cours de la phase précoce de l'exposition à haute altitude. PLoS ONE 15(9), e0238117 (2020).

Article CAS PubMed PubMed Central Google Scholar

Fiorini, N., Lipman, DJ & Lu, Z. Vers PubMed 2.0. Elife 6, e28801 (2017).

Article PubMed PubMed Central Google Scholar

Fejes, AP, Jones, MJ & Kobor, MS DaVIE : Base de données pour la visualisation et l'intégration de données épigénétiques. Avant Genet. 5, 325 (2014).

Article PubMed PubMed Central Google Scholar

Pundir, S. et al. Outils UniProt. Courant. Protocole Bioinformer. 53, 1 29 1-1 29 15 (2016).

Article Google Scholar

Bairoch, A. La base de données ENZYME en 2000. Nucleic Acids Res. 28(1), 304–305 (2000).

Article CAS PubMed PubMed Central Google Scholar

Finn, RD et al. Pfam : La base de données des familles de protéines. Nucleic Acids Res 42 (numéro de la base de données), D222–D230 (2014).

Article CAS PubMed Google Scholar

Berman, HM et al. La banque de données sur les protéines. Nucleic Acids Res 28(1), 235–242 (2000).

Article CAS PubMed PubMed Central Google Scholar

Hunter, S. et al. InterPro : La base de données intégrative des signatures protéiques. Nucleic Acids Res 37 (numéro de la base de données), D211–D215 (2009).

Article CAS PubMed Google Scholar

Smigielski, EM et al. dbSNP : Une base de données de polymorphismes de nucléotides simples. Nucleic Acids Res 28(1), 352–355 (2000).

Article CAS PubMed PubMed Central Google Scholar

Dennis, G. Jr. et al. DAVID : Base de données pour l'annotation, la visualisation et la découverte intégrée. Génome Biol 4(5), P3 (2003).

Article PubMed Google Scholar

Kanehisa, M. et al. KEGG : Nouvelles perspectives sur les génomes, les voies, les maladies et les médicaments. Acides nucléiques Res 45(D1), D353–D361 (2017).

Article CAS PubMed Google Scholar

von Mering, C. et al. STRING : base de données d'associations fonctionnelles prédites entre protéines. Nucleic Acids Res. 31(1), 258–261 (2003).

Article Google Scholar

Pinero, J. et al. DisGeNET : Une plateforme complète intégrant des informations sur les gènes et variants associés aux maladies humaines. Acides nucléiques Res 45(D1), D833–D839 (2017).

Article CAS PubMed Google Scholar

Cotto, KC et al. DGIdb 3.0 : une refonte et une extension de la base de données sur les interactions médicament-gène. Acides nucléiques Res 46(D1), D1068–D1073 (2018).

Article CAS PubMed Google Scholar

Pesquita, C. Similitude sémantique dans l'ontologie des gènes. Méthodes Mol. Biol. 1446, 161-173 (2017).

Article CAS PubMed Google Scholar

Yu, G. et al. GOSemSim : un package R pour mesurer la similarité sémantique entre les termes GO et les produits géniques. Bioinformatique 26(7), 976–978 (2010).

Article CAS PubMed Google Scholar

Rosenthal, SB et al. Visualisation interactive du réseau dans les notebooks Jupyter : visJS2jupyter. Bioinformatique 34(1), 126–128 (2018).

Article MathSciNet CAS PubMed Google Scholar

Binns, D. et al. QuickGO : un outil Web pour la recherche d'ontologies génétiques. Bioinformatique 25(22), 3045–3046 (2009).

Article CAS PubMed PubMed Central Google Scholar

Moore, LG Mesure de l'adaptation à haute altitude. J. Appl. Physiol. (1985) 123(5), 1371–1385 (2017).

Article CAS PubMed Google Scholar

Palmer, BF & Clegg, DJ Montée en altitude comme méthode de perte de poids : les avantages et les inconvénients de l'activation du facteur inductible par l'hypoxie. Obésité (Silver Spring) 22(2), 311–317 (2014).

Article PubMed Google Scholar

Brown, JM et al. L'hypoxie régule l'assemblage des cils dans les suppresseurs de Tetrahymena dépourvus d'un gène de sous-unité de transport intraflagellaire. Mol. Biol. Cellule 14(8), 3192–3207 (2003).

Article CAS PubMed PubMed Central Google Scholar

Scott, GR, Guo, KH & Dawson, NJ La base mitochondriale de la variation adaptative des performances aérobies chez les souris sylvestres de haute altitude. Intégr. Comp. Biol. 58(3), 506–518 (2018).

Article CAS PubMed Google Scholar

Mikus, P. & Zundel, W. Faire face à l'hypoxie. Sémin. Cellule Dév. Biol. 16(4–5), 462–473 (2005).

Article CAS PubMed PubMed Central Google Scholar

Levett, DZ et al. Le rôle des oxydes d'azote dans l'adaptation humaine à l'hypoxie. Sci. Rep. 1, 109 (2011).

Article PubMed PubMed Central Google Scholar

Lopez-Cortes, A. et al. Analyses cliniques, génomiques et de mise en réseau d'un patient équatorien amérindien de haute altitude présentant une insensibilité congénitale à la douleur avec anhidrose : à propos d'un cas. BMC Med. Génome. 13(1), 113 (2020).

Article CAS Google Scholar

Zhao, Y. et al. Analyse protéomique comparative des spermatozoïdes de porc tibétain à haute et basse altitude. BMC Génom. 20(1), 569 (2019).

Article Google Scholar

Xin, J. et al. Paysage d'accessibilité à la chromatine et réseau de régulation de l'adaptation à l'hypoxie à haute altitude. Nat. Commun. 11(1), 4928 (2020).

Article MathSciNet CAS PubMed PubMed Central Google Scholar

Ahmad, Y. et al. Le protéome du poumon hypoxique induit par l'hypobarie : aperçus du profilage protéomique temporel pour la découverte de biomarqueurs. Sci. Rep. 5, 10681 (2015).

Article PubMed PubMed Central Google Scholar

Télécharger les références

Nous remercions Mme Shikha Jain, Mme Ruchi, Mme Jaspreet, Mme Avinksha Kathpalia et Mme Radhika pour leur aide dans la collecte des données.

Institut de la défense de la physiologie et des sciences connexes, Lucknow Road, Timarpur, New Delhi, 110054, Inde

Apoorv Gupta, Sandhya Pathak, Rajeev Varshney, Yasmin Ahmad et Pankaj Khurana

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

AG, PK et RV ont conceptualisé l'idée. AG et PK ont organisé les données. PK a conçu les fonctionnalités et organisé les réseaux. SP a organisé les similitudes sémantiques. AG et PK ont rédigé et révisé le manuscrit.

Correspondance à Pankaj Khurana.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournir un lien vers la licence Creative Commons et indiquer si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Gupta, A., Pathak, S., Varshney, R. et al. HighAltitudeOmicsDB, une ressource intégrée pour les gènes et protéines associés à haute altitude, les réseaux et les similitudes sémantiques. Sci Rep 13, 9307 (2023). https://doi.org/10.1038/s41598-023-35792-3

Télécharger la citation

Reçu : 23 juillet 2021

Accepté : 24 mai 2023

Publié: 08 juin 2023

DOI : https://doi.org/10.1038/s41598-023-35792-3

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.