Computational approaches applied to pharmacological profiling
Equipe 2 des Prs A-C.Camproux & O. Taboureau (Université Paris Diderot)
Publications de l'équipe / Organigramme
Améliorer l’efficacité des médicaments tout en limitant leurs effets indésirables est un enjeu important qui stimule la recherche de nouvelles connaissances sur les profils pharmacologiques des médicaments. La production massive des informations «omiques» provenant de technologies à haut débit et des structures protéiques tri-dimensionnelles ainsi que l’accès croissant à des bases de données cliniques rendent désormais accessible à la recherche académique le profilage pharmacologique des médicaments par les approches in silico.
Notre équipe se concentre sur l’exploration approfondie et la prédiction des interactions entre les molécules chimiques et les protéines ainsi que l’estimation de leurs effets au niveau de la biologie du système humain à travers le développement d’outils computationnels comme la chémoinformatique et la bioinformatique structurale. Notre objectif principal est de proposer une aide à la décision lors des différentes étapes de développement d’un médicament (efficacité, sélectivité, risque de toxicité) et d’améliorer la compréhension du mécanisme d’action des petites molécules chimique et la prédiction des effets secondaires ou off-target des médicaments.
Dans cet objectif, nous travaillons sur 3 thèmes complémentaires :
i) Espace des molécules chimiques (Chémoinformatique, Drug-Design)
ii) Espace des cibles et poches protéiques (Bioinformatique structurale, Biostatistique)
ii) Espace biologique (Intégration de données, Pharmacologie des systèmes, Pharmacogénomique, Bioinformatique génomique)
En effet, des études récentes ont démontré l’intérêt de combiner l’information des petites molécules chimiques à l’information des cibles protéiques (3D) et de leurs sites de liaison (poches ou canaux protéiques 3D capables de fixer une molécule) pour caractériser et prédire les interactions cible-molécule et les profils des partenaires de ces interactions. Les informations obtenues à partir de l’analyse conjointe de l’espace des protéines et des molécules (thèmes 1 et 2) sont liées par le thème 3 aux données biologiques et cliniques intégrées par des approches de réseaux.
Figure 1 : Notre projet se découpe en 3 thèmes complémentaires.
(i) Espace des molécules chimiques (Chemoinformatique, drug-design)
Le profilage de l’espace des molécules a pour but d’encoder optimalement la structure chimique des composés bioactifs en paramètres pertinents pour analyser leur diversité et les comparer efficacement. En effet, différents softwares proposent des milliers de descripteurs ou «fingerprints» pour chaque molécule ou ligand. Cependant, certains descripteurs sont difficiles à interpréter physiquement, certains descripteurs cruciaux manquent encore, ce qui contribue au goulot d’étranglement pour obtenir des approches QSAR robustes et interprétables.Nous développons régulièrement de nouveaux descripteurs pour la communauté, voir http://petitjeanmichel.free.fr/itoweb.petitjean.freeware.html et références citées. Une étude récente a permis de décrire les ligands non plus par des sphères mais par des cylindres de hauteur minimale, adaptés à leur faible épaisseur (Benkaidali et al., Bioinformatics 2014), pour les molécules allongées. Ceci ouvre des opportunités pour sélectionner les trajectoires possibles des ligands dans les canaux protéiques et des méthodes de criblage virtuel rapides pour identifier des substrats potentiellement actifs.
(ii) Espace des cibles et poches protéiques (Bioinformatique structurale, Biostatistique)
Les propriétés clés d'une «bonne cible» de médicament ne sont actuellement pas suffisamment explorées. L’effet thérapeutique des petites molécules ayant des propriétés drug-like est atteint quand elles se lient au niveau de cavités des protéines, appelées «poches protéiques» avec une forte affinité. Prédire la druggabilité, c’est à dire la capacité d'une poche protéique, à lier une molécule médicament est donc une étape clé dans les projets de découverte de médicaments. En effet, au cours de la phase préliminaire longue et coûteuse des projets de découverte de médicaments, le manque d’information sur la druggabilité et une mauvaise sélection des cibles est responsable de 60% des taux d'échec. Ainsi mieux comprendre les cibles biologiques et leurs structures et élaborer une méthode de prédiction de leur druggabilité sont des points cruciaux pour prioritariser les cibles et prédire les effets secondaires et de polypharmacologie des médicaments.Notre équipe travaille d’une part à obtenir une caractérisation détaillée des structures 3D des protéines pour analyser leurs propriétés, étudier leur flexibilité et les comparer. Nous développons des outils pour encoder et simplifier les structures protéiques à partir de la notion d’Alphabet Structural (SA-outils, Camproux et al, J. Mol. Biol. 1999) afin d’effectuer des comparaisons rapides des structures ou des fragments structuraux permettant la recherche de motifs fonctionnels (Regad et al, BMC Bioinformatics, 2011, NAR, 2011). D’autre part, pour améliorer la compréhension et la caractérisation des poches protéiques au sein de notre équipe, nous travaillons sur (i) l’estimation des poches dite “profondes” particulièrement difficile à estimer (Benkaidali et al., Bioinformatics 2014), (ii) le développement de descripteurs géométriques et physico-chimiques originaux et détaillés des poches (Pérot et al, DDT 2011) permettant de les caractériser finement, (iii) des classifications et comparaisons de poches basées sur ces descripteurs.
L’exploration et la comparaison des différentes méthodes d'estimation des poches protéiques existantes ont confirmé qu'il n'existe pas de méthode d'estimation consensus. Or les estimations des poches ont un impact direct sur les propriétés des poches et donc leur indice prédit de druggabilité. Ce problème d’estimation est particulièrement délicat pour les poches dans une forme apo (non liée à un ligand) dont l’estimation n’est pas guidé par la présence du ligand. Nous avons développé un modèle de prédiction statistique de la druggabilité des poches protéiques, optimisé sur plusieurs méthodes d’estimations des poches, afin d’être le plus stable et performant possible sur les poches en forme holo mais aussi apo, quel que soit le type d’estimation de poches utilisé (Borrel et al, JCIM, 2015). Nous avons ensuite mis à la disposition de la communauté un site web-server PockDrug, proposant ce modèle de prédiction de druggabilité des poches apos ou holos, pour des poches pré-estimées par l’utilisateur, un ensemble des poches d’une protéine d’intérêt ou un jeu de protéines de la PDB (Abi Hussein et al, NAR, 2015).
L’analyse conjointe de l’espace des ligands et des cibles permet de modéliser les interactions protéines-ligands, de développer des approches de prédiction de profils de poches ou de profils de ligands et d’apporter de l’information sur la pharmacologie de certains médicaments.
Espace conjoint des cibles et des molécules (protéochémométrique, chémogénomique)
A partir de la caractérisation d’un profil de poche, druggable ou non, nous pouvons prédire plus finement quel profil (en terme de géométrie et de propriétés physico-chimiques) de ligand est nécessaire pour qu’il puisse se fixer à la poche. Les profils de poches et de ligands appariés peuvent ainsi être analysés et comparés afin de prédire des interactions potentielles poche-ligand. A partir de la modélisation statistique des paires de descripteurs des poches-ligands en interaction, il est pertinent d’établir (i) une corrélation entre la nature de la poche et sa propension à se lier à certains profils de ligands et (ii) à l'inverse, une corrélation entre la nature des ligands et sa propension à se lier à certains profils de poche (Pérot et al. Plos One 2013). Cette modélisation statistique vise à prédire le profil d’un des partenaires des interactions poches-ligands, ce qui pourrait ouvrir les voies à la prédiction des effets off- ou on-targets (hors cible), des effets toxiques ou secondaires et contribuer à la conception d'une petite molécule pour une poche donnée.
(iii) Espace biologique (Intégration de données, Pharmacologie des systèmes, Pharmacogénomique, Bioinformatique génomique)
L’objectif final est d’associer des informations cible-médicament au niveau des systèmes biologiques afin de contribuer aux efforts internationaux dans le domaine des réseaux pharmacologiques et de la médecine personnalisée.
Développement d’outils et sites de chemo et bioinformatiques appliqués au profilage pharmacologique
Quelques exemples de logiciels et bases de données développés et mise à la disposition pour la communauté scientifique :
- Prédiction de la druggabiltié des poches protéiques : http://pockdrug.rpbs.univ-paris-diderot.fr/cgi-bin/index.py?page=home (Abi Hussein et al, NAR, 2015)
- Profilage pharmacologique : ChemProt-3.0 : ChemProt-3.0: a global chemical biology diseases mapping. (Kringelum J. et al., Database (Oxford),2016)
- Recherche de motifs fonctionnels : SA-Mot : (Regad L., et al., Nucleic Acids Research 2011)
- Estimation des canaux et cavités protéiques CCCPP : (Benkaidali et al., Bioinformatics 2014)
- Descripteurs de poches et ligands : http://petitjeanmichel.free.fr/itoweb.petitjean.freeware.html
Responsabilité de cursus de l’UFR Sciences du Vivant de Paris-Diderot
Anne Badel - Responsable de la Licence de Biologie Informatique
Anne-Claude Camproux – Coordinatrice et responsable du Master In Silico Drug Design (ISDD) - Responsable du module Statistique en expérimentation biologique (STAB) du DIU CESAM
Delphine Flatters - Co-responsable du Master 1 de Biologie Informatique
Leslie Regad - Co-responsable du Master 2 In Silico Drug Design (ISDD)
Olivier Taboureau - Co-responsable du Master 1 In Silico Drug Design (ISDD)