Aspects algorithmiques de la prédiction des structures secondaires d'ARN - TEL - Thèses en ligne
  Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Thèse Année : 2001

Aspects algorithmiques de la prédiction des structures secondaires d'ARN

Résumé

In this work we study two algorithmic problems: triangular forms in boolean matrices and spatial structure search problems in molecular biology. We first consider the following problem: Given a square boolean matrix, can we permute its lines to yield a triangular matrix? This problem arises when we compute in place a system of equations. One natural way to solve the problem is to use graph theory, especially bipartite graphs. We show several NP-completeness results and introduce some extensions of the problem. At the RNA level, biological signals are defined by a combination of spatial structures and sequence patterns. Until now, few attempts have been made to develop general purpose search programs that take into account both sequence and structure criteria. Therefore, there is a growing demand for search programs combining both descriptive and programming approaches. With this aim in view, we study combinatorial algorithmic problems on 2-intervals intersection graphs. Recent research considering the topic of intersection graphs of geometric objects shows the relevance of the 2-interval notion. We show that pattern matching in 2-intervals set is an NP-complete problem even when restricted to constrained spatial structures. One important goal of this thesis is to use techniques for the prediction of structural biological patterns, and especially auto-catalytic group 1 introns. Our ORANGE algorithm for predicting auto-catalytic group 1 introns is an improved version of the CITRON algorithm of Lisacek and Michel. It is both time efficient and has good biological results. Moreover, an implementation of the ORANGE algorithm is available on the Internet.
Cette thèse traite deux types de problèmes algorithmiques : des problèmes de triangularisation de matrices booléennes par permutation des lignes et des colonnes et des problèmes de découverte de structures secondaires d'ARN. Nous étudions des problèmes de triangularisation de matrices booléennes par permutation des lignes et des colonnes. Ce problème apparaît, par exemple, lorsque l'on souhaite calculer "en place" un système d'équations. Une façon naturelle d'aborder ce problème est de se placer dans le cadre général de la théorie des graphes et des graphes bipartis en particulier. Nous présentons de nombreux résultats de complexité - essentiellement de NP-complétude - liés à ce problème et introduisons quelques extensions dont nous précisons toujours la complexité. Certaines familles d'ARN sont très précisément définies par des motifs de séquence, et des contraintes structurelles secondaires et tertiaires. La plupart des outils ne sont pas adaptés puisqu'ils n'intègrent pas toutes les connaissances sur la molécule lors de l'exploration des banques de séquences. D'où l'intérêt d'algorithmes de recherche assurant une recherche en séquence et structure par le biais d'un descripteur défini par l'utilisateur intégrant l'ensemble des connaissances caractérisant l'ARN à détecter. Une nouvelle façon d'aborder ce problème consiste en l'étude de problèmes algorithmiques sur les graphes d'intersection d'un ensemble de 2-intervalles. Cette notion de 2-intervalles se trouve dans la lignée des études actuelles en matière d'algorithmique de graphes où l'on étudie de plus en plus les structures des graphes issues de modèles géométriques. Nous présentons plusieurs résultats de complexité et montrons en particulier que la recherche de motifs dans un ensemble de 2-intervalles est un problème NP-complet. Nous nous intéressons, plus particulièrement, à appliquer ces travaux pour la prédiction de motifs biologiques structurés. Plus spécifiquement, nous avons mis au point l'algorithme ORANGE pour la prédiction des introns auto-catalytiques de groupe 1 dans de grandes séquences génomiques. Cet algorithme est une amélioration de l'algorithme CITRON mis au point par F. Lisacek et F. Michel du point de vue de la rapidité d'exécution. De plus, une mise-en-œuvre de l'algorithme ORANGE est accessible en ligne sur Internet.
Fichier principal
Vignette du fichier
Vialette_2001.pdf (44.42 Mo) Télécharger le fichier

Dates et versions

tel-00628623 , version 1 (05-10-2011)

Identifiants

  • HAL Id : tel-00628623 , version 1

Citer

Stéphane Vialette. Aspects algorithmiques de la prédiction des structures secondaires d'ARN. Informatique [cs]. Université Paris-Diderot - Paris VII, 2001. Français. ⟨NNT : ⟩. ⟨tel-00628623⟩
312 Consultations
92 Téléchargements

Partager

More