Buch, Deutsch, 186 Seiten, Format (B × H): 145 mm x 210 mm
Buch, Deutsch, 186 Seiten, Format (B × H): 145 mm x 210 mm
ISBN: 978-3-89722-617-3
Verlag: Logos
Thema dieser Arbeit ist die Clusteranalyse von Hybridisierungsdaten aus Gen-array Experimenten. Diese Experimente erhalten zunehmende Bedeutung in der biologischen und pharmazeutischen Forschung, weil sie einen hohen Durchsatz an Datenmaterial ermöglichen und Information über komplexe biologische Zusammenhünge liefern. So können z.B. krankheitsrelevante Gene identifiziert und die Herstellung von Medikamenten erheblich beschleunigt werden. In den meistenGeweben gibt es mehr als 10,000 verschiedene aktive Gene in unterschiedlichen Hüufigkeiten. Ziel der oligonucleotidefingerprinting Technik ist es, für ein gegebenes Gewebe die Anzahl der verschiedenen Gene und deren Hüufigkeit zu ermitteln. Die Gene werden in Form von klonierten Sequenzen (cDNA Klone) auf einer Filtermembran immobilisiert (ca. 50,000) und mitca. 250 kurzen, radioaktiv markierten Sequenzen (Proben) hybridisiert. Entsprechend der chemische Reaktion liefert dieG esamtheit dieser Hybridisierungsexperimente für jeden cDNA Klon einen hochdimensionalen Vektor, dessen Eintrügesignalisieren, ob die entsprechende kurze Probensequenz in der cDNA Klonsequenz enthalten ist oder nicht. Ziel dermathematischen Analyse ist nun, anhand der Vektoren von Hybridisierungssignalen (fingerprints) diejenigen Klonezusammenzufassen, die das gleiche Gen reprüsentieren. Dies kann durch Clusteranalyse geleistet werden, dabei erfordertsowohl die Menge als auch die Dimensionalitüt der Daten neue, spezifische Analysemethoden. Konzepte aus derInformationstheorie (Entropie, Transinformation) haben sich hierbei als zweckmüßig erwiesen. Diese Arbeit verfolgt einedoppelte Zielrichtung: Die Einführung bzw. Weiterentwicklung informationstheoretischer Ühnlichkeitsmaße in Clusteranalyseund Clustervalidierung sowie die Implementierung von Datenauswertungssoftware für oligonucleotide fingerprinting Hybridisierungsxperimente.
Als neues Maß zur Bewertung paarweiser Ühnlichkeit hochdimensionaler Vektoren wird eine modifizierte Version derTransinformation, die relative Transinformation, in die Clusteranalyse eingeführt. Ein neues Optimalitütskriterium zurBerechnung geeigneter Clusterreprüsentanten wird definiert, und im Falle von Binürdaten wird ein Algorithmus angegeben, derdiesem Optimalitütskriterium genügt. Das neue Maß wird im weiteren zur Validierung von Clusterresultaten benutzt und mit etablierten Validierungsmaßen verglichen. Zusützlich wird ein Kriterium eingeführt, das den Vergleich verschiedenerValidierungsmaße in bezug auf ihre Fehlertoleranz erlaubt. Die relative Transinformation erweist sich dabei als überle gengegenüber den anderen Vergleichsmaßen.
Im zweiten Teil der Arbeit werden die entwickelten Methoden anhand experimenteller Datensütze getestet. EinClusteralgorithmus wird beschrieben, der auf einem sequentiellen K-means Verfahren beruht, das verbessert wurde, umpraktischen Anforderungen gerecht zu werden. Neben dem Clusteralgorithmus werden weitere für die Analyse derHybridisierungsexperimente wichtige Fragestellungen beantwortet. Die Gesamtheit der implementierten Programme ist dabeizu einem Standardauswertungspaket am Max-Planck Institut für Molekulare Genetik geworden.
Autoren/Hrsg.
Fachgebiete
- Naturwissenschaften Biowissenschaften Molekularbiologie
- Medizin | Veterinärmedizin Medizin | Public Health | Pharmazie | Zahnmedizin Vorklinische Medizin: Grundlagenfächer Molekulare Medizin, Zellbiologie
- Medizin | Veterinärmedizin Medizin | Public Health | Pharmazie | Zahnmedizin Vorklinische Medizin: Grundlagenfächer Humangenetik