Innovative Barcode-Konzepte für DNA-Sequenzierverfahren der zweiten Generation

Loading...
Thumbnail Image

Date

2016-06-06

Journal Title

Journal ISSN

Volume Title

Publication Type

Dissertation

Published in

Abstract

Die Sequenzierung von DNA wurde zur Jahrtausendwende durch die Entwicklung der Sequenzierverfahren zweiter Generation revolutioniert. Die massive Parallelisierung als Kernkonzept ermöglicht seither eine stetig steigende Effizienz und damit sinkende Kosten für die Analyse von DNA und RNA. Grundlegend für die Parallelisierung ist auch der Einsatz von synthetisch erzeugten DNA-Sequenzen, Oligonukleotide genannt, die im Verbund mit nativen Molekül- Fragmenten eigenständige Einheiten, sogenannte Templates, bilden. Die Einbettung von zusätzlichen Sequenzen zur Markierung der Templates vor der Verarbeitung begründet das Feld der Barcodes. Das Auftreten von Sequenzfehlern und quantitativen Effekten im experimentellen Protokoll der Sequenzierung, wie in der PCR, motivieren die Anwendung von Fehlerkorrekturmechanismen und die Normalisierung von Zählgrößen durch den Einsatz von Barcodes. Die dargelegte Arbeit umfasst zwei unterschiedliche Konzepte zum Einsatz von Barcodes, wobei zwei gänzlich verschiedene Anwendungsgebiete betrachtet werden: Zur gemeinsamen Sequenzierung von unterschiedlichen Proben, Multiplexing genannt, wird das Konzept der Watermark Codes für die Verwendung als Barcodes vorgeschlagen. Basierend auf dem ursprünglichen Prinzip von Davey und MacKay aus dem Jahre 2000 wird das Konzept für die DNA-Sequenzierung angepasst und die Eignung des Verfahrens anhand praxistauglicher Codes gezeigt. Den zweiten Themenkomplex bildet der Einsatz von Zufallsbarcodes. Auf Basis der zufälligen Kombination von speziellen Oligonukleotiden können mit moderatem Aufwand sehr viele unterschiedliche Zufallsbarcodes erzeugt werden, die zur Zählung von Molekülen verwendet werden. Als Erweiterung von zwei bereits bekannten Konzepten wird ein verallgemeinertes Verfahren zur Implementierung von Zufallsbarcodes vorgestellt und experimentell anhand der Illumina Technologie evaluiert.
Since the turn of the millennium, DNA-Sequencing has been revolutionised by the upcoming next-generation sequencing methods. The massive parallelisation, as a central concept, provides a steadily increasing efficiency and dropping costs on the analysis of DNA and RNA. For this parallel strategy an integration of synthetic DNA sequences, the oligonucleotides, is essential, which are used to build short separable compounds with native DNA fragments, the so called templates. The concept of barcodes is involved in the embedding of additional sequences into the oligonucleotides to label the compound-molecules prior to experimental processing. The existence of sequence errors and quantitative effects during the sequencing protocol, e.g. the PCR, gives the motivation for the application of error correction and the normalization of molecule-counts via labelling. The presented work includes two diverse concepts for barcoding, within two entirely different tasks: For the joint sequencing of several probes, known as multiplexing, the concept of Watermark Codes is proposed: Based on the original principle given by Davey and MacKay in the year 2000, an adaptation for DNA sequencing is given as a proof of principle study. The second topic is the application of random barcodes. Based on the stochastic combination of welldefined oligonucleotides, random barcodes can give a cost-efficient generation of diverse sequences to be used for counting molecules. As the generalisation of two known concepts, a novel method is proposed to produce random codes, which are evaluated via the Illumina sequencing technology.

Description

Faculties

Fakultät für Ingenieurwissenschaften, Informatik und Psychologie

Institutions

Institut für Nachrichtentechnik

Citation

DFG Project uulm

License

Standard (ohne Print-on-Demand)

Is version of

Has version

Supplement to

Supplemented by

Has errratum

Erratum to

Has Part

Part of

DOI external

Institutions

Periodical

Degree Program

DFG Project THU

Series

Keywords

DNA-Sequenzierung, Next generation sequencing, NGS, PCR-Bias, Zufallsbarcodes, Random barcoding, PCR-Korrektur, DNA Barcoding, DNS-Synthese, DNS-Sequenz, Polymerase-Kettenreaktion, Multiplexing, DNA-synthesis, DNA, DDC 000 / Computer science, information & general works