Rechnen mit DNS

                                                von Eberhard Bertsch & Peter Imming
                                                     Studium Integrale Journal
                                                 17. Jahrgang / Heft 1 - Mai 2010
                                                           Seite 16 - 20


http://www.wort-und-wissen.de/sij/sysimg/tab30.gif

Zusammenfassung: DNS-Moleküle enthalten in kodierter Form den Bauplan für Proteine, die in
Lebewesen als Baustoffe oder Biokatalysatoren fungieren. Der Bauplancharakter und die – verglichen
mit anderen Biopolymeren – relativ leichte Herstellbarkeit von DNS wird gentechnisch inzwischen
vielfältig genutzt. Die Möglichkeiten der menschlichen Nutzung von DNS beschränken sich jedoch
nicht darauf. Seit etwa zwanzig Jahren wird theoretisch und experimentell daran gearbeitet,
DNS-Sequenzen auch als Träger von Rechenoperationen nutzbar zu machen, also „Computer“ zu bauen,
deren Kernbestandteile Nukleotidketten und Eiweiße sind. Von besonderer Bedeutung war dabei ein
Experiment von Adleman (1994), das die prinzipielle Lösbarkeit einer bekannt schwierigen
mathematischen Aufgabe demonstrierte. Es konnte gezeigt werden, dass auf DNS-Molekülen Programme
für beliebige Zwecke darstellbar sind. Der Sachverhalt legt somit den Vergleich mit einer
technischen Hardware für darauf programmierte Software nahe. Nach Auffassung der Autoren ist er ein
weiteres Indiz dafür, dass DNS als ein intelligentes Konstrukt angesehen werden sollte und nicht
als Produkt undurchdachter Zufälle und Notwendigkeiten.

http://www.wort-und-wissen.de/sij/sysimg/tab30.gif


                                              Inhalt

                                                                                                  •

Einführung

                                                                                                  •

Anwendungen

                                                                                                  •

Die erstaunlichen Eigenschaften des Moleküls DNS

                                                                                                  •

Literatur


Einführung

In diesem Artikel möchten wir ein Thema vorstellen, das seit etwa zwei Jahrzehnten von Fachleuten
bearbeitet wird und in dieser Zeit zu vielen theoretischen und praktischen Ergebnissen geführt hat,
aber wegen der Komplexität der Fragestellung bisher noch nicht in der breiten Öffentlichkeit
bekannt ist. Es geht um das Rechnen – genauer: die Informationsverarbeitung – mit
Desoxyribonukleinsäure, abgekürzt DNS, dem Trägermaterial der genetischen Eigenschaften aller
Lebewesen. Es geht nicht um die Struktur von DNS als solcher, um Gentechnik oder Gentherapie,
sondern wir zeigen einen erstaunlichen weiteren Aspekt der ohnehin genial konstruierten DNS auf.


http://www.wort-und-wissen.de/sij/sij171/img/sij171-2-1b.gif

http://www.wort-und-wissen.de/sij/sij171/img/sij171-2-1a.gif

Abb. 1: Aufbau der DNS. Links Doppelhelix, Z = Zucker Desoxyribose, P Phosphatrest. Rechts die vier
Grundbausteine (Basen) der DNS. Je zwei Basen passen genau zueinander und sind daher
„komplementär“. Die Basenpaarung erfolgt über Wasserstoffbrücken (gepunktete Linien). Mittels der
DNS-Sequenz (Abfolge) werden die Reihenfolgen der Aminosäuren in den Proteinen programmiert. Ein
Triplett steht für eine Aminosäure. (Aus Junker & Scherer 2006)

Heute übliche Rechner (Computer) funktionieren auf der Grundlage eng vernetzter („integrierter“)
elektronischer Schaltungen. Deren elementare Bausteine sind Feldeffekt-Transistoren, zumeist aus
Silizium, von denen viele Millionen auf einer Fläche von der Größe eines Fingernagels untergebracht
sind. Vor der Entdeckung und technischen Nutzung von Transistoren um die Mitte des vorigen
Jahrhunderts gab es mechanische und elektromechanische Rechner, deren Funktion auf anderen
physikalischen Grundlagen beruhte.

Auch mit optischen, sogar mit hydraulischen Bauteilen könnten Rechner konstruiert werden.

Hier ist nun die Rede vom Rechnen mit DNS, also der Nutzung einer in Lebewesen vorkommenden
Substanz als Träger der Rechenschritte (s. Glossar, „Informationsverarbeitung“). Die Rechen- und
Speicherungsschritte, die in heutigen Computern mit elektromagnetischen Mitteln durchgeführt
werden, erfolgen mittels DNS-Ketten. Die allgemeine Struktur von DNS-Sequenzen wird in Abb. 1
gezeigt.

Voraussetzung dafür ist das tiefere Verständnis der molekularen Prozesse in lebenden Zellen, das
seit etwa Mitte der sechziger Jahre gewonnen wurde. Zwar handelt es sich für die praktische
Anwendung um Zukunftsmusik. Aber es gibt durchaus Gründe, warum Rechnen mit DNS Vorteile gegenüber
klassischem Rechnen haben könnte. Hauptsächlicher Vorteil ist die gleichzeitige Ausführbarkeit
einzelner Schritte an sehr vielen Stellen innerhalb eines kleinen Volumens – sozusagen ein weiteres
nanotechnologisches Verfahren.Die kompakte Speicherung in DNS-Ketten ermöglicht es, viele Prozesse
zwecks Parallelität in einem insgesamt kleinen Raum auszuführen. Parallelität kennen wir auch von
der Informationsverarbeitung im Gehirn und im Auge. Die Bildverarbeitung kann in verschiedenen
Bereichen des Auges parallel ablaufen. Die 1994 von Leonard Adleman veröffentlichte Beschreibung
eines Experiments, bei dem mit DNS-Molekülen gerechnet wurde, führte zu großem Aufsehen in der
Fachwelt. Das Experiment benutzt DNS zur Ausführung eines Algorithmus, der mathematische Fragen aus
der Graphentheorie löst.

Die im Experiment zu beantwortende Frage ist, ob es in einem vorgegebenen Graphen eine Kantenfolge
gibt, die alle Knoten genau einmal erreicht. Interessanterweise wurde dieses Problem – natürlich
ohne die technische Nutzung von Computern oder DNS – schon 1736 von dem berühmten Mathematiker
Leonhard Euler behandelt, und zwar anhand der Brücken der Stadt Königsberg (heute Kaliningrad). Die
Frage war, ob es einen Rundweg gibt, bei dem man alle sieben Brücken der Stadt über den Fluss
Pregel genau einmal überquert. Euler bewies mit einer einfachen Argumentation, dass es keinen
solchen Rundweg gab.

Die Lösung solcher Aufgaben erfordert bei großer Knotenanzahl viel Rechenzeit. Wenn man statt
sieben Brücken (Kanten) eine größere Anzahl hat, steigt der Zeitaufwand rasend schnell. Durch hohen
Parallelitätsgrad – wenn also sehr viel gleichzeitig ausgerechnet wird – lässt sich der Zeitbedarf
stark senken. Im Falle des genannten Adleman-Experimentes wurde ein Graph mit sieben Knoten
untersucht. Die Berechnung mit DNS dauerte mehrere Tage. Das ist natürlich im Vergleich zum
Zeitbedarf eines Computers alles andere als beeindruckend. Das Wichtige und Aufsehen erregende war
aber, dass eine Aufgabe dieser Art überhaupt mit DNS berechnet werden konnte.

Wir beschreiben den Aufbau und den Ablauf des Adleman’schen Verfahrens hier in groben Zügen.

Einzelheiten sind Adleman (1994) oder auch dem Lehrbuch von Hinze & Sturm (2004) zu entnehmen.

Jeder Knoten und jede Kante wird durch ein einzelnes DNS-Molekül dargestellt, und zwar durch einen
ganz bestimmten DNS-Einzelstrang mit einer bestimmten Sequenz aus 20 Basen (20mer, lineare Abfolge
aus 20 Basen). Die Zuordnung zwischen den Objekten im Graphen und den DNS-Einzelsträngen geschieht
willkürlich, aber verbindlich. Ein bestimmtes 20mer repräsentiert in allen zusammengesetzten
Strängen immer denselben Knoten oder dieselbe Kante. Im Experiment werden 7 Knoten und 14 Kanten
verwendet. Die vorderen 10 Basen jeder Kantendarstellung sind komplementär zu den hinteren 10 einer
Knotendarstellung, die hinteren 10 der Kantendarstellung sind komplementär zu den vorderen 10 einer
anderen Knotendarstellung. Auf diese Weise lassen sich mittels der chemischen
Paarungsgesetzmäßigkeiten (A immer mit T, C immer mit G) lange Doppelstränge bilden, in denen der
eine Strang aus einer Abfolge von kodierten Kanten und der andere Strang aus einer Abfolge von
kodierten Knoten besteht. Die Kantenfolge verbindet Knoten auf einem Pfad innerhalb des
dargestellten Graphen. Meistens gibt es in einem einzelnen Graphen viele unterschiedliche Pfade.

Die Abbildung im Kastentext zeigt einen aus zwei Kanten und drei Knoten bestehenden Graphen. Der
einfacheren Darstellung halber sind die Stränge nicht 20, sondern nur 6 Basen lang.


Grafik zu „Rechnen mit DNS“


http://www.wort-und-wissen.de/sij/sij171/img/sij171-2-2.gif

Wir wollen den „Weg“ durch den aus drei Knoten 1, 2 und 3 und zwei Kanten (1 , 2) und (2 , 3)
bestehenden Graphen (Abb. 2) in Form einer Nukleotidsequenz ausdrücken.

Zu diesem Zweck sei vorab vereinbart, dass die drei Knoten 1, 2 und 3 durch die Nukleotidketten
ATCGCA, CGTAGG und TGCAGA und die beiden Kanten (1 , 2) und (2 , 3) durch CGTGCA und TCCACG
dargestellt werden müssen, also in der Weise, dass die Darstellung jeder Kante gerade die
Komplementärkette zur hinteren Hälfte ihres ersten und zur vorderen Hälfte ihres zweiten Knotens
ist.
Dann drückt die folgende Verkettung der drei Knoten 1, 2, 3 im oberen Strang und der beiden Kanten
(1 , 2) und (2 , 3) im dazu komplementären unteren Strang gerade aus, dass es einen Weg gibt, der
von 1 über 2 nach 3 verläuft.

Knotenfolge

A T C G C A-C G T A G G-T G C A G A

      C G T G C A-T C C A C G

Kantenfolge

Die Bindestriche sind hier an solchen Stellen angegeben, wo Ausgangsketten auf der einen oder
anderen Seite des Doppelstrangs zusammengefügt wurden.

Im Adleman-Experiment wurden zunächst Billionen kurzer Ketten für die Knoten und Kanten
hergestellt; und es wurde diesen ermöglicht, sich in jeder beliebigen Weise aneinanderzufügen.

Die entstandenen Doppelstränge wurden danach mit molekularbiologischen Methoden daraufhin
überprüft, ob sie mit einem bestimmten Teilstück anfingen, mit einem bestimmten anderen aufhörten
und dazwischen jedes einen Knoten darstellende Teilstück genau einmal vorkam.

All diejenigen, auf die das zutrifft, sind Lösungen des zuvor beschriebenen mathematischen
Problems.

Zunächst wird durch biochemische Synthese dafür gesorgt, dass alle Stränge billionenfach
vervielfältigt vorkommen. Dann werden sie in ein gemeinsames Reagenzgefäß umgefüllt. Es wird davon
ausgegangen, dass sich alle DNS-Stücke zusammenlagern, die komplementäre Überlappungen aufweisen.
Wahrscheinlichkeitsaussagen oder Untersuchungen darüber finden sich allerdings in der
Originalarbeit nicht. Damit alle möglichen Stränge mit komplementären Überlappungen entstehen, muss
die Menge der in der biochemischen Synthese verwendeten DNS-Stränge in exponentieller Größenordnung
in der Menge der Knoten und Kanten des Problems sein. Als nächstes werden unter den nun vorhandenen
Ketten nur die weiter verwendet, die mit dem gewünschten Knoten beginnen und mit dem anderen
gewünschten Knoten enden.

Labortechnisch geschieht dies durch DNS-Primerstränge* mit bestimmten kurzen Basenfolgen, die eine
starke Vervielfältigung für alle mit dieser Basenfolge am Anfang übereinstimmenden Stränge
bewirken. Hierbei kommt es außerdem auf die präzise Einstellung der Reaktionstemperatur an.

Dann sind die Stränge mit der richtigen Länge auszuwählen. In der hier beschriebenen Anordnung sind
es diejenigen mit einer Länge von 140 Basenpaaren. Dies geschieht auf mechanischem Wege mit Hilfe
einer Gelelektrophorese*, die die vorhandenen Stränge nach deren „Länge“ „sortiert“. Stränge mit
einem Längenunterschied von etwa 10 Basenpaaren lassen sich so voneinander trennen. Das ist ein
Grund für die Wahl der Länge 20 bei den einzelnen Knoten und Kanten.

Nachdem nun diejenigen Stränge ausgewählt sind, die richtig anfangen und richtig aufhören und
außerdem die richtige Länge haben, ist noch zu prüfen, ob jeder Knoten in den Strängen vorkommt.
Dazu sind so viele weitere Separationen nötig, wie der Graph Knoten enthält. Jeder dieser Schritte
folgt einem komplizierten Protokoll, in dem eine Anlagerung von Strängen an den zu einer
Knotendarstellung komplementären Strang vorgenommen wird. Dabei wird der vorgegebene Strang
biotinyliert*, was die Möglichkeit der räumlichen Fixierung und anschließenden Trennung der
ankoppelnden Stränge durch Zentrifugieren zur Folge hat. Sobald nur diejenigen Stränge übrig sein
können, in denen jede Kantendarstellung vorkommt, ist zu fragen, ob tatsächlich solche Stränge
übrig sind oder nicht. Dazu dient wieder eine Elektrophorese.

Auf mathematischem Wege konnte in den vergangenen Jahren bewiesen werden, dass jede überhaupt
mögliche Berechnung (Turing-Berechenbarkeit [Asteroth & Baier 2002]) zumindest prinzipiell –
wenngleich in vielen Fällen nur mit unvertretbar hohem Aufwand an Material und Zeit – von
DNS-Molekülen durchgeführt werden kann.


Glossar

Biotinylierung: Biotinylierung ist eine biochemische Methode, bei der z.B. eine makromolekulare
Nukleinsäure wie DNS mit einem kleinen Molekül namens Biotin verbunden wird. Die Biotin-Gruppierung
bindet sehr stark an bestimmte Proteine, die Avidine. Diese starke Bindung kann benutzt werden,
Moleküle mit Biotin-Einheiten aus einem Gemisch „herauszufischen“. Gelelektrophorese: Die
Gelelektrophorese ist ein biochemisches Trennverfahren, bei dem die Wanderung von geladenen
Teilchen (Molekülen) in einem elektrischen Feld zu ihrer Trennung benutzt wird. Man löst das zu
trennende Stoffgemisch und lässt die Lösung durch eine elektrisch neutrale, feste Gelmatrix aus
Agarose oder Polyacrylamid wandern. Die Wanderungsgeschwindigkeit hängt von der Stärke des Feldes,
der Nettoladung, Form und Größe der Makromoleküle sowie von physikochemischen Eigenschaften der
Lösung ab. Graphentheorie: Die Graphentheorie beschäftigt sich mit Strukturen, die aus einzelnen
Punkten (genannt Knoten, englisch: nodes) und Verbindungen zwischen diesen (genannt Kanten,
englisch: edges) bestehen. Durch direkte Verbindungen zwischen einzelnen Knoten sind dann auch
indirekte Verbindungen gegeben, die mehrere Kanten nacheinander durchlaufen, sowie Zyklen, die über
mehrere Kanten zum Ausgangsknoten zurückführen. Ein Beispiel für den praktischen Nutzen der
Graphentheorie ist die Herstellung und dynamische Änderung von Verbindungen im Telefonnetz oder
Internet. Auch das „Problem des Handelsreisenden“ (Travelling Salesman Problem) ist Gegenstand der
algorithmischen Graphentheorie. Es geht dabei um Verfahren, die auf einer Landkarte die insgesamt
kürzeste Rundreise über alle ausgewählten Städte bestimmen. Mit geringen Änderungen tritt diese
Frage auch in der industriellen Fertigung (Robotik) auf. Man kann beweisen, dass optimale Lösungen
für große Graphen ebenso schwer zu finden sind wie bei dem von Adleman behandelten Graphenproblem.
Informationsverarbeitung: Das Rechnen mit Zahlen, das wir schon in der Grundschule lernen, ist ein
spezieller Fall der „Informationsverarbeitung“. Informationsverarbeitung sind alle schrittweisen,
nach bestimmten Regeln erfolgenden Veränderungen von Zeichenfolgen. Zeichenfolgen können
beispielsweise aus Ziffern oder Buchstaben bestehen. Etwa im Falle der chinesischen Schriftsprache
besteht der Zeichenvorrat, mit dem Folgen gebildet werden können, aus Tausenden unterschiedlicher
Zeichen. Regeln können lauten: Ersetze Zeichen „1 x 1“ durch das Zeichen „2“, ersetze Zeichen „2 x
2“durch das Zeichen „4“, und so weiter, wenn wir als Beispiel das Multiplizieren nehmen. Eine
andere einfache Möglichkeit ist: Ersetze alle „a“ durch „b“, alle „b“ durch „c“, alle „c“ durch „d“
und so weiter. Bei diesem Verfahren handelt sich um eine schon von Gaius Julius Caesar verwendete
Verschlüsselungstechnik. Aus informationsverarbeitenden Schritten aufgebaute Verfahren werden
Algorithmen genannt. Primer: Primer sind kurze DNS-Sequenzen, die chemisch-synthetisch hergestellt
und einem Reagenzgemisch zugesetzt werden, das DNS vervielfältigt. Sie dienen als Startsequenz für
DNS-vervielfältigende Enzyme, die DNS-Polymerasen, die im Gemisch enthalten sind. DNS-Polymerasen
können nur die Verlängerung eines schon existierenden kurzen DNS-Strangs katalysieren. Die
DNS-Vervielfältigung verläuft wie bei der Zellteilung lebender Zellen.