Genetischer Code

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Eine Darstellung des genetischen Codes (Code-Sonne): In der Abfolge von innen nach außen wird einem Basentriplett der mRNA (gelesen von 5' nach 3') hier eine der zwanzig kanonischen Aminosäuren zugeordnet oder ein Stopcodon markiert.

Als genetischer Code wird die Weise bezeichnet, mit der die Nukleotidsequenz eines RNA-Einzelstrangs in die Aminosäurensequenz der Polypeptidkette eines Proteins übersetzt wird. In der Zelle geschieht dies, nachdem zuvor die in der Abfolge von Basenpaaren des DNA-Doppelstrangs niedergelegte Erbinformation in die Sequenz des RNA-Einzelstrangs (Boten- oder Messenger-Ribonukleinsäure, mRNA) umgeschrieben wurde.

Dieser genetische Code ist bei allen bekannten Arten von Lebewesen in den Grundzügen gleich. Er ordnet einem Triplett von drei aufeinanderfolgenden Nukleobasen der Nukleinsäuren – dem sogenannten Codon – jeweils eine bestimmte proteinogene Aminosäure zu. Die Übersetzung, Translation genannt, findet an den Ribosomen im Zytosol einer Zelle statt. Sie bilden nach Vorgabe der Sequenz von Nukleotiden einer mRNA die Sequenz von Aminosäuren eines Peptids, indem jedem Codon über das Anticodon einer Transfer-Ribonukleinsäure (tRNA) eine bestimmte Aminosäure zugewiesen und diese mit der vorherigen verbunden wird. Auf diese Weise wird eine bestimmte vorgegebene Information in die Form einer Peptidkette überführt, die sich dann zur besonderen Form eines Proteins faltet.

Je komplexer Lebewesen jedoch sind, desto höher scheint der Anteil genetischer Information zu sein, der nicht in Proteine übersetzt wird. Ein beträchtlicher Teil an nicht-codierender DNA wird zwar in RNAs transkribiert, aber nicht per Translation in eine Peptidkette übersetzt. Zu diesen nicht für Protein codierenden RNA-Spezies des Transkriptoms gehören neben den für die Translation erforderlichen tRNAs und ribosomalen RNAs (rRNA) eine Reihe weiterer, meist kleiner RNA-Formen. Diese dienen in vielfältiger Weise der Regulation verschiedener zellulärer Prozesse – so der Transkription selbst, wie auch der möglichen Translation, außerdem einer eventuellen DNA-Reparatur, und darüber hinaus besonderen epigenetischen Markierungen von DNA-Abschnitten sowie u. a. verschiedenen Funktionen des Immunsystems.

Ein Beispiel für die Paarung des Codons auf einer mRNA mit dem komplementären Anticodon einer tRNA, hier die mit Alanin beladene tRNAAla, deren Anticodon zu GCC passt.

Die Transfer-Ribonukleinsäuren, tRNAs, enthalten an prominenter Stelle einer Schleife des kleeblattähnlichen Moleküls ein kennzeichnendes Nukleotid-Triplett, das sie voneinander unterscheidet. Es besteht jeweils aus drei Nukleotiden, die den Nukleotiden eines bestimmten Codons entsprechen, indem sie komplementär zu diesen sind und so ein dreigliedriges Anticodon bilden. Codon und Anticodon passen basenpaarend zueinander und ihnen ist die gleiche spezifische Aminosäure zugeordnet. Eine tRNA wird jeweils mit derjenigen Aminosäure beladen, für die das zu ihrem Anticodon passende Codon steht. Auf diese Weise, durch die spezifische Bindung einer Aminosäure an eine tRNA mit einem bestimmten Anticodon, wird also das Zeichen für eine bestimmte Aminosäure, das Codon, in die genetisch codierte Aminosäure übersetzt.

Streng genommen ist der genetische Code also schon in der Struktur der verschiedenen tRNA-Arten enthalten: Denn ein jedes tRNA-Molekül enthält eine derart strukturierte Aminosäure-Bindungsstelle, dass daran nur jene Aminosäure gebunden wird, die seinem Anticodon nach dem genetischen Code entspricht. Nach Bindung an ihre tRNA steht eine Aminosäure für die Biosynthese von Proteinen am Ribosom zur Verfügung, sodass sie als nächstes Glied der Polypeptidkette angefügt werden kann – falls das Anticodon der tRNA zu einem Codon in der vorgegebenen Nukleotidsequenz der mRNA passt.

Darstellung der Transkription genetischer Information aus einem DNA-Abschnitt in ein RNA-Transkript, wo dann U anstelle von T steht.

Als Voraussetzung für diese Proteinsynthese muss der DNA-Abschnitt eines Gens zunächst in eine Ribonukleinsäure (RNA) umgeschrieben werden (Transkription). Dabei können in eukaryoten Zellen bestimmte Teile dieser hnRNA gezielt entfernt (Spleißen) oder danach verändert werden (RNA-Editing); anschließend wird diese vorläufige prä-mRNA weiter prozessiert zur definitiven mRNA, die schließlich aus dem Zellkern exportiert wird. Denn erst an den Ribosomen, die frei im Zytosol vorliegen können oder an das endoplasmatische Reticulum gebunden sind, werden anhand der mRNA-Vorlage dann die Aminosäuren der zu den Codons passenden tRNAs miteinander zu einem Polypeptid verknüpft.

Dieser Vorgang, mit dem die Information eines Gens in der Form eines Proteins ausgedrückt wird (Genexpression), ergibt sich somit aus einer Folge von Schritten. Hierbei werden die Hauptprozesse unterschieden als (1) Transkription – ein Abschnitt der DNA des Genoms wird durch RNA-Polymerase in RNA umgeschrieben – und (2) posttranskriptionale Modifikation – eine RNA des Transkriptoms wird verändert – sowie (3) Translation – eine mRNA wird am Ribosom in ein Polypeptid übersetzt. Daran kann sich (4) noch eine posttranslationale Modifikation anschließen – ein Polypeptid des Proteoms wird verändert. Im Ablauf dieser Prozesse bis hin zur Bereitstellung eines funktionstragenden Proteins ist die Translation also der Schritt, in dem die genetische Information der Basentriplett-Abfolge in eine Aminosäure-Abfolge umgesetzt wird.

Die eigentliche Anwendung des genetischen Codes, nämlich die Übersetzung einer Nukleotidsequenz in eine Aminosäure anhand des Codons beziehungsweise des Anticodons, findet schon bei der Bindung einer Aminosäure an ihre tRNA durch die jeweilige Aminoacyl-tRNA-Synthetase statt, also bei der Vorbereitung der Aminosäuren für ihren möglichen Zusammenbau in einem Protein. Einige wenige Basentripletts codieren nicht für eine Aminosäure. Insofern sie in diesem Sinn keine Bedeutung tragen, werden sie auch Nonsens-Codons genannt; diese führen bei der Translation zu einem Stop, der die Proteinsynthese beendet, und heißen daher auch Stopcodons.

Alle Lebewesen benutzen in Grundzügen denselben genetischen Code. Die wohl am häufigsten gebrauchte Version ist in den folgenden Tabellen angegeben. Sie zeigen für diesen Standard-Code, welche Aminosäuren von einem der 43 = 64 möglichen Codons gemeinhin codiert werden, bzw. welches Codon in eine der 20 kanonischen Aminosäuren übersetzt wird. So steht zum Beispiel das Codon GAU für die Aminosäure Asparaginsäure (Asp), und Cystein (Cys) wird von den Codons UGU und UGC codiert. Die in der Tabelle angegebenen Basen sind Adenin (A), Guanin (G), Cytosin (C) und Uracil (U) der Ribonukleotide der mRNA; in den Nukleotiden der DNA tritt dagegen Thymin (T) anstelle von Uracil auf. Bei der Transkription eines DNA-Abschnitts dient einer RNA-Polymerase der codogene Strang als Matrize für das Transkript: die DNA-Basensequenz wird basenpaarend in die komplementäre RNA-Basensequenz umgeschrieben beim Aufbau eines RNA-Strangs. Damit wird auf die in DNA vererbbar abgelegte genetische Information zugegriffen, die dann in mRNA für die Proteinbiosynthese zur Verfügung steht.

Geschichte der Entdeckung[Bearbeiten | Quelltext bearbeiten]

In der ersten Hälfte der 1960er Jahre herrschte unter Biochemikern eine gewisse Konkurrenz um das Verständnis des genetischen Codes. Am 27. Mai 1961 um 3 Uhr morgens gelang dem deutschen Biochemiker Heinrich Matthaei im Labor von Marshall Nirenberg mit dem Poly-U-Experiment der entscheidende Durchbruch: die Entschlüsselung des Codons UUU für die Aminosäure Phenylalanin. Dieses Experiment wird von einigen Genetikern als das bedeutendste des 20. Jahrhunderts bezeichnet. 1966, fünf Jahre nach der Entzifferung des ersten Codons, war die vollständige Entschlüsselung des genetischen Codes mit allen 64 Basentripletts gelungen.

Codon[Bearbeiten | Quelltext bearbeiten]

Genetische Information für den Aufbau von Proteinen ist in bestimmten Abschnitten der Basensequenz von Nukleinsäuren enthalten. Von DNA in RNA umgeschrieben (transkribiert), wird sie für die Biosynthese von Proteinen verfügbar. Die im offenen Leserahmen vorliegende Basensequenz wird am Ribosom abgelesen und nach dem genetischen Code übersetzt (translatiert) in die Aminosäurensequenz der synthetisierten Peptidkette, die Primärstruktur eines Proteins. Dabei wird die Basenfolge schrittweise in Dreiergruppen zerlegt gelesen und jedem Triplett je eine dazu passende tRNA beladen mit einer bestimmten Aminosäure zugeordnet. Die Aminosäure wird jeweils durch Peptidbindung an die vorherige gebunden. Auf diese Weise codiert der Sequenzabschnitt für Protein.

Als Codon bezeichnet man das Variationsmuster einer Abfolge von drei Nukleobasen der mRNA, eines Basentripletts, das für eine Aminosäure codieren kann. Insgesamt existieren 43 = 64 mögliche Codons, davon codieren 61 für die insgesamt 20 kanonischen der proteinogenen Aminosäuren; die restlichen drei sind sogenannte Stopcodons zur Termination der Translation. Diese können unter bestimmten Umständen genutzt werden, zwei weitere nicht-kanonische Aminosäuren zu codieren. Damit gibt es für fast alle der Aminosäuren mehrere verschiedene Codierungen, jeweils meist recht ähnliche. Die Codierung als Triplett ist jedoch insofern notwendig, als bei einer Duplett-Codierung nur 42 = 16 mögliche Codons entstehen würden, womit schon für die zwanzig kanonischen oder Standard-Aminosäuren nicht genügend Möglichkeiten gegeben wären.

Standard-Codon-Tabelle für alle 64 möglichen Basen-Tripletts
2. Base
U C A G
1. Base U
UUU Phenylalanin
UUC Phenylalanin
UUA Leucin
UUG Leucin
UCU Serin
UCC Serin
UCA Serin
UCG Serin
UAU Tyrosin
UAC Tyrosin
UAA Stop
UAG Stop
UGU Cystein
UGC Cystein
UGA Stop
UGG Tryptophan
C
CUU Leucin
CUC Leucin
CUA Leucin
CUG Leucin
CCU Prolin
CCC Prolin
CCA Prolin
CCG Prolin
CAU Histidin
CAC Histidin
CAA Glutamin
CAG Glutamin
CGU Arginin
CGC Arginin
CGA Arginin
CGG Arginin
A
AUU Isoleucin
AUC Isoleucin
AUA Isoleucin
AUG Methionin*
ACU Threonin
ACC Threonin
ACA Threonin
ACG Threonin
AAU Asparagin
AAC Asparagin
AAA Lysin
AAG Lysin
AGU Serin
AGC Serin
AGA Arginin
AGG Arginin
G
GUU Valin
GUC Valin
GUA Valin
GUG Valin
GCU Alanin
GCC Alanin
GCA Alanin
GCG Alanin
GAU Asparaginsäure
GAC Asparaginsäure
GAA Glutaminsäure
GAG Glutaminsäure
GGU Glycin
GGC Glycin
GGA Glycin
GGG Glycin
Farbgebung der Aminosäuren

* Das Triplett AUG dient sowohl als Codon für Methionin wie auch als Startsignal der Translation. Eines der ersten AUG-Tripletts auf der mRNA wird zum ersten Codon, das decodiert wird. Welches AUG als Startcodon verwendet werden soll, erkennt das Ribosom an Signalen der benachbarten mRNA-Sequenz.

Die angegebenen Codons gelten für die Nukleotidsequenz einer mRNA. Sie wird in 5′→3′ Richtung am Ribosom abgelesen und übersetzt in die Aminosäurensequenz eines Polypeptids.

Umgekehrte Codon-Tabelle
Az AS AS Codon
1 Start > AUG
1 Met M AUG
1 Trp W UGG
1 Sec U (UGA)
1 Pyl O (UAG)
2 Tyr Y UAU UAC
2 Phe F UUU UUC
2 Cys C UGU UGC
2 Asn N AAU AAC
2 Asp D GAU GAC
2 Gln Q CAA CAG
2 Glu E GAA GAG
2 His H CAU CAC
2 Lys K AAA AAG
3 Ile I AUU AUC AUA
4 Gly G GGU GGC GGA GGG
4 Ala A GCU GCC GCA GCG
4 Val V GUU GUC GUA GUG
4 Thr T ACU ACC ACA ACG
4 Pro P CCU CCC CCA CCG
6 Leu L CUU CUC CUA CUG UUA UUG
6 Ser S UCU UCC UCA UCG AGU AGC
6 Arg R CGU CGC CGA CGG AGA AGG
3 Stop < UAA UAG UGA

Die Translation beginnt mit einem Start-Codon. Doch sind daneben bestimmte Initiationssequenzen und -faktoren nötig, um die Bindung der mRNA an ein Ribosom herbeizuführen und den Prozess zu starten. Dazu gehört auch eine spezielle Initiator-tRNA, welche die erste Aminosäure trägt. Das wichtigste Start-Codon ist AUG, das für Methionin codiert. Auch können ACG und CUG – sowie GUG und UUG in prokaryoten Zellen – als Startcodon dienen, allerdings mit geringerer Effizienz. Die erste Aminosäure ist aber zumeist ein – bei Bakterien und in Mitochondrien N-fomyliertes – Methionin.[1]

Die Translation endet mit einem der drei Stop-Codons, auch Terminations-Codons genannt. Anfangs wurden diesen Codons auch Namen gegeben – UAG ist amber (bernsteinfarben), UGA ist opal (opalfarben), und UAA ist ochre (ockerfarben) (ein Wortspiel auf den Nachnamen ihres Entdeckers Harris Bernstein).

Während das Codon UGA zumeist als Stop gelesen wird, kann es selten und nur unter bestimmten Bedingungen für eine 21. (proteinogene) Aminosäure stehen: Selenocystein (Sec). Die Biosynthese und der Einbaumechanismus von Selenocystein in Proteine unterscheiden sich stark von dem aller anderen Aminosäuren: seine Insertion erfordert einen neuartigen Translationsschritt, bei dem ein UGA im Rahmen einer bestimmten Sequenzumgebung und zusammen mit bestimmten Cofaktoren anders interpretiert wird. Hierfür ist außerdem eine für Selenocystein bestimmte, strukturell einzigartige tRNA (tRNASec) erforderlich, die bei Vertebraten auch mit zwei chemisch verwandten Aminosäuren beladen werden kann: neben Selenocystein auch Serin oder Phosphoserin.

Einige Archaeen und Bakterien können daneben ein kanonisches Stopcodon UAG auch in eine weitere (22.) proteinogene Aminosäure übersetzen: Pyrrolysin (Pyl). Sie verfügen über eine spezielle tRNAPyl sowie ein spezifisches Enzym, diese zu beladen (Pyrrolysyl-tRNA-Synthetase).

Manche kurze DNA-Sequenzen kommen im Genom einer Art nur selten oder gar nicht vor (Nullomere). Bei Bakterien erweisen sich manche dieser als toxisch; auch das Codon AGA, welches die Aminosäure Arginin codiert, wird in Bakterien vermieden (stattdessen wird CGA verwendet).[2] Es gibt durchaus artspezifische Unterschiede in der Codonverwendung.[3] Unterschiede im Gebrauch von Codons bedeuten nicht unbedingt Unterschiede in der Häufigkeit verwendeter Aminosäuren. Denn für die meisten der Aminosäuren gibt es mehr als ein einziges Codon, wie die obenstehende Tabelle zeigt.

Degeneration und Fehlertoleranz[Bearbeiten | Quelltext bearbeiten]

Soll eine bestimmte Aminosäure codiert werden, kann oft unter mehreren verschiedenen Codons gewählt werden, die alle die gleiche Bedeutung haben, indem sie für dieselbe Aminosäure stehen. Der genetische Code ist ein Code, bei dem mehrere Ausdrücke die gleiche Bedeutung haben, dieselbe semantische Einheit also durch mehrere unterschiedliche syntaktische Symbole codiert wird. Im Vergleich zu einem Codierungssystem, bei dem jeder semantischen Einheit je ein syntaktischer Ausdruck entspricht und umgekehrt, nennt man solch einen Code auch degeneriert.

Es kann jedoch von Vorteil sein, dass für die kaum mehr als zwanzig translational einzubauenden Aminosäuren mehr als sechzig Codons verfügbar sind. Dargestellt werden sie jeweils durch eine Kombination aus drei Nukleotiden mit je vier möglichen Basen, sodass es 64 mögliche Kombinationen gibt, deren jeweilige Zuordnung zu den einzelnen Aminosäuren nun aber offenbar so ist, dass sehr ähnliche Variationen für eine bestimmte codieren. Oft reichen schon zwei Nukleotide aus, um die Aminosäure unterschieden von anderen jeweils sicher anzugeben. Der genetische Code weist damit eine gewisse Fehlertoleranz auf.[4]

Gruppierung der Codons nach dem Molvolumen der jeweils codierten Aminosäure und dem hydropathischen Index.

Die für eine bestimmte Aminosäure codierenden Basentripletts unterscheiden sich so in der Regel in nur einer der drei Basen; sie haben damit einen minimalen Abstand im Coderaum, siehe Hammingdistanz bzw. Levenshtein-Distanz. Meist unterscheiden sich die Tripletts in der dritten Base, der „wackelnden“, die bei der Translation am häufigsten falsch gelesen wird (siehe „wobble“-Hypothese).[5] Die für den Proteinaufbau häufiger benötigten Aminosäuren werden von einer größeren Anzahl Codons repräsentiert als die selten gebrauchten. Die tiefergehende Analyse des genetischen Codes offenbart noch weitere Zusammenhänge, etwa hinsichtlich des Molvolumens und des hydrophoben Effekts (siehe Abbildung).

Bemerkenswert ist auch die Tatsache, dass sich der Charakter der zugeordneten Aminosäure orientierend schon weitgehend anhand der Base in der mittleren Position eines Tripletts bestimmen lässt:

  • _ U _ hydrophob
  • _ C _ polar bis neutral
  • _ A _ geladen
  • _ G _ geladen, neutral bis polar

Daraus ergibt sich, dass Radikalsubstitutionen – der Tausch gegen Aminosäuren eines anderen Charakters – in erster Linie Folge von Mutationen in dieser zweiten Position sind. Mutationen in der ersten, besonders aber in der dritten Position („wobble“) erhalten dagegen häufig die Aminosäure oder zumindest ihren Charakter „konservative Substitution“. Berücksichtigt man ferner, dass Transitionen (Umwandlung von Purinen bzw. Pyrimidinen ineinander) aus mechanistischen Gründen häufiger auftreten als Transversionen (Umwandlung eines Purins in ein Pyrimidin und umgekehrt; dieser Prozess setzt zumeist eine Depurinierung voraus), so ergibt sich eine weitere Erklärung für den konservativen Charakter des Codes.

Die sogenannte Degeneration der genetischen Codes macht es auch möglich, die genetische Information weniger empfindlich gegenüber äußeren Einwirkungen zu speichern. Dies gilt insbesondere in Bezug auf Punktmutationen, sowohl für synonyme Mutationen (die zur gleichen Aminosäure führen) als auch für nichtsynonyme Mutationen, die zu Aminosäuren mit ähnlichen Eigenschaften führen.[6]

Offenbar war es schon früh in der Evolutionsgeschichte hilfreich, die Anfälligkeit der Codierung gegenüber fehlerhaft gebildeten Codons zu senken. Die Funktion eines Proteins wird durch dessen Struktur bestimmt, und die hängt von der Primärstruktur ab, der Sequenz der Aminosäuren: wieviele, welche und in welcher Reihenfolge zu einer Peptidkette verknüpft werden. Diese Angaben enthält die Basensequenz als genetische Information. Eine erhöhte Fehlertoleranz der Codierung sichert die richtige Decodierung – und wenn bei einer falschen eher eine Aminosäure mit ähnlichem Charakter eingebaut wird, hat dies auf die Funktion des Proteins geringere Auswirkungen, als wenn es eine ganz anderen Charakters wäre.

Ursprung des genetischen Codes[Bearbeiten | Quelltext bearbeiten]

Die Verwendung des Wortes „Code“ geht auf Erwin Schrödinger zurück, der die Begriffe „hereditary code-script“, „chromosome code“ und „miniature code“ in einer Vortragsreihe 1943 verwendet hatte, die er 1944 zusammenfasste und als Grundlage für sein Buch „Was ist Leben?“ aus dem Jahr 1944 verwendete.[7] Der genaue Sitz oder Träger dieses Codes war zu diesem Zeitpunkt noch unklar.

Früher glaubte man, der genetische Code sei zufällig entstanden. Noch 1968 bezeichnete Francis Crick ihn als „eingefrorenen Zufall“.[8][9] Untersuchungen aus dem Jahr 2004 deuten jedoch darauf hin, dass er das Resultat einer strengen Optimierung hinsichtlich der Fehlertoleranz darstellt.[10] Fehler sind besonders gravierend für die räumliche Struktur eines Proteins, wenn sich die Hydrophobie einer fälschlich eingebauten Aminosäure deutlich vom Original unterscheidet. Im Rahmen einer statistischen Analyse erweisen sich in dieser Hinsicht unter einer Million Zufallscodes nur 100 besser als der tatsächliche. Berücksichtigt man bei der Berechnung der Fehlertoleranz zusätzliche Faktoren, die typischen Mustern von Mutationen und Lesefehlern entsprechen, so reduziert sich diese Zahl sogar auf 1 von 1 Million.[11]

Universalität des Codes[Bearbeiten | Quelltext bearbeiten]

Grundprinzip[Bearbeiten | Quelltext bearbeiten]

Bemerkenswert ist, dass der genetische Code für alle Lebewesen im Prinzip gleich ist, alle Lebewesen sich also der gleichen „genetischen Sprache“ bedienen. Nicht nur, dass genetische Information bei allen in der Sequenz von Nukleinsäuren vorliegt, und für den Aufbau von Proteinen immer in Tripletts abgelesen wird. Bis auf wenige Ausnahmen steht auch ein bestimmtes Codon jeweils für dieselbe Aminosäure; den gemeinhin üblichen Gebrauch gibt der Standard-Code wieder. Daher ist es möglich, in der Gentechnik z. B. das Gen für menschliches Insulin in Bakterien einzuschleusen, damit diese dann das Hormonprotein Insulin produzieren. Dieses von allen Organismen geteilte gemeinsame Grundprinzip der Codierung wird als „Universalität des Codes“ bezeichnet. Es erklärt sich aus der Evolution so, dass der genetische Code schon sehr früh in der Entwicklungsgeschichte des Lebens ausgestaltet und dann von allen sich entwickelnden Arten weitergegeben wurde. Eine solche Generalisierung schließt nicht aus, dass sich die Häufigkeit verschiedener Codewörter zwischen den Organismen unterscheiden kann (siehe Codon Usage).

Varianten[Bearbeiten | Quelltext bearbeiten]

Daneben gibt es aber auch verschiedene Varianten, die vom Standard-Code abweichen, bei denen also einige wenige Codons in eine andere als die in der #Standard-Codon-Tabelle angegebene Aminosäure übersetzt werden. Manche dieser Abweichungen lassen sich taxonomisch eingrenzen, sodass besondere Codes definiert werden können. Derart werden inzwischen schon über dreißig variante genetische Codes unterschieden.[12]

Bei eukaryoten Zellen zeigen jene Organellen, die über ein eigenständiges genomisches System verfügen und vermutlich von symbiotischen Bakterien abstammen (Endosymbionten-Theorie), eigene Varianten des genetischen Codes. In Mitochondrien sind so für Nukleinsäuren wie mtDNA (Chondriom) über zehn abgewandelte Formen mitochondrialen Codes bekannt. Diese weichen jeweils ab vom nukleären Code für die Erbsubstanz im Kern, das Kern-Genom (Karyom). Daneben haben die in Pflanzenzellen zusätzlich vorkommenden Plastiden einen eigenen Code für ihr Plastom.

Auch die Ciliaten zeigen Abweichungen vom Standard-Code: UAG, nicht selten auch UAA, codieren für Glutamin; diese Abweichung findet sich auch in einigen Grünalgen. UGA steht auch manchmal für Cystein. Eine weitere Variante findet sich in der Hefe Candida, wo CUG Serin codiert.

Des Weiteren gibt es einige Varianten von Aminosäuren, die nicht nur von Bakterien (Bacteria) und Archaeen (Archaea) während der Translation durch Recodierung eingebaut werden können; so kann UGA, wie oben beschrieben, Selenocystein und UAG Pyrrolysin codieren, im Standard-Code beidenfalls Stop-Codons.

Darüber hinaus sind noch weitere Abweichungen vom Standard-Code bekannt, die oft die Initation (Start) oder die Termination (Stop) betreffen; insbesondere in Mitochondrien ist einem Codon (Basentriplett der mRNA) öfters nicht die übliche Aminosäure zugeordnet. In der folgenden Tabelle sind einige Beispiele aufgeführt:

Abweichungen vom Standard-Code
Vorkommen Codon Standard Abweichung
Mitochondrien (bei allen bis jetzt untersuchten Organismen) UGA Stop Tryptophan
Mitochondrien von Säugern, Drosophila und S. cerevisiae und Protozoen AUA Isoleucin Methionin = Start
Mitochondrien von Säugern AGC, AGU Serin Stop
Mitochondrien von Säugern AG(A, G) Arginin Stop
Mitochondrien von Drosophila AGA Arginin Stop
Mitochondrien z. B. bei Saccharomyces cerevisiae CU(U, C, A, G) Leucin Threonin
Mitochondrien Höherer Pflanzen CGG Arginin Tryptophan
Einige Arten der Pilzgattung Candida CUG Leucin Serin
Eukarya (selten) CUG Leucin Start
Eukarya (selten) ACG Threonin Start
Eukarya (selten) GUG Valin Start
Bacteria GUG Valin Start
Bacteria (selten) UUG Leucin Start
Bacteria (SR1 Bacteria) UGA Stop Glycin[13]

Genetische Codes in DNA-Alphabet[Bearbeiten | Quelltext bearbeiten]

DNA-Sequenzdatenbanken wie GenBank geben auch mRNA-Sequenzen in einem historischen Konventionen entsprechenden Format an, bei dem das DNA-Alphabet verwendet wird, also T anstelle von U steht. Beispiele:[12]

  • Standard Code (= id)
    AS  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ---M------**--*----M---------------M----------------------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
  • Hefe Mitochondrial Code
    AS  = FFLLSSSSYY**CCWWTTTTPPPPHHQQRRRRIIMMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ----------**----------------------MM----------------------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSSSSVVVVAAAADDEEGGGG
 Starts = ---M------**--------------------MMMM---------------M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
    AS  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ---M------**--*----M------------MMMM---------------M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG
    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

Anmerkung: In der jeweils ersten Zeile „AS“ werden die Aminosäuren im Ein-Buchstaben-Code (siehe #Umgekehrte Codon-Tabelle) angegeben, wobei Abweichungen gegenüber dem Standard-Code (id) jeweils gefettet dargestellt sind (bzw. rot). In der zweiten Zeile „Starts“ zeigt M Initation, * Termination; manche Varianten unterscheiden sich allein hinsichtlich (alternativer) Startcodons oder Stopcodons. Weitere Codes sind der frei zugänglichen Quelle zu entnehmen[12].

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Lily E. Kay: Who wrote the book of life? A history of the genetic code. Stanford University Press, Stanford, Calif. 2000
    • Deutsche Ausgabe: Das Buch des Lebens. Wer schrieb den genetischen Code? Aus dem amerikanischen Englisch übersetzt von Gustav Roßler. Suhrkamp, Frankfurt am Main 2005, ISBN 3-518-29346-X.
  • Rüdiger Vaas: Der genetische Code. Evolution und selbstorganisierte Optimierung, Abweichungen und gezielte Veränderung. Wissenschaftliche Verlagsgesellschaft, Stuttgart 1994, ISBN 3-8047-1383-1.
  • Lei Wang, Peter G. Schultz: Die Erweiterung des genetischen Codes. In: Angewandte Chemie. Band 117, Nr. 1, 2005, S. 34–68, doi:10.1002/ange.200460627.
  • Guenther Witzany: Natural Genome Editing Competences of Viruses. In: Acta Biotheoretica. Band 54, S. 235–253, doi:10.1007/s10441-006-9000-7.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. H. Drabkin, U. RajBhandary: Initiation of protein synthesis in mammalian cells with codons other than AUG and amino acids other than methionine. In: Molecular and Cellular Biology. Band 18, Nummer 9, September 1998, S. 5140–5147; PMID 9710598. PMC 109099 (freier Volltext).
  2. L. R. Cruz-Vera, M. A. Magos-Castro, E. Zamora-Romo, G. Guarneros: Ribosome stalling and peptidyl-tRNA drop-off during translational delay at AGA codons. In: Nucleic acids research. Band 32, Nummer 15, 2004, S. 4462–4468, ISSN 1362-4962. doi:10.1093/nar/gkh784. PMID 15317870. PMC 516057 (freier Volltext).
  3. M. dos Reis, R. Savva, L. Wernisch: Solving the riddle of codon usage preferences: a test for translational selection. In: Nucleic acids research. Band 32, Nummer 17, 2004, S. 5036–5044, ISSN 1362-4962. doi:10.1093/nar/gkh834. PMID 15448185. PMC 521650 (freier Volltext).
  4. U. Lagerkvist: "Two out of three": an alternative method for codon reading. In: Proceedings of the National Academy of Sciences of the United States of America. Band 75, Nummer 4, April 1978, S. 1759–1762, ISSN 0027-8424. PMID 273907. PMC 392419 (freier Volltext).
  5. J. Lehmann, A. Libchaber: Degeneracy of the genetic code and stability of the base pair at the second position of the anticodon. In: RNA. Band 14, Nummer 7, Juli 2008, S. 1264–1269, ISSN 1469-9001. doi:10.1261/rna.1029808. PMID 18495942. PMC 2441979 (freier Volltext).
  6. James Dewey Watson, Tania A. Baker, Stephen P. Bell, Alexander Gann, Michael Levine, Richard Losick, et al.: Molecular Biology of the Gene. 6. Auflage. Pearson/Benjamin Cummings, San Francisco 2008, ISBN 978-0-8053-9592-1, S. 521 ff.
  7. Erwin Schrödinger: What is life? The Physical Aspect of the Living Cell. 1944 (whatislife.stanford.edu [PDF] Based on lectures delivered under the auspices of the Dublin Institute for Advanced Studies at Trinity College, Dublin, in February 1943).
  8. Francis Crick: The Origin of the Genetic Code (= Journal of Molecular Biology. Band 38). Elsevier, 1968, ISSN 0022-2836, S. 367–79.
  9. Stefan Klein: Alles Zufall: Die Kraft, die unser Leben bestimmt. 2015, ISBN 978-3-499-61596-2 (books.google.de).
  10. Guenther Witzany: Crucial steps to life: From chemical reactions to code using agents. In: Biosystems. Band 140, 1. Februar 2016, S. 49–57, doi:10.1016/j.biosystems.2015.12.007.
  11. Stephen J. Freeland, Laurence D. Hurst: Der raffinierte Code des Lebens. Spektrum der Wissenschaft, Juli 2004, S. 86–93.
  12. a b c The Genetic Codes, laut NCBI letzte Aktualisierung: 18.11.2016; abgerufen am 25. Oktober 2017.
  13. J. H. Campbell, P. O'Donoghue u. a.: UGA is an additional glycine codon in uncultured SR1 bacteria from the human microbiota. In: Proceedings of the National Academy of Sciences of the United States of America. Band 110, Nummer 14, April 2013, ISSN 1091-6490, S. 5540–5545. doi:10.1073/pnas.1303090110. PMID 23509275. PMC 3619370 (freier Volltext).