Folgt die Evolution einem Weg, der sowohl gerade als auch breit ist?
Beitrag des Monats: Mai 2009
von David T. F. Dryden
Betreff: | das Erforschen _aller_ Sequenzräume -- erledigt? Datum: | 02. Mai 2009 Message-ID: | 5841cf37-bf2f-494f-bdee-2095798523e3@s16g2000vbp.googlegroups.com
Herausgebernotizen:
Dieser Beitrag stammt vom Autor einer peer reviewed paper, die
hier gefunden werden kann.
Zwei Absätze, die sich vom zentralen Punkt des Beitrags entfernen,
können im Original hier gelesen werden.
Spezifische Punkte, die vom primären kreationistischen Kritiker, Sean
Pitman, gemacht wurden, werden am Ende explizit behandelt.
Hallo, ich bin David Dryden, der Hauptautor der Arbeit, die zu all dieser Diskussion geführt hat. Steven Litvintschouk hat mich gebeten, mich zu der Analyse meiner Arbeit zu äußern, die von Sean Pitman durchgeführt wurde, und dies ist am Ende dieses Textes angefügt. Ich muss sagen, dass ich etwas überrascht bin über die Menge an Interesse und Diskussion, die aus meiner kleinen Arbeit mit zwei Kollegen entstanden ist. Dennoch freue ich mich darüber und bin froh, dass meine Entscheidung, dafür zu sorgen, dass es sich um ein „Open Access"-Paper handelt, gerechtfertigt wurde. Ich hoffe, dass alle professionellen, peer-reviewten Wissenschaften innerhalb von 10 Jahren frei verfügbar sein werden.
[Absatz gelöscht]
Ich werde wahrscheinlich viel zu viel schreiben, aber wenn Sie das Fazit wollen, dann ist es, dass Sean Pitman in allem, was er in seinen Kommentaren sagt, völlig und gänzlich falsch liegt und eine große Unkenntnis von Proteinen und ihrer Struktur und Funktion zeigt. Dennoch hoffe ich, dass er weiterlesen wird.
Er hat nicht erkannt, dass wir beabsichtigten, Grenzen für den erkundeten Sequenzraum festzulegen. Das Festlegen von Grenzen ist ein Standardverfahren in der Wissenschaft, das zwar oft vergessen wird, aber viel Zeitverschwendung verhindert, solange man die Berechnung von Anfang an nicht unnötig einschränkt. Daher sind diese oberen und unteren Grenzen so großzügig wie möglich, basierend auf dem aktuellen Wissen. Sie können sich um einige Zehnerpotenzen unterscheiden, was jedoch vernachlässigbar ist, und mit fortschreitender Forschung werden die Grenzen wahrscheinlich näher zusammenrücken und den Bereich der Möglichkeiten eingrenzen. In unserem Diagramm überlagerten wir die Grenzen auf die Anzahl der verschiedenen Sequenzen, die für einen gegebenen Buchstabenpool möglich sind. Die Buchstaben können bis zu 20 betragen, aber es ist nur eine Zahl. Wenn diese Buchstaben als Aminosäuren betrachtet werden, können wir die 20 Aminosäuren in eine kleinere Anzahl von Kategorien gruppieren, die mit ihren physikalisch-chemischen Eigenschaften zusammenhängen. Sobald Sie feststellen, dass die Symbole, die Sie in der Berechnung dieser großen Zahlen verwenden, physikalische Entitäten darstellen, können Sie deren physikalische Eigenschaften nicht ignorieren. Solche Gruppierungen sind in Experimenten als gültig bekannt und bilden die Grundlage für computergestützte Sequenzanalyse. Es ist bedauerlich, dass eine solche computergestützte Analyse von einigen Personen zu weit getrieben wurde, insbesondere von denen, die die Agenda der ID-Komplexität vorantreiben wollen, und dass dabei die Tatsache aus den Augen verloren wurde, dass Proteine nicht in silico existieren.
[Absatz gelöscht]
In der realen Welt der Proteinstruktur und -funktion ist gut etabliert, dass viele Aminosäuren mit wenig oder keinem Effekt auf die Funktion verändert werden können (es gibt nur zwei „Funktionen" für ein Protein: ein anderes Objekt zu binden und zu kontrollieren oder ein anderes Objekt zu binden und eine Reaktion auf diesem Objekt zu katalysieren – und letzteres umfasst auch den Protonenpumpen zur Rotation eines Flagellums). Die katalytischen chemischen Mechanismen, die von Enzymen und Ribozymen durchgeführt werden, fallen in nur 6 Kategorien gut verstandener chemischer Reaktionen (ein relativ kleiner Reaktionsraum). Die gesamte Biochemie basiert darauf. Mutationen, die die Funktion tatsächlich verändern, definieren in der Regel eine aktive Stelle (für die Funktion) oder eine entscheidende Faltungsregion. Es ist bekannt, dass Proteine aus der wiederholten Verwendung kleinerer Peptidsequenzen aufgebaut werden, die durch Gen-Duplikation und Rekombination in der DNA-Codierung zusammengefügt werden.
Es scheint ein allgemeiner Konsens zu bestehen, dass Aminosäuresequenzen einer Länge von etwa 20 oder 30 in Bezug auf die Funktion wirklich interessant werden, aber auch kleinere Faltungseinheiten werden als Vorfahren vorgeschlagen (siehe Arbeiten von Edward N. Trifonov, falls verfügbar, und beachten Sie, dass selbst einzelne Aminosäuren Reaktionen katalysieren können). Das Zusammenfügen dieser 20-30mer (über das Gen), die sich in „supersekundäre" Struktureinheiten falten, führt rasch zu einer gefalteten „Domäne" von 50-150 Aminosäuren. Diese Domänen sind kleine gefaltete Einheiten. Diese Domänengröße ist im Wesentlichen universell. Man findet keine Beispiele für eine Domäne von 1000 Aminosäuren, sondern diese besteht stattdessen aus etwa 10 kleineren Domänen. Es ist sehr wichtig zu beachten, dass in vielen Fällen eine solche Faltung nicht die vollständige Spezifikation der Sequenz erfordert, sondern nur die Aufrechterhaltung des Musters der Aminosäurekategorien (polar, unpolar usw.). Viele Domänen tun interessante Dinge, aber ein wiederkehrendes Thema ist es, dann Sammlungen dieser Domänen entweder als separate Subeinheiten zusammenzubringen, um die Quartärstruktur zu bilden, oder sie durch die Verwendung eines einzelnen Gens zu einer einzigen Kette zu verbinden.
Dieser letztgenannte Prozess ist der Weg, auf dem man ein Protein mit 1000 Aminosäuren herstellt. Die Natur nimmt die Domänenmodule und setzt sie zusammen, um neuartige Strukturen und Funktionen zu erzeugen. (Beachten Sie, dass sehr wenige lange Proteinketten als solche vorkommen, da ihre Synthese schwierig ist aufgrund der zunehmenden Wahrscheinlichkeit von Fehlern bei der Gen-Replikation, Transkription oder Translation. Diese Probleme wurden von Francis Crick erkannt, wenn ich mich richtig erinnere, in den 1960er Jahren. Die durchschnittliche Proteingröße beträgt etwa 500 Aminosäuren.) Die Anzahl der Domänen mit einzigartigen Faltungen scheint auf etwa 1000 bis 10.000 begrenzt zu sein (sicherlich weniger als eine Million), und es wird selten, dass die Wissenschaft neue findet. Dies bedeutet, dass unabhängig von Ihrer Sequenz Sie eine dieser Faltungen erhalten (beachten Sie jedoch, dass es eine relativ neue Entdeckung von „nativ-entfalteten" Proteinen gibt, die entfaltet bleiben, bis sie an ihre Zielmolekül binden, woraufhin sie sich falten. Wie viel des Sequenzraums von diesen voll funktionsfähigen Proteinen eingenommen wird, ist unbekannt).
Die Anzahl der Proteintypen in einem Organismus scheint ebenfalls sehr begrenzt zu sein: von nur wenigen hundert bei Bakterien mit sehr kleinen Genomen bis hin zu vielleicht der Größenordnung von 10.000 bei mehrzelligen Organismen. Diese Proteine enthalten immer noch dieselben Domänen. Diese begrenzte Anzahl von Proteinen führt eine begrenzte Anzahl von Reaktionen durch (insgesamt wieder nur Hunderte bis Tausende solcher Reaktionen, wie in Standard-Lehrbüchern der Biochemie detailliert beschrieben). Das Wichtige, um verschiedene Arten zu erzeugen, ist, wie all diese Reaktionen (meistens) durch Proteine gesteuert werden, die jeweils unter Verwendung derselben strukturellen Prinzipien aufgebaut sind, wie bereits dargelegt. Dieser Kontrollbereich wird oft als Teil von EvoDevo oder evolutionärer Entwicklung bezeichnet, und hier finden die eigentlichen Diskussionen über Komplexität statt. Das ist nicht mein Spezialgebiet, daher kehre ich nun zu den Proteinen zurück.
Es ist hoffentlich klar, dass wir ein beträchtliches Verständnis der Proteinstruktur und ihrer Funktionsweise besitzen und dass sie nicht so komplex sind, dass wir sie nicht erklären (und sogar selbst entwerfen) können. David S. Goodsell hat ein hervorragendes Buch über „Bionanotechnologie" veröffentlicht, das zeigt, was die Natur erreicht hat und wie unser Verständnis dies ermöglicht, neue Experimente zu entwerfen. Wir könnten, falls wir es wünschen, einen strukturellen Raum und einen funktionalen Raum auf dieselbe Weise definieren wie einen Sequenzraum. Aus dem Vorstehenden sollte klar sein, dass keiner dieser Räume im Vergleich zur möglichen Größe des Sequenzraums besonders groß ist.
Angesichts der geringen Größe der Räume für Domänenstruktur, chemische Reaktivität und biochemische Funktion, oder vielleicht könnte ich sie als Werkzeugkästen bezeichnen, scheint es nicht zu viel von einer Vermutung zu sein, dass der letzte gemeinsame Vorfahre allen Lebens auf der Erde mit all diesen Werkzeugkästen ausgestattet war. Deshalb haben wir uns entschlossen, die Grenzen der Nutzung dieser Werkzeugkästen zu bestimmen und die oberen und unteren Grenzen von weit zurück in der Zeit zu berechnen. Die Werkzeuge waren zu diesem Zeitpunkt (oder sogar noch bei Bakterien heute) möglicherweise nicht vollständig genutzt oder erforscht, aber später, als mehrzellige Organismen erschienen, waren diese Werkzeuge bereit zur Verwendung und sogar zur Neukonfiguration.
So kehren wir zum Problem zurück, wie groß der Sequenzraum ist. Es handelt sich nicht um 20 hoch die Anzahl der Aminosäuren in der Sequenz, sondern um viel weniger, wie wir in unserem Artikel diskutiert haben. Es besteht kein Bedarf, 20 verschiedene Arten von Aminosäuren mit jeweils einzigartigen Eigenschaften oder Sequenzlängen größer als etwa 100 zu haben. Dies liegt an den physikalischen Ähnlichkeiten zwischen Aminosäuren und dem begrenzten Spektrum gefalteter Strukturen. Nur wenige Aminosäuren in einem Protein sind für seine Funktion entscheidend. Änderungen an diesen führen manchmal fast zu keiner Veränderung der Funktion. Einige jedoch verändern die Funktion zu etwas Neuem, während die Struktur erhalten bleibt, und nur sehr wenige verändern die Proteinstruktur (und damit seine ursprüngliche Funktion) vollständig, wobei sie mit sehr hoher Wahrscheinlichkeit dennoch eine neue Funktion vermitteln. Selbst wenn die ursprüngliche Struktur durch eine Mutation zerstört wird und das Protein nicht faltet, ist die Möglichkeit einer neuen Funktion nicht verloren, wie der Entdeckung nativ ungefalteter Proteine entnommen werden kann, die beim Binden an ein Ziel eine Faltung und Funktion erwerben.
Der Sequenzraum wurde, sobald er vorgeschlagen wurde, schnell als albernes "Paradoxon" von Proteinwissenschaftlern erkannt (obwohl leider nicht von einigen anderen Wissenschaftlern), ähnlich dem albernen Levinthal- "Paradoxon" der Proteinfaltung. Der Sequenzraum kann groß sein, das bedeutet jedoch nicht, dass er komplex ist. Ich hoffe, dass der obige kurze Aufsatz über Proteinstruktur und Funktion auch für Sean Pitman nützlich ist, der aufhören muss, sich mit computergestützter Numerologie zu beschäftigen, und einige Lektüre betreiben und mit praktischen Proteinwissenschaftlern sprechen. Ich hoffe auch, dass er erkennt, dass Proteine für die Religion irrelevant sind und dass sie, ebenso wie andere Makromoleküle, absolut keine Grundlage für Intelligent Design bieten.
Einige kurze, spezifische Antworten auf Kritik von Sean Pitman
hier
> Die Autoren argumentieren, dass, weil einige Arten von funktionellen Proteinen kleiner
> als 100aa [Aminosäuren] sind und weil einige Arten von Proteinen sehr geringe
> Anforderungen an die Sequenzspezifität haben, im Prinzip der gesamte Sequenzraum
> in nur wenigen Milliarden Jahren durchsucht werden konnte.
> Was diese Autoren nicht erkennen, ist, dass nicht alle proteinbasierten Systeme
> gleichwertig sind. Manche Systeme benötigen tatsächlich nur sehr wenige Aminosäure-Bausteine
> und eine geringe Sequenzspezifität. Diese befinden sich natürlich auf einem sehr niedrigen
> Niveau der funktionalen Komplexität. Andere Systeme erfordern jedoch weit mehr
> als die von den Autoren diskutierten 100aa-Systeme – mindestens. Und viele dieser
> Systeme erfordern ein erhebliches Maß an Spezifität. Diese Systeme befinden sich
> auf einem viel höheren Niveau der funktionalen Komplexität und belegen daher
> viel viel größere Sequenzräume und weisen zudem exponentiell niedrigere Verhältnisse
> von potenziell vorteilhaften zu nicht-vorteilhaften Varianten auf diesen höheren Ebenen auf.
Mit fast 50 Jahren biologischer und chemischer Forschung, die zwischen den Autoren geteilt wurde, verstehen wir wirklich, dass nicht alle Moleküle gleich sind. Wir sagen nicht, dass nur wenige spezifizierte Aminosäuren verfügbar sind, sondern wenige Typen von Aminosäuren – polare, unpolare, negative, positive und so weiter. Zum Beispiel könnte jede der polaren an einem bestimmten Ort funktionieren. Alles, was Sie angeben müssen, ist die Polarität. Da dies die gesamte Grundlage für die Verwendung von Sequenzvergleichen zur Gruppierung von Proteinen in funktionelle Familien ist und diese Computermethoden von Befürwortern des Intelligent Design verwendet werden, sollten sie das wissen. Kleine Proteine sind nicht notwendigerweise funktionell einfach, noch sind große Proteine notwendigerweise in ihrer Funktion komplex (tatsächlich sind einige bemerkenswert langweilig).
> Die Autoren dieses Papiers setzen sich nicht einmal mit dem Konzept unterschiedlicher
> Ebenen funktioneller Komplexität auseinander. Sie weisen lediglich auf das Offensichtliche hin, dass
> einige Arten funktioneller Systeme sehr sehr niedrigstufige Systeme sind. Na klar! Was ist
> mit jenen Systemen, die auf viel viel höheren Ebenen von Mindestgrößen-
> und/oder Spezifitätsanforderungen liegen?...
Diese zunehmenden Grade funktionaler Komplexität sind eine Illusion. Nur weil ein Geißelapparat sich dreht und aufwendig aussieht, bedeutet das nicht, dass er komplexer ist als etwas Kleineres. Die viel kleineren wunderbaren Maschinen, die an der Manipulation von DNA beteiligt sind, Zellwände oder das Zytoskelett während des Zelllebenszyklus bilden, tun weit komplexere und vielfältigere Dinge, einschließlich des Umschaltens zwischen Funktionen. Selbst ein kleines Serinprotease hat eine viel schwierigere Aufgabe als der Geißelapparat. Der Geißelapparat dreht sich einfach nur und dreht sich und gähnt...
Eine weitere Kritik von Sean Pitman ursprünglich
hier.
> Die Beweise zeigen, dass die Distanzen [im Sequenzraum] zwischen höher und
> höherstufigen vorteilhaften Sequenzen mit neuen Funktionen sich linear
> erhöhen."
Welche Beweise? Und wenn die Wichtigkeit der Funktion mit der Sequenzlänge skaliert und die Skalierung linear ist, dann befürchte ich, dass 20^100 im Wesentlichen identisch zu 2 x 20^100 ist. Auch eine neue Funktion ist keine neue Funktion, sondern einfach eine, auf die wir bei der harten Arbeit im Labor stoßen. Sie war schon lange da...
[Zurück zu den Beiträgen des Monats 2009]