Method Article
* Diese Autoren haben gleichermaßen beigetragen
Das Ziel dieses Protokolls ist es, die strukturelle Dynamik der eindimensionalen Diffusion von Protein entlang der DNA unter Verwendung eines pflanzlichen Transkriptionsfaktors WRKY-Domänenprotein als beispielhaftes System aufzudecken. Zu diesem Zweck wurden sowohl atomistische als auch grobkörnige Molekulardynamiksimulationen zusammen mit umfangreichen computergestützten Stichproben implementiert.
Das eindimensionale (1-D) Gleiten des Transkriptionsfaktors (TF)-Proteins entlang der DNA ist essentiell für die erleichterte Diffusion der TF, um die Ziel-DNA-Stelle für die genetische Regulation zu lokalisieren. Der Nachweis der Base-Pair-Auflösung (bp) des TF-Gleitens oder -Tretens auf der DNA ist immer noch eine experimentelle Herausforderung. Wir haben kürzlich All-Atom-Molekulardynamik-Simulationen (MD) durchgeführt, die spontanes 1-bp-Stepping eines kleinen WRKY-Domänen-TF-Proteins entlang der DNA erfassen. Basierend auf dem 10 μs WRKY-Schrittpfad, der aus solchen Simulationen gewonnen wurde, zeigt das Protokoll hier, wie umfangreichere Konformationsproben der TF-DNA-Systeme durchgeführt werden können, indem das Markov-Zustandsmodell (MSM) für das 1-bp-Protein-Stepping konstruiert wird, wobei verschiedene Mikro- und Makrozustände für die MSM-Konstruktion getestet wurden. Um die prozessive 1-D-Diffusionssuche des TF-Proteins zusammen mit DNA mit struktureller Basis zu untersuchen, zeigt das Protokoll außerdem, wie grobkörnige (CG) MD-Simulationen durchgeführt werden können, um die langfristige Skalendynamik des Systems zu untersuchen. Solche CG-Modellierungen und -Simulationen sind besonders nützlich, um die elektrostatischen Auswirkungen der Protein-DNA auf die prozessiven Diffusionsbewegungen des TF-Proteins über Dutzende von Mikrosekunden aufzudecken, im Vergleich zu Submikrosekunden bis Mikrosekunden Proteinschrittbewegungen, die aus den Allatomsimulationen aufgedeckt wurden.
Transkriptionsfaktoren (TF) suchen nach der Ziel-DNA, um die Gentranskription und die damit verbundenen Aktivitäten zu binden und zu regulieren1. Abgesehen von der dreidimensionalen (3D) Diffusion wurde vorgeschlagen, dass die erleichterte Diffusion von TF für die Ziel-DNA-Suche unerlässlich ist, bei der die Proteine auch entlang eindimensionaler (1D) DNA gleiten oder hüpfen oder mit intersegmentalem Transfer auf die DNAspringen können 2,3,4,5,6,7.
In einer kürzlich durchgeführten Studie haben wir Dutzende von Mikrosekunden (μs) All-Atom-Gleichgewichtsmolekulardynamik (MD) -Simulationen an einer pflanzlichen TF durchgeführt - dem WRKY-Domänenprotein auf der DNA8. Ein vollständiges 1-bp-Stepping von WRKY auf Poly-A-DNA innerhalb von Mikrosekunden wurde aufgenommen. Die Bewegungen des Proteins entlang der DNA-Rille und der Breaking-Reforming-Dynamik von Wasserstoffbrückenbindungen (HBs) wurden beobachtet. Während eine solche Trajektorie einen abgetasteten Pfad darstellt, fehlt es immer noch an einer allgemeinen Protein-Stepping-Landschaft. Hier zeigen wir, wie mit dem konstruierten Markov-Zustandsmodell (MSM) rechnerische Stichproben um den anfänglich erfassten Proteinschrittpfad erweitert werden können, die für die Simulation einer Vielzahl von biomolekularen Systemen mit erheblichen Konformationsänderungen und Zeitskalentrennung weit verbreitet sind 9,10,11,12,13,14,15,16. 17,18,19. Ziel ist es, das Konformationsensemble und die metastabilen Zustände der TF-Proteindiffusion entlang der DNA für einen zyklischen Schritt aufzudecken.
Während die obige MD-Simulation die atomare Auflösung der Proteinbewegungen für 1 bp auf der DNA zeigt, ist die strukturelle Dynamik der langzeitprozessiven Diffusion der TF entlang der DNA bei der gleichen hohen Auflösung kaum zugänglich. Die Durchführung von grobkörnigen (CG) MD-Simulationen auf Rückstandsebene ist jedoch technisch zugänglich. Die CG-Simulationszeitskala kann effektiv auf das Zehn- oder Hundertfache verlängert werden als die atomaren Simulationen 20,21,22,23,24,25,26,27,28,29. Hier zeigen wir die CG-Simulationen, die durch die Implementierung der von Takada lab30 entwickelten CafeMol-Software durchgeführt wurden.
Im aktuellen Protokoll präsentieren wir zuerst die atomaren Simulationen des WRKY-Domänenproteins entlang der Poly-A-DNA und die MSM-Konstruktion, die sich auf die Probenahme der Proteinschrittbewegungen für nur 1 bp entlang der DNA konzentrieren. Dann präsentieren wir die CG-Modellierung und Simulationen desselben Protein-DNA-Systems, die die rechnerische Probenahme auf die proteinprozessive Diffusion über Dutzende von bps entlang der DNA ausdehnen.
Hier verwenden wir die Software GROMACS 31,32,33, um MD-Simulationen durchzuführen, und MSMbuilder34, um das MSM für abgetastete Konformationsschnappschüsse zu konstruieren und VMD 35 zur Visualisierung der Biomoleküle zu verwenden. Das Protokoll erfordert, dass der Benutzer in der Lage ist, die oben genannte Software zu installieren und zu implementieren. Die Installation und Implementierung der CafeMol 30-Software ist dann für die Durchführung der CGMD-Simulationen erforderlich. Weitere Analysen der Trajektorien und Visualisierungen werden ebenfalls in VMD durchgeführt.
1. Aufbau des Markov-Zustandsmodells (MSM) aus atomaren MD-Simulationen
2. Durchführung einer grobkörnigen (CG) Simulation zur Abtastung der Langzeitdynamik
Rotationsgekoppeltes Gleiten oder 1 bp Treten von WRKY aus der MSM-Konstruktion
Alle Proteinkonformationen auf der DNA werden auf die Längsbewegung X und den Rotationswinkel des Proteins COM entlang der DNA abgebildet (siehe Abbildung 3A). Die lineare Kopplung dieser beiden Grade zeigt ein rotationsgekoppeltes Stepping des WRKY-Domänenproteins auf der DNA an. Die Konformationen können im MSM weiter in 3 Makrozustände (S1, S2 und S3) gruppiert werden. Das Vorwärtsstepping von WRKY folgt dann dem Makrozustandsübergang S1->S2->S3. S1 bezieht sich auf einen metastabilen Zustand, der durch die modellierte Struktur (basierend auf der Kristallstruktur des WRKY-DNA-Komplexes40) mit einer Population von ~ 6% initiiert wird. Beachten Sie, dass in der aktuellen Modellierung die anfängliche Proteinkonformation aus der Kristallstruktur übernommen wurde, in der das Protein an die spezifische W-Box-DNA-Sequenz40 bindet. Ein solcher modellierter Protein-Poly-A-DNA-Komplex führt somit zu ungünstigeren Ausgangsstrukturen (S1) als die gestuften oder schließlich entspannten Strukturen (S3). Dennoch kann man feststellen, dass sich die Wasserstoffbrückenbindungen (HBs) an der Protein-DNA-Grenzfläche in der Nähe des Zentrums von S3 erholen wie das in der Nähe des Zentrums in S1 (siehe Abbildung 3B). Die HBs im S1-Zustand sind gut gewartet: K125 mit A15, R131, Q146 und Y133 mit A16, K144 und Y119 mit A17, R135 mit A18 (Abbildung 3B oben links). S3 bezieht sich auf einen metastabilen Zustand nach dem 1-bp-Protein-Stepping, wobei fast alle HBs für eine Entfernung von 1 bp verschoben sind (Abbildung 3B unten), und die Strukturen scheinen stabil mit der höchsten Population (63%) zu sein. Der Zwischenzustand S2 verbindet S1 und S3 mit einer mittleren bis hohen Bevölkerung (~ 30%). Wir fanden heraus, dass R135 und K144 in diesem Zwischenzustand ziemlich flexibel sind und normalerweise HBs mit dem aktuellen Nukleotid brechen und mit dem nächsten Nukleotid reformieren können (Abbildung 3B oben rechts). Insgesamt bewegte sich das WRKY-Protein COM ~ 2,9 Å und drehte sich hier um ~ 55 ° auf Schritt 1 bp. Der ratenbegrenzende Schritt für das WRKY-Stepping ist S2->S3, der im Wesentlichen ein kollektives Brechen und Reformieren der HBs ermöglicht und im Durchschnitt ~ 7 μs erfordert. Im Gegensatz dazu können S1 bis S2 sehr schnell zu einem Zeitpunkt von ~0,06 μs oder 60-ns transitieren (Abbildung 3B), wobei hauptsächlich die Protein-COM-Fluktuationen (z. B. aufgrund von Proteinorientierungsänderungen auf der DNA) beteiligt sind.
Einzelstrang-Bias von WRKY während der prozessiven Diffusion im CG-Modell
In unserer aktuellen Studie fanden wir heraus, dass das WRKY-Domänenprotein bevorzugt an einen Strang der dsDNA bindet, unabhängig davon, ob es sich um ein 1-bp-Stepping oder eine statische Bindung handelt. und die Einzelstrangverzerrung wird besonders bei der spezifischen DNA-Sequenzbindung8 sehr deutlich. Inzwischen ist nicht klar, ob ein solcher Trend während der prozessiven Diffusion des Proteins entlang der DNA anhält. Hier haben wir versucht, die potentielle Strangverzerrung über die CG-Simulationen zu untersuchen. Interessanterweise wurde in den CG-Simulationen des WRKY während der prozessiven Diffusion eine signifikante Einzelstrang-DNA-Bindungskonfiguration identifiziert. Dazu wurden die Kontaktzahlen zwischen Protein und DNA an den jeweiligen DNA-Strängen berechnet (siehe Abbildung 4B). Ein Kontakt wird in Betracht gezogen, wenn der Abstand zwischen dem Protein-CG-Partikel und dem DNA CG P-Partikel (Phosphatgruppe) kleiner als 7 Å ist. Das Protein zeigt in der Tat eine Verzerrung zu einem der DNA-Stränge (z. B. ~ 4 Kontakte zu einem Strang und ~ 1 Kontakt zum anderen), d.h. selbst wenn detaillierte Interaktionen wie HBs an der Protein-DNA-Grenzfläche nicht modelliert werden.
Der bevorzugte DNA-Strang kann jedoch von Zeit zu Zeit zwischen den beiden DNA-Strängen wechseln, abhängig von der Bindungsorientierung oder Konfiguration des Proteins auf der DNA. Insbesondere nach der Kontaktzahl, die zwischen dem Protein und den jeweiligen DNA-Strängen gebildet wird, gibt es hier hauptsächlich 4 Zustände (wie in Abbildung 4B,C mit 1, 2, 3 und 4 markiert). In den Zuständen 1 und 3 bindet eine Zinkfingerregion in Richtung -Y, und der bevorzugte Strang ist der blaue. In den Zuständen 2 und 3 bindet die Zink-Finger-Region in Richtung +Y, und der bevorzugte Strang wird zum roten. Es wird auch festgestellt, dass die Zink-Figner-Region dominant mit der DNA interagiert (siehe Abbildung 4D). Daher ist der DNA-Strang, der eng mit der Zinkfingerregion verbunden ist, in der Tat der bevorzugte. Nach der obigen Stichprobe scheint es also, dass der Strangbias bestehen bleibt, aber zwischen den beiden DNA-Strängen im CG-Modell der prozessiven Proteindiffusion wechselt.
Proteinindividuelles Restschritt in den CG-Simulationen
Aus unseren CG-Simulationen wurde bereits festgestellt, dass die Schrittgröße von WRKY bei verschiedenen DNA-Sequenzen variieren kann8. Das Protein COM neigt dazu, 1 bp auf die homogene Poly-A-DNA zu treten. Während bei Poly-AT-DNA mit 2-bp-Periodizität der Anteil des 2-bp-Stepping zuzunehmen scheint.
Zusätzlich haben wir hier untersucht, ob sich einzelne Proteinreste an der Protein-DNA-Grenzfläche synchron bewegen. Wir berechneten die Schrittgröße jedes hochkonservierten Rückstands im WRKY-Motiv (WRKYGQK) für jeweils 1000 Zeitschritte (Abbildung 5A). Die Restschrittgröße jedes konservierten Restes kann somit aus den CG-Simulationen gemessen werden. Die Ergebnisse zeigen tatsächlich, dass die Schrittgrößen dieser einzelnen Rückstände auf Poly-A-DNA stärker synchronisiert sind als auf Poly-AT- oder zufälligen DNA-Sequenzen (Abbildung 5B).
Abbildung 1: Die Erzeugung von Konformationen und die Konstruktion von Mikrozuständen/Makrozuständen . (A) Der anfängliche Vorwärtsschrittpfad, der auf dem Protein-DNA-RMSD und dem Proteinrotationswinkel um die DNA abgebildet ist. Die ursprünglich ausgewählten 25 Strukturen sind mit roten Kreisen gekennzeichnet. (B) Die 100 Konformationsclusterzentren aus der 1. Runde 25 x 50 ns MD-Simulationstrajektorien, die auf die beiden höchsten Eigenwert-tICs abgebildet sind. (C) Plots der implizierten Zeitskala als Funktion der Verzögerungszeit für die MSM-Konstruktion über tICA unter Verwendung ausgewählter Entfernungspaare als Eingabe. Für jeden Satz wurde MSM konstruiert, indem die Konformationen auf die oberen 2 tICs projiziert wurden, gefolgt von K-Center-Clustering, um 20 bis 2000 Mikrozustände (von links nach rechts Spalte) mit Korrelationsverzögerungszeit für tICA von 5 bis 40 ns (von der oberen zur unteren Reihe) zu produzieren. (D) Die 500 konstruierten Mikrozustände und (E) die weiter konstruierten 3 Makrozustände, mit entsprechenden Mikrozustandszentren, die entlang der höchsten zwei tICs abgebildet sind. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 2: Aufbau der Makrozustände . (A) Die Abbildung der anfänglichen Vorwärtsschrittpfad-Trajektorie (links) und mit einer kleinen Anzahl zusätzlicher Mikrosekunden-Trajektorienabtastungen (rechts) auf der Bewegung des Proteinmassenschwerpunkts (COM) entlang der DNA-Langachse (X) und des Rotationswinkels um die DNA (zuvor8 erhalten). (B) Die Abbildung der ursprünglichen Trajektorien mit 100 × 50 ns und der Trajektorien mit 97 × 50 ns, die im aktuellen MSM-Bau verwendet werden. (C) Die Konstruktion von 3-6 Makrozuständen und deren Populationen aus den konstruierten MSM sind auf den umfangreichen Stichprobenkarten beschriftet. (D) Die Proteinbewegung X bzw. der Rotationswinkel um die DNA sind dargestellt. Die abgetasteten Konformationen werden schließlich in 3 Makrozustände zusammengefasst, wobei Rot, Blau und Grau dem Makrozustand 1, 2 bzw. 3 entsprechen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 3: Das MSM des WRKY-Domänenproteins, das auf Poly-A-DNA tritt. (A) Die Projektion der MD-Konformationsschnappschüsse auf Koordinaten der Protein-COM-Bewegung X und des Rotationswinkels in Bezug auf die DNA. Die 3 Makrozustände S1, S2 und S3 sind rot, blau bzw. grau eingefärbt. (B) Repräsentative Konformationen und Übergangs-Mittelwert-First-Passage-Time (MFPT) der konstruierten 3 Makrozustände. Die wichtigsten Wasserstoffbrückenbindungen zwischen Protein und DNA werden gezeigt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 4: Das Grobkornmodell (CG) und die Kontakte, die zwischen Protein- und DNA-Strängen im CG-Modell gebildet wurden. (A) Die Grobkörnung von Protein (links) und DNA (rechts). (B) Die Kontaktnummer zwischen WRKY und jedem DNA-Strang entlang der Simulation. (C) Die molekularen Ansichten der 4 Kontaktmodi. Die Proteinregion in der Nähe des Zinkfingers ist grau und die andere Region grün gefärbt. (D) Die Kontaktwahrscheinlichkeit jeder Proteinaminosäure mit DNA. Wenn der Abstand zwischen dem CG-Partikel der Aminosäure und DNA-CG-Partikeln kleiner als 7 Å ist, wird davon ausgegangen, dass die Aminosäure in Kontakt mit der DNA steht. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 5: Die Diffusionsschrittgrößen einzelner Proteinaminosäuren im WRKY-Motiv als WRKY, die sich entlang der DNA bewegen. (A) Die hochkonservierten Reste (WRKYGQK) in atomarer Struktur (links) und nach Grobkörnung (rechts). (B) Die Schrittgröße für jeden konservierten Rückstand auf verschiedenen DNA-Sequenzen (Poly-A; Poly-AT; zufällige Sequenzen) Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Zusatzakte 1: Die Python-Codes und die Software, die in diesem Protokoll verwendet werden. MSM wird hauptsächlich mit dem MSMbuilder erstellt, die erforderlichen Python-Codes sind angehängt. Bitte klicken Sie hier, um diese Datei herunterzuladen.
Ergänzungsakte 2: Die atomistischen Molekulardynamiksimulationen werden von GROMACS durchgeführt, die Befehle und notwendigen Dateien zum Erstellen von Allatomsimulationen sind ebenfalls beigefügt. Die grobkörnigen Simulationen werden von der CafeMol-Software durchgeführt. Die Simulationsergebnisse werden von VMD und MATLAB analysiert. Bitte klicken Sie hier, um diese Datei herunterzuladen.
Ergänzungsakte 3: Das tcl-Skript zum Rotieren und Bewegen von Protein in VMD. Bitte klicken Sie hier, um diese Datei herunterzuladen.
Diese Arbeit befasst sich mit der Durchführung strukturbasierter Computersimulationen und Probenahmen, um einen Transkriptionsfaktor oder ein TF-Protein aufzudecken, das sich entlang der DNA bewegt, nicht nur im atomaren Detail des Steppens, sondern auch in der prozessiven Diffusion, die für die erleichterte Diffusion von TF in der DNA-Zielsuche unerlässlich ist. Dazu wurde zunächst das Markov-Zustandsmodell oder MSM eines kleinen TF-Domänenproteins WRKY konstruiert, das für 1-bp entlang homogener Poly-A-DNA schritt, so dass ein Ensemble von Proteinkonformationen auf der DNA zusammen mit kollektiver Wasserstoffbrückenbindung oder HB-Dynamik an der Protein-DNA-Schnittstelle aufgedeckt werden kann. Um das MSM zu erhalten, führten wir zwei Runden umfangreicher All-Atom-MD-Simulationen entlang eines spontanen Protein-Stepping-Pfades (erhalten aus früheren 10-μs-Simulationen) mit Stromproben in Aggregation von 7,5 μs (125 x 60 ns) durch. Solche umfangreichen Probenahmen liefern uns Momentaufnahmen für die Konformationsclusterung in Hunderte von Mikrozuständen, wobei Protein-DNA-Grenzflächenpaarabstände als geometrische Maße für das Clustering verwendet werden. Die Markovsche Eigenschaft der MSM-Konstruktion wird teilweise validiert, indem die zeitliche Trennung von den implizierten Zeitskalen, die für verschiedene Längen oder Verzögerungszeiten einzelner MD-Simulationen berechnet werden, erkannt wird. 20–2000 Mikrozustände wurden dann getestet und für die zeitskaligen Trenneigenschaften verglichen, wobei 500 Mikrozustände für die MSM-Konstruktion ausgewählt wurden. Darüber hinaus wurden die 500 Mikrozustände kinetisch in eine kleine Anzahl von Makrozuständen zusammengefasst, für die wir eine unterschiedliche Anzahl von Zuständen getestet und festgestellt haben, dass drei Makrozustände für das aktuelle System ausreichen. Das Drei-Staaten-Modell zeigt einfach, dass der Zustand S1 vergleichsweise schnell (innerhalb von Dutzenden von ns) zu S2 übergeht, dominiert von Schwankungen des Proteinmassenschwerpunkts (COM) auf der DNA, während der Zustand S2 langsam zu S3 übergeht und geschwindigkeitsbegrenzend ist (~ 7 μs im Durchschnitt), dominiert von kollektiver HB-Dynamik für das Steppen. Beachten Sie, dass die kinetische Zusammenfassung der Mikrozustände in eine kleine Anzahl kinetisch unterschiedlicher Makrozustände noch methodischen Entwicklungen unterliegt, wobei verschiedene Algorithmen getestet und maschinelle Lerntechniken verbessert werden 57,58,59,60,61,62,63 . Zu den kritischen Schritten zum Erstellen von MSM gehören die Auswahl der in tICA verwendeten Abstandspaare und die Bestimmung der Parameter, die zum Erstellen von Mikrozuständen verwendet werden. Die Wahl der Fernpaare basiert auf Wissen, und es ist wichtig, die wichtigsten Interaktionspaare zu wählen. Die Parameter für die Konstruktion von Mikrozuständen, wie die Korrelationsverzögerungszeit, die Verzögerungszeit, das Durcheinander von Mikrozuständen, müssen richtig eingestellt werden, um sicherzustellen, dass das System Markovian ist.
Mit solchen Bemühungen kann die Submikro- bis Mikrosekunden-Proteinstrukturdynamik mit atomaren Details systematisch für Proteinschritte von 1-bp entlang der DNA aufgedeckt werden. Im Prinzip kann das System mit der Übergangswahrscheinlichkeitsmatrix, die aus der MSM-Konstruktion erhalten wurde, auf eine lange Zeitskala jenseits von Mikrosekunden oder etwa auf die Annäherung an Millisekunden und über13,17,64 entwickelt werden. Es gibt jedoch intrinsische Einschränkungen der MSM-Probenahme und -Konstruktion, die auf Submikrosekunden-Einzelsimulationen um einen bestimmten Anfangspfad beruhen, und die Markovsche Eigenschaft ist möglicherweise nicht gut garantiert 65,66. In den meisten Praktiken wurde der anfängliche Weg unter Zwang oder Beschleunigung konstruiert, obwohl wir im aktuellen System einen spontanen Proteinschrittpfad (ohne Antrieb oder Beschleunigung) nutzen, der aus einer 10-ms-Gleichgewichtssimulation8 gewonnen wird. Die Konformationsproben in Aggregat sind aufgrund der hohen Rechenkosten der atomaren Simulationen immer noch um Dutzende von Mikrosekunden begrenzt. Solche Mikrosekundenabtastungen des Proteinschritts liefern wahrscheinlich keine ausreichenden Konformationen, um auf einer langzeitskaligen prozessiven TF-Diffusion zu erscheinen. Das Speicherproblem würde erheblich werden, wenn man die aktuell erhaltene Übergangswahrscheinlichkeitsmatrix über eine bestimmte Zeitskala hinaus implementiert und die Markovsche Eigenschaft nicht garantiert ist, um die ordnungsgemäße Verwendung des aktuellen MSM 14,52,66 sicherzustellen. Um die prozessive Diffusion von TF entlang der DNA auf der Langzeitskala zu beproben, werden stattdessen die Grobkorn- oder CG-Modellierung und -Simulation auf der Reststandsebene implementiert, um ein Gleichgewicht zwischen der Aufrechterhaltung der strukturellen Basis und der Senkung der Rechenkosten herzustellen.
In der CG-Modellierung und -Simulation werden die Proteinreste und DNA-Nukleotide durch Kügelchen (d. h. eine Perle für eine Aminosäure und drei Perlen für ein Nukleotid) dargestellt, wobei die Proteinkonformation über das Go-Modell in Richtung einer nativen oder voräquilibrierten Konfiguration 30,53 aufrechterhaltenwird. Obwohl die atomare Ebene der HB-Wechselwirkungen im CG-Modell fehlt, sind die elektrostatischen Wechselwirkungen zwischen Protein und DNA gut erhalten, die in der Lage zu sein scheinen, dominante Dynamikmerkmale in der prozessiven Diffusion des Proteins entlang der DNA67,68,69,70 zu erfassen. Detaillierte Implementierungsprotokolle zur Modellierung und Simulation des WRKY-DNA-Systems werden hier vorgestellt. Die repräsentativen Ergebnisse zeigen interessanterweise, dass erstens die Einzelstrang-DNA-Bias, die in der vorherigen atomaren Simulation des WRKY-DNA-Systems dargestellt wurde, im CG-Modell bestehen bleibt, während eine Vielzahl von Proteinorientierungen / -konfigurationen, die während der Prozessdiffusion beprobt wurden, von Zeit zu Zeit zu einem Wechsel der Verzerrung zwischen den beiden Strängen führen. Daher ist ein solcher DNA-Strang-Bias nicht unbedingt mit der HB-Assoziation verbunden, sondern scheint hauptsächlich auf den elektrostatischen Wechselwirkungen zwischen Protein und DNA zu beruhen, die für verschiedene Proteinkonfigurationen oder Orientierungen auf der DNA variieren. Als nächstes zeigen einzelne Aminosäuren an oder in der Nähe der Protein-DNA-Grenzfläche, wie die hochkonservierten WRKQGQK-Motive, unterschiedliche Schrittgrößen oder Synchronisationsmuster für verschiedene DNA-Sequenzen. In unserer vorherigen Studie wurden die Schrittgrößenvariationen nur für die COM des Proteins gezeigt, da das Protein modelliert wurde, um entlang verschiedener DNA-Sequenzen zu diffundieren. Beachten Sie, dass das aktuelle CG-Modell der DNA DNA-Sequenzvariationen mit unterschiedlicher Parametrisierung 54,71,72 unterstützt, obwohl atomare Details fehlen. Eine korrekte DNA-sequenzabhängige Parametrisierung in der strukturbasierten Modellierung des Protein-DNA-Systems ist daher entscheidend, um Protein-DNA-Such- und Erkennungsmechanismen über mehrere Zeit- und Längenskalen hinweg aufzudecken.
Die Autoren haben keinen Interessenkonflikt.
Diese Arbeit wurde von NSFC Grant #11775016 und #11635002 unterstützt. JY wurde vom CMCF der UCI über die NSF DMS 1763272 und den Simons Foundation Grant #594598 und den Start-up-Fonds der UCI unterstützt. LTD wurde von der Natural Science Foundation of Shanghai #20ZR1425400 and #21JC1403100 unterstützt. Wir danken auch der rechnerischen Unterstützung durch das Beijing Computational Science Research Center (CSRC).
Name | Company | Catalog Number | Comments |
CafeMol | Kyoto University | coarse-grained (CG) simulations | |
GROMACS | University of Groningen Royal Institute of Technology Uppsala University | molecular dynamics simulations software | |
Matlab | MathWorks | Numerical calculation software | |
MSMbuilder | Stanford University | build MSM | |
VMD | UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN | molecular visualization program |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten