Method Article
Die beschriebenen Protokolle ermöglichen Aufbau, Charakterisierung und Auswahl (gegen das Ziel der Wahl) einer "Domainome"-Bibliothek, die aus jeder DNA-Quelle hergestellt. Dies wird erreicht durch eine Forschungs-Pipeline, die verschiedenen Technologien kombiniert: Phagen-Display, eine klappbare Reporter und Sequenzierung der nächsten Generation mit einem Web-Tool für die Datenanalyse.
Klappbare Reporter sind Proteine mit leicht erkennbaren Phänotypen, wie z. B. Antibiotika-Resistenz, dessen Falten und Funktion beeinträchtigt wird, wenn schlecht Faltung von Proteinen oder zufällige open Reading Frames verschmolzen. Wir haben eine Strategie entwickelt, kann mithilfe von TEM-1 β-Lactamase (das Enzym überträgt die Ampicillin-Resistenz) auf genomischer Ebene, Sammlungen von korrekt gefaltete Protein Domains wählen wir aus der Codierung Teil der DNA von jedem intronless Genom. Die PROTEINFRAGMENTE erhalten durch diesen Ansatz, der so genannte "Domainome", werden gut ausgedrückt und löslich, so dass sie für strukturelle und funktionelle Studien sein.
Von Klonen und die Anzeige "Domainome" direkt in einem Phagen-Display-System, haben wir zeigten, dass spezifisches Protein Domains mit der gewünschten Bindeeigenschaften (z. B. an andere Proteine oder Antikörper), wählen dadurch wesentlich kann experimentellen Daten für gen-Annotation oder Antigen-Identifikation.
Die Identifikation der meisten angereicherten Klone in einer ausgewählten polyklonale Population kann mithilfe von Technologien neuartige Next Generation Sequencing (NGS) erreicht werden. Aus diesen Gründen stellen wir Tiefe Sequenzierung Analyse der Bibliothek selbst und die Auswahl-Ausgänge, komplette Informationen über Vielfalt, Fülle und genaue Kartierung aller ausgewählten Fragment. Die hier vorgestellten Protokolle zeigen die wichtigsten Schritte für Bibliotheksbau, Charakterisierung und Validierung.
Hier beschreiben wir eine Hochdurchsatz-Methode für den Bau und die Auswahl der Bibliotheken der gefalteten und lösliches Protein Domänen aus jeder genic/genomische ab Quelle. Der Ansatz kombiniert drei verschiedene Technologien: Phagen-Display, die Verwendung eines klappbaren Reporter und nächsten Generation Sequencing (NGS) mit einer speziellen Web-Tool für die Datenanalyse. Die Methoden können in vielen verschiedenen Zusammenhängen von Protein-basierten Forschung verwendet werden, für Identifikation und Kommentierung der neuen Proteine-Eiweiß-Domains, Charakterisierung von strukturellen und funktionellen Eigenschaften des bekannten Proteine sowie Definition von Protein-Interaktion Netzwerk.
Viele offene Fragen sind nach wie vor in Protein-basierten Forschung und die Entwicklung von Methoden für optimale Protein-Produktion ist eine wichtige Notwendigkeit für mehrere Felder der Untersuchung. Zum Beispiel fehlt trotz der Verfügbarkeit von Tausenden von prokaryotischen und eukaryotischen Genomen1, eine entsprechende Karte von der relativen Proteome mit eine direkte Anmerkung der kodierten Proteine und Peptide für die große Mehrheit der Organismen. Der Katalog der komplette Proteome taucht als ein anspruchsvolles Ziel, einen riesigen Aufwand an Zeit und Ressourcen erfordern. Der Goldstandard für experimentelle Annotation bleibt das Klonen von alle Open Reading Frames (ORFs) eines Genoms Bau der so genannten "ORFeome". In der Regel Genfunktion Basierend auf Homologie zu verwandten Genen bekannte Tätigkeit zugewiesen, aber dieser Ansatz ist schlecht genau aufgrund der Anwesenheit von vielen falschen Anmerkungen in der Referenz Datenbanken2,3,4, 5. Darüber hinaus auch für Proteine, die identifiziert und kommentiert haben, zusätzliche Studien sind verpflichtet, Charakterisierung in Bezug auf Fülle, Expressionsmuster in unterschiedlichen Kontexten, einschließlich der strukturelle und funktionelle Eigenschaften sowie Interaktion-Netzwerke.
Darüber hinaus da Proteine aus verschiedenen Domänen, jeder von ihnen bestehen zeigt Besonderheiten und anders zu Proteinfunktionen beitragen, die Studie und die genaue Definition dieser Domains können ein noch umfassenderes Bild, sowohl bei den einzelnen gen und auf das vollständige Genom-Ebene. Diese notwendigen Informationen macht Protein-basierten Forschung einem breiten und anspruchsvollen Bereich.
In dieser Perspektive könnte ein wichtiger Beitrag durch unvoreingenommene und Hochdurchsatz-Methoden für die Proteinproduktion gegeben werden. Allerdings beruht der Erfolg solcher Ansätze, neben der erheblichen Investition erforderlich ist, auf der Fähigkeit, lösliche/Stall Protein Konstrukte zu produzieren. Dies ist ein wichtiger Faktor zu begrenzen, da es wurde geschätzt, dass nur etwa 30 % der Proteine können erfolgreich ausgedrückt und produziert in ausreichendem Maße experimentell nützlich6,7,8. Eine Annäherung an diese Beschränkung zu überwinden basiert auf der Verwendung von nach dem Zufallsprinzip fragmentierte DNA herstellen verschiedene Polypeptide, die zusammen überlappende Fragment Darstellung einzelner Gene. Nur ein kleiner Prozentsatz der zufällig generierte DNA-Fragmente sind funktionale ORFs, während die große Mehrheit von ihnen sind nicht-funktionale (wegen des Vorhandenseins des Stop-Codons in ihre Sequenzen) oder codieren für unnatürlich (ORF in einem Frame als das Original) Polypeptide mit keine biologische Bedeutung.
Um diese Probleme zu beheben, hat unsere Fraktion eine Hochdurchsatz-Protein Ausdruck und Interaktion Analyse-Plattform entwickelt, die auf genomischer Ebene9,10,11,12verwendet werden kann. Diese Plattform integriert die folgenden Techniken: 1) eine Methode, um Sammlungen von korrekt gefaltete Protein Domains wählen Sie die Codierung Teil der DNA von jedem Organismus; (2) die Phagen-Display-Technologie für die Auswahl der Partner von Interaktionen; (3) die NGS vollständig charakterisieren die ganze Interaktom untersucht und die Klone von Interesse zu identifizieren; und 4) eine Web-Tool für die Datenanalyse für Anwender ohne Programmierkenntnisse oder Bioinformatik Interaktom-Seq-Analyse in eine einfache und benutzerfreundliche Weise durchführen.
Die Nutzung dieser Plattform bietet wichtige Vorteile gegenüber alternativen Strategien der Untersuchung; die Methode ist vor allem völlig unvoreingenommene, Hochdurchsatz- und modular für Studie, die von einem einzigen Gen bis zu einem ganzen Genom. Der erste Schritt der Pipeline ist die Schaffung einer Bibliothek von nach dem Zufallsprinzip fragmentierte DNA unter Studie, die von NGS dann tief geprägt ist. Diese Bibliothek wird über ein veränderter Vektor wo werden Gene/Fragmente des Interesses geklont, zwischen einer Signalsequenz für Protein Sekretion in den periplasmatischen Raum (d.h. ein Sec-Führer) und das TEM1 β-Lactamase-gen erzeugt. Fusionsproteins wird Ampicillin-Resistenz und die Fähigkeit, unter Druck von Ampicillin nur überleben, wenn geklonten Fragmente im Rahmen sind verleihen diese Elemente und die daraus resultierenden Schmelzverfahren Protein ist korrekt gefaltet10,13 ,14. Alle Klone gerettet, nachdem Antibiotika Auswahl, die so genannte "gefiltert-Klone", sind ORFs und eine große Mehrheit von ihnen (mehr als 80 %), echte Gene9abgeleitet sind. Darüber hinaus liegt die Stärke dieser Strategie in die Ergebnisse, dass alle ORF gefiltert Klone für korrekt gefaltet/lösliche Proteine/Domänen15codieren. Wie viele Klone, vorhanden in der Bibliothek und die Zuordnung in der gleichen Region/Domäne, verschiedene Start- und Endpunkte haben, ermöglicht das unvoreingenommene, einstufigen Identifikation der minimale Fragmente, die lösliche Produkte führen dürften.
Eine weitere Verbesserung in der Technologie ist durch die Verwendung von NGS gegeben, um die Bibliothek zu charakterisieren. Die Kombination dieser Plattform und eine spezielle Web-Tool für die Datenanalyse gibt wichtige objektive Informationen über die genauen Nukleotidsequenzen und über den Standort des ausgewählten ORFs auf dem Referenz-DNA unter Studie ohne weitere umfangreiche Analysen oder experimentellen Aufwand.
Domainome Bibliotheken können in einem Auswahlkontext übertragen und als ein universelles Instrument verwendet, um funktionelle Studien durchführen. Die Hochdurchsatz-Protein Ausdruck und Interaktion Analyseplattform, dass wir integriert und dass wir Interaktom-Seq genannt die Phagen-Display-Technologie nutzt durch Übertragung den gefilterten ORF in einen Phagemid Vektor und die Schaffung von einem Phagen-ORF Bibliothek. Einmal neu geklont in einem Phagen Anzeigekontext Protein Domains auf der Oberfläche der M13 Partikel angezeigt; auf diese Weise können Domainome Bibliotheken für Genfragmente Codierung Domains mit spezifischen enzymatischen Aktivitäten oder bindende Eigenschaften, so dass Interaktom Netzwerke Profilerstellung direkt ausgewählt werden. Dieser Ansatz wurde ursprünglich von Zacchi Et Al. beschrieben. 16 und später in mehreren anderen Kontext13,17,18verwendet.
Im Vergleich zu anderen Technologien zur Untersuchung von Protein-Protein-Interaktion (einschließlich Hefe-zwei-Hybrid-System und Massenspektrometrie19,20), ist ein großer Vorteil die Verstärkung der Bindungspartner, die auftritt, während Phagen mehrfache Umläufe der Auswahl angezeigt. Dies erhöht die Auswahl-Empfindlichkeit, so dass die Identifizierung der niedrigen reichlich Bindeproteine Domänen in der Bibliothek vorhanden. Die Effizienz der Auswahl mit ORF-gefilterte Bibliothek durchgeführt wird aufgrund des Fehlens von nicht-funktionalen Klone weiter erhöht. Schließlich ermöglicht die Technologie die Auswahl gegen Eiweiß und nicht-Protein Köder21,22,23,24,25durchgeführt werden.
Phagen-Auswahl mit Hilfe der Domainome-Phagen-Bibliothek können mit Antikörpern im Serum von Patienten mit verschiedenen pathologischen Bedingungen, z.B. Autoimmunerkrankungen13, Krebs oder Infektionen Krankheiten als Köder aus durchgeführt werden. Dieser Ansatz wird verwendet, um zu erhalten die so genannte "Antikörper Signatur" der Krankheit unter Studie damit massiv zu identifizieren und zu charakterisieren die Antigene/Epitope speziell zur gleichen Zeit von der Patienten Antikörper erkannt. Im Vergleich zu anderen Methoden der Verwendung von Phagen-Display ermöglicht die Identifikation von sowohl lineare als auch Konformationsänderungen Antigenen Epitope. Die Identifikation einer bestimmten Signatur könnte einen wichtigen Einfluss für Verständnis Pathogenese, neue Impfstoff-Design, Identifikation von neuen therapeutischen Ziele und Entwicklung von neuen und spezifischen diagnostischen und prognostischen Tools haben. Darüber hinaus Wenn die Studie auf Infektionskrankheiten konzentriert ist, ist ein großer Vorteil, dass die Entdeckung der Immunogenen Proteine unabhängig vom Erreger Anbau.
Unser Ansatz bestätigt, dass die Faltung Reporter auf genomischer Ebene verwendet werden können, um die "Domainome" wählen: eine Sammlung von korrekt gefaltet, gut ausgedrückt, lösliches Protein Domains aus der Codierung Teil der DNA bzw. cDNA von jedem Organismus. Einmal isoliert die PROTEINFRAGMENTE eignen sich für viele Zwecke, mit wesentlichen experimentelle Informationen für gen-Anmerkungen sowie für strukturelle Studien, Antikörper Epitop Mapping, Antigen-Identifikation. Die Vollständigkeit der Hochdurchsatz-Daten zur Verfügung gestellt von NGS ermöglicht die Analyse von hochkomplexen Proben, wie Phagen-Display-Bibliotheken, und hat das Potenzial, das traditionelle mühsam sammeln und Prüfung von einzelnen Phagen gerettet Klone zu umgehen.
Zur gleichen Zeit dank der Funktionen der gefilterten Bibliothek und die extreme Empfindlichkeit und macht die NGS-Analyse ist es möglich, die Protein-Domäne verantwortlich für jede Interaktion direkt in ein Einstiegsbild, ohne die Notwendigkeit der Schaffung zu identifizieren zusätzliche Bibliotheken für jede gebunden Protein. NGS ermöglicht eine umfassende Definition von der ganzen Domainome gen/genomische ab Quelle und das Web-Tool zur Datenanalyse ermöglicht die Erlangung von eine hochspezifische Charakterisierung von qualitativer und quantitativer Sicht von der Interaktom Proteine Domänen.
1. Aufbau der ORF-Bibliothek (Abbildung 1)
(2) subcloning der gefilterten ORFs in einem Phagemid-Vektor (Abbildung 2)
(3) Phagen Bibliothek Vorbereitung und Auswahlverfahren
(4) Phagen Bibliothek Deep Sequencing Plattform (Abbildung 3)
5. bioinformatische Analyse mithilfe des Interaktom-Seq-Web-Tools
Die Filterung Ansatz ist in Abbildung 1schematisiert. Jede Art von intronless DNA kann verwendet werden. In Figur 1A ist der erste Teil der Filterung Ansatz vertreten: nach dem Laden auf einem Agarosegel oder einem Bioanalyzer eine gute Fragmentierung der DNA von Interesse erscheint als ein Abstrich der Fragmente mit einer Länge in der gewünschten Größe 150-750 bp. Eine repräsentative virtuelle Gelbild der fragmentierten DNA gewonnen wird gegeben. Fragmente auf das Agarosegel geladen werden dann wiederhergestellt, Ende repariert phosphoryliert und dann in einen zuvor abgestumpften pFILTER Vektor erstellen Sie eine Bibliothek von zufälligen DNA-Fragmente kloniert. Jedem Schritt des Verfahrens Klonen unter optimalen Bedingungen ist erforderlich, um gute Qualität Bibliothek mit Gesamtabdeckung der DNA unter Studie zu erhalten.
In Abbildung 1 b ist die Filterung Ansatz vertreten: die Bibliothek wächst im Beisein von Chloramphenicol (pFILTER Widerstand) allein oder Chloramphenicol und Ampicillin für ORF-haltigen Kolonien auswählen. Nur Kolonien mit ein DNA-Fragment, ein ORF entspricht eine funktionale β-Lactamase produzieren und überleben, wenn Antibiotika Auswahl vorhanden ist. Abbildung 1 zeigt, wie die Erhöhung Selektionsdruck Auswahl an guten Ordner ORFs gegenüber armen Ordner diejenigen ermöglicht. Das erwartete Ergebnis ist eine Abnahme der Größe der Bibliothek von etwa 20-fold. Höhere Anzahl der Überlebenden Klone zeigt unzureichend Selektionsdruck.
ORF-Fragmente können einfach aus der gefilterten Bibliothek für Folgeantrag wiederhergestellt werden; Unsere Strategie nutzt für Wechselwirkungsstudien Phagen-Display-Technologie. In Abbildung 2sind die wichtigsten Schritte des Phagen Bibliotheksbau vertreten: eine adäquate Bibliothek wird vorbereitet, indem gefilterte Fragmente aus dem pFILTER-Vektor Ausschneiden und wieder Klonen in einem Phagemid Plasmid in Verschmelzung mit der Sequenz-Codierung für die Phagen Capside Protein g3p. Einmal mit Helfer Phagen infiziert, ermöglicht die Anwesenheit des Vektors in Bakterienzellen die Herstellung von Phagen Partikel ORF-g3p Fusion Produkten auf ihrer Oberfläche, wodurch die gefilterte Bibliothek Phagen-Display ausgewählt und weitere anzeigen Analyse.
Alle Bibliotheken sind tief von NGS, sowie die Ausgänge der Phagen Auswahlen, analysiert, wie im zweiten Teil von Abbildung 3dargestellt. DNA-Fragmente werden von der wachsenden Kolonien gerettet durch PCR-Amplifikation mit spezifischen Oligonukleotiden glühen auf dem Plasmid-Backbone und Durchführung von speziellen Adaptern für die Sequenzierung. NGS erfolgt und liest dann die Interaktom-Seq Datenanalyse Web-Tool analysiert werden.
In Abbildung 4 berichteten wir eine schematische Darstellung des Auswahlverfahrens einer ORF gefilterte Phagen-Display-Bibliothek. Die Auswahl in diesem Beispiel erfolgt mithilfe von Antikörpern in den Seren von Patienten mit verschiedenen Pathologien (d.h. infektiöse Erkrankungen, Autoimmun-Erkrankungen, Krebs) vorhanden. In diesem Fall interagiert die Phagen-Bibliothek direkt mit den Antikörpern in Seren der Patienten und auf diese Weise wird die vermeintliche spezifische Antigene bereichert werden können, da sie durch Krankheit spezifischen Antikörper erkannt werden. In dieser Art von Experiment ist in der Regel die Bibliothek auch ausgewählt mit Kontrolle Seren von gesunden Patienten um ein Hintergrund-Signal für aufeinander folgende Vergleich und Normalisierung Verfahren verwendet werden.
Auswahl erfolgt über Seren von der gleichen Art von Patienten in der Regel in verschiedenen Pools gruppiert um interindividuelle Variabilität der Sera Antikörper-Titer zu reduzieren. Jeder Pool dient unabhängig für zwei bis drei aufeinander folgenden Runden Auswahl, bereichern die Bibliothek für immun-reaktive Klone, die spezifisch für die Pathologie untersucht. Test Set Antikörper sind mit Bibliothek Phagen inkubiert, immun-komplexe werden von Protein A beschichtet Magnetics-Perlen wiederhergestellt und gebundene Phagen sind durch Standardverfahren eluiert. Die Auswahl-Zyklen werden mit zunehmender waschen und Stringenz verbindlich durchgeführt.
Die Lesevorgänge von NGS erzeugt können das Interaktom-Seq-Web-Tool speziell entwickelt, um diese Art von Daten zu verwalten mit analysiert werden. Interaktom-Seq-Daten-Analyse-Workflow besteht aus vier aufeinander folgenden Schritten, die, ausgehend von rohen Sequenzierung liest die Liste der vermeintlichen Domänen mit genomischen Anmerkungen (Abb. 5A) erzeugt. Im ersten Schritt Eingabe (Abbildung 5A - rotes Kästchen) prüft Interaktom-Seq, ob die input-Dateien (raw gelesen, Referenz Genomsequenz Annotation Liste) korrekt formatiert sind. Im zweiten Schritt VORVERARBEITUNG (Abbildung 5A - orange Box), minderwertige Sequenzierungsdaten sind zunächst getrimmt mit Cutadapt28 abhängig von Qualitätskennzahlen und liest mit weniger als 100 Basen Länge werden verworfen. In einem weiteren Schritt lesen Ausrichtung (Abbildung 5A - grüner Kasten) sind die restlichen liest Blastn29 , die Genomsequenz ermöglicht bis zu 5 % von Konflikten ausgerichtet. Eine SAM-Datei wird erstellt und liest nur mit Qualitätsfaktor größer als 30 (Q > 30) werden verarbeitet mit SAMtools30 und in einer BAM-Datei umgewandelt. Nach dem ausrichten Interaktom-Seq führt die Domänen-Erkennung (Abbildung 5A - Blue-Box), Aufrufen von Bedtools31 Filtern liest Überlappung mindestens 80 % ihrer Länge in Abschriften; Abdeckung, max. Tiefe und Fokus-Werte werden dann für jeden ORF Teil abgedeckt durch die Zuordnung lautet berechnet. Die Abdeckung ist die Gesamtzahl der Lesevorgänge zu einem Gen zugeordnet; die Tiefe beträgt die maximale Anzahl der Lesevorgänge für eine spezifische genetische Teil; der Fokus ist ein Index, gewonnen aus dem Verhältnis zwischen max Tiefe und Abdeckung, und es kann im Bereich zwischen 0 und 1. Wenn der Fokus höher als 0,8 ist und die Abdeckung höher als die durchschnittliche Abdeckung für alle Regionen der Zuordnung in der BAM-Datei beobachtet ist, wird der CDS-Teil als eine vermeintliche Domäne/Epitop eingestuft. Der letzte Schritt der Interaktom-Seq-Pipeline ist die Ausgabe (Abbildung 5A - violetten Kasten), eine Liste von vermeintlichen Domains im Tabellenformat getrennt erzeugt wird. Die Interaktom-Seq-Pipeline wurde in ein Web-Tool, damit Benutzer ohne Programmierkenntnisse oder Bioinformatik Interaktom-Seq-Analyse über die grafische Benutzeroberfläche durchführen und ihre Ergebnisse in einem einfachen und benutzerfreundlichen Format aufgenommen. Wie in Abbildung 5 bgezeigt, werden die ausgegebenen Ergebnisse einer Analyse mit JBrowse32 , Visualisierung und Exploration ermöglichen angezeigt. Interaktom-Seq erzeugt Spuren im Genom Browser entsprechend vermeintliche Domänen erkannt und bietet auch klassische Venn-Diagramme um Kreuzungen zwischen gemeinsamen vermeintliche Domänen bereichert z.B. in verschiedenen Auswahlen Experimente zeigen.
Abbildung 1: Schematische Übersicht über die wichtigsten Schritte für den Bau der ORF-Filterung Bibliothek
(A) DNA aus anderen Quelle ist beschallt und fragmentiert in zufällige Fragmente von 150-750 bp Länge. Fragmente sind erholte sich von Gel und als Stumpf in der pFILTER-Vektor kloniert. (B) Filterung Schritt mit β-Lactamase als klappbare Reporter. Vektor, enthält nicht ORF Fragmente sind negativ ausgewählt auf Ampicillin beim ORF geklonten Fragmente können Kolonien wachsen; (C) Anwendung von einer zunehmenden Selektionsdruck (Ampicillin Konzentration in solides Wachstumsmedien von 0 bis > 100 μg/mL) ermöglicht die Auswahl der besser gefalteten Fragmente. Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 2: Schematische Übersicht über die wichtigsten Schritte für den Bau der Phagen-Bibliothek
(A) ORF-gefilterte Fragmente werden aus dem gefilterten Vektor verwenden bestimmte Restriktionsenzyme ausgeschnitten. Nach Wiederherstellung und Reinigung sind Fragmente in Phagemid Vektor kloniert und verwandelt; (B) Phagemid bakterielle Bibliothek mit Helfer Phagen infiziert ist und nach Übernachtung Wachstum Phagen sind PEG ausgefällt und gesammelt. Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 3: ORF Bibliotheken Sequenzierung
Sequenzierung erfolgt auf beiden ursprünglichen ORF ausgewählten Bibliothek sowie die Phagen-Display-Bibliothek; (1) auf beiden Fällen Kolonien gewachsen zurückgewonnen und DNA extrahiert; (2) DNA-Fragmente werden durch Amplifikation mit spezifischen Primer verbunden mit Adaptern für die Sequenzierung wiederhergestellt; 3-4) Fragmente sind erholt und tiefen sequenziert mit NGS; (5) Daten werden mithilfe der Interaktom-Seq-Pipeline analysiert. Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 4: Schematische Übersicht der Bibliothek Auswahl mit Patienten Antikörper
Phagen-Bibliothek ist für die Auswahl gegen Antikörper von Patienten Sera verwendet. Antikörper sind auf magnetischen Kügelchen immobilisiert, Phagen-Bibliothek-Erfassung/Selektion erfolgt, drei Zyklen der Waschgänge durchgeführt und danach ausgewählte Phagen wiedergewonnen und erneut infizieren zur E. Coli. Wieder infiziert E. Coli Zellen sind in selektiven Druck (Ampicillin 100 μg/mL) beschichtet. ORF-Fragmente werden durch Amplifikation wiederhergestellt und Amplifikate Pools sind dann von NGS sequenziert. Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 5: Schematische Übersicht über Bibliotheksanalyse
(A) die Darstellung des Daten-Analyse-Workflows, raw FASTQ-Dateien ab, bis die endgültige kommentierte Domänen-Listen; (B) schematische Darstellung der ein- und Ausgänge das Interaktom-Seq-Web-Tool. Bitte klicken Sie hier für eine größere Version dieser Figur.
Die Schaffung einer qualitativ hochwertige unterschiedlichsten ORFs gefilterte Bibliothek ist der erste wichtige Schritt in dem gesamten Verfahren, da sie die nachfolgenden Schritte der Pipeline beeinflussen.
Ein wichtiges Merkmal der Vorteil unserer Methode ist, dass jede Quelle (intronless) DNA (cDNA, genomische DNA, PCR abgeleitet oder synthetische DNA) geeignet für Bibliotheksbau. Der erste Parameter, der berücksichtigt werden sollte ist, dass die Länge der DNA-Fragmente in der pFILTER-Vektor kloniert sollte eine Darstellung der gesamten Sammlung der Domains ein Genom oder einer Transkriptom, die so genannte "Domainome". Wir haben gezeigt, dass Protein Domains können erfolgreich geklont werden, ausgewählt und schließlich identifiziert ausgehend von DNA-Fragmente mit einer Länge Verteilung überspannt von 150 bis 750 bp33,34, und dies ist im Einklang mit dem, was in gemeldet wird die Literatur zeigt, dass die meisten Protein-Domains 100 aa lang sind (mit einem Bereich von 50 bis 200 aa)15.
DNA Ausgangsmaterial muss in den Größenbereich von Wahl und später in den Filter (pFILTER)12 Vektor geklonten fragmentiert werden. Während dieser Schritte könnten potenzielle Verzerrung Maximierung der Effizienz aller das Klonen Reaktionen in das Protokoll, in bestimmten Fragment Ende-Reparatur und Phosphorylierung enthalten Schritte vermieden werden. Die Vektor-Vorbereitung ist anspruchsvoll und erfolgen unter optimalen Bedingungen als auch Plasmid Abbau und/oder Verschmutzung durch unverdaute Vektor zu vermeiden.
Nachdem die Bibliothek erstellt wurde, sollte es "gefiltert werden," um nur ORFs gefalteten Fragmente erhalten. Ein wichtiger Parameter zu modulieren, dieser Schritt ist die selektive Druck angewendet, die nach der Strenge der Filterung auf Wunsch geändert werden kann. Auswahl erfolgt mit Ampicillin: je höhere der Konzentration verwendet, desto geringere die Anzahl der transformierten Bakterien-Kolonien in der Lage zu überleben. Dies spiegelt die Fähigkeit der Filtermethode für gut-im Vergleich zu Armen-Ordner ORFs34wählen. Diese Reduktion in der Anzahl der Klone wird durch die Erhöhung der Eigenschaften des ausgewählten Fragmente Falten ausgeglichen. In der Regel sollte die Ampicillin-Konzentration ausreichen um auf etwa 1/20 die Anzahl der Bakterienkolonien im Hinblick auf diejenigen reduzieren, die wachsende Bibliothek auf Chloramphenicol nur erzielt werden konnten.
Bibliothek-Validierung erfolgt in der Regel durch PCR-Amplifikation von zufällig ausgewählten Kolonien und deren Sequenzierung. PCR-Amplifikation von einigen Kolonien wird vorgeschlagen, um eine schnelle Einschätzung der Qualität der Bibliothek zu haben: die Länge der Einsätze sollte im erwarteten Bereich von 150-750 bp und verschiedenen Kolonien sollte vorhanden Einsätze mit verschiedenen Größe anzeigt gut Bibliothek-Vorbereitung in Bezug auf die Variabilität. Diese herkömmliche Strategie des Screenings, als die einzige Methode für die Bibliothek Validierung aufgetragen ist nicht vollständig und ist zeitaufwendig, erlaubt die Analyse nur eine begrenzte Anzahl von Kolonien und mit hoher Wahrscheinlichkeit die meisten wichtigen Klone zu verpassen. Unser Ansatz basiert auf Tiefe Sequenzierung der Bibliothek, dies bietet umfassende Informationen über die Bibliothek Vielfalt und Fülle und genaue Kartierung der jedes der ausgewählten Fragmente.
Die Umsetzung der NGS-Technologie mit der Filterung Ansatz erhöht die Tiefe der Analyse um mehrere Größenordnungen. Wir haben vor kurzem das Protokoll für die Sequenzierung der ORF-Bibliotheken mithilfe der Illumina-Plattform optimiert und entwickelt eine bestimmte Web-Tool für die Datenanalyse, die die Analyse dieser Art von Daten für jeden Nutzer ohne irgendwelche Programmierkenntnisse Bioinformatik macht.
Die Bibliothek "per se" ist ein "universelles Instrument" und kann in unterschiedlichen Kontexten für Protein-Expression und/oder Auswahl genutzt werden. Unsere methodische Ansatz basiert auf den produzierten ORFeome in einem Phagen-Display-Kontext übertragen. PROTEINFRAGMENTE werden auf der Oberfläche von Phagen ausgedrückt und wurde für nachfolgende Auswahl geeignet.
Dies erfolgt durch Rettung der gefilterten ORFs aus der pFILTER-Bibliothek durch Verdauung mit speziellen Restriktionsenzymen und Klonen sie erneut in einen kompatiblen Phagemid Vektor so dass ihre Verschmelzung mit der Phagen Protein g3p.
Nachdem die Phagemid-ORF-Bibliothek erstellt wurde, kann es für die Auswahl gegen verschiedene Ziele, z. B. eine vermeintliche Bindung Protein10 oder gereinigte Antikörper35,36 wie hier beschrieben verwendet werden. Da Phagen Partikel angezeigt werden, auf ihrer Oberfläche, das gefilterte ORFs, daraus resultiert eine wesentlich effektiver Auswahlverfahren aufgrund der Abwesenheit nicht anzeigen-Klone in der Regel überholen sie.
Nach der Auswahl der Phage Display ORF Bibliothek können mit der gleichen Rohrleitung die Ausgabe Klone sequenziert und analysiert werden. NGS bieten eine komplette und statistisch signifikante Ranking der am meisten häufig ausgewählt ORFs und dies erlaubt die Identifikation von Proteinen, die meist Interaktion mit dem Köder verwendet. Angesichts der Präsenz von vielen verschiedenen Versionen der jeweiligen Domäne unterscheiden sich durch einige Aminosäuren, identifiziert die Überschneidungen zwischen verschiedenen sequenzierten Klonen auch die minimale Fragment/Domäne zeigt Bindungseigenschaften. Schließlich durch die Kopplung von Genotyp und Phänotyp Informationen in die Phagen-Bibliothek, kann sobald die Domains Wahl identifiziert wurden, die DNA-Sequenz leicht aus der Bibliothek für weitere Studien, in-Vitro und in Vivo gerettet werden Validierung und Charakterisierung.
Die Autoren haben nichts preisgeben.
Diese Arbeit wurde unterstützt durch einen Zuschuss aus dem italienischen Ministerium für Bildung und Universität (2010P3S8BR_002, CP).
Name | Company | Catalog Number | Comments |
Sonopuls ultrasonic homogenizer | Bandelin | HD2070 | or equivalent |
GeneRuler 100 bp Plus DNA Ladder | Thermo Scientific | SM0321 | or equivalent |
GeneRuler 1 kb DNA Ladder | Thermo Fisher Scientific | SM0311 | or equivalent |
Molecular Biology Agarose | BioRad | 161-3102 | or equivalent |
Green Gel Plus | Fisher Molecular Biology | FS-GEL01 | or equivalent |
6x DNA Loading Dye | Thermo Fisher Scientific | R0611 | or equivalent |
QIAquick Gel Extraction Kit | Qiagen | 28704 | or equivalent |
Quick Blunting Kit | New England Biolabs | E1201S | |
NanoDrop 2000 UV-Vis Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
High-Capacity cDNA Reverse Transcription Kit | Thermo Fisher Scientific | 4368813 | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | or equivalent |
QIAquick PCR purification Kit | Qiagen | 28104 | or equivalent |
EcoRV | New England Biolabs | R0195L | |
Antarctic Phosphatase | New England Biolabs | M0289S | |
T4 DNA Ligase | New England Biolabs | M0202T | |
Sodium Acetate 3M pH5.2 | general lab supplier | ||
Ethanol for molecular biology | Sigma-Aldrich | E7023 | or equivalent |
DH5aF' bacteria cells | Thermo Fisher Scientific | ||
0,2 ml tubes | general lab supplier | ||
1,5 ml tubes | general lab supplier | ||
0,1 cm electroporation cuvettes | Biosigma | 4905020 | |
Electroporator 2510 | Eppendorf | ||
2x YT medium | Sigma-Aldrich | Y1003 | |
Ampicillin sodium salt | Sigma-Aldrich | A9518 | |
Chloramphenicol | Sigma-Aldrich | C0378 | |
DreamTaq DNA Polymerase | Thermo Fisher Scientific | EP0702 | |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447S | |
96-well thermal cycler (with heated lid) | general lab supplier | ||
150 mm plates | general lab supplier | ||
100 mm plates | general lab supplier | ||
Glycerol | Sigma-Aldrich | G5516 | |
BssHII | New England Biolabs | R0199L | |
NheI | New England Biolabs | R0131L | |
QIAprep Spin Miniprep Kit | Qiagen | 27104 | or equivalent |
M13KO7 Helper Phage | GE Healthcare Life Sciences | 27-1524-01 | |
Kanamycin sulfate from Streptomyces kanamyceticus | Sigma-Aldrich | K1377 | |
Polyethylene glycol (PEG) | Sigma-Aldrich | P5413 | |
Sodium Cloride (NaCl) | Sigma-Aldrich | S3014 | |
PBS | general lab supplier | ||
Dynabeads Protein G for Immunoprecipitation | Thermo Fisher Scientific | 10003D | or equivalent |
MagnaRack Magnetic Separation Rack | Thermo Fisher Scientific | CS15000 | or equivalent |
Tween 20 | Sigma-Aldrich | P1379 | |
Nonfat dried milk powder | EuroClone | EMR180500 | |
KAPA HiFi HotStart ReadyMix | Kapa Biosystems, Fisher Scientific | 7958935001 | |
AMPure XP beads | Agencourt, Beckman Coulter | A63881 | |
Nextera XT dual Index Primers | Illumina | FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004 | |
MiSeq or Hiseq2500 | Illumina | ||
Spectrophotomer | Nanodrop | ||
Agilent Bioanalyzer or TapeStation | Agilent | ||
Forward PCR primer | general lab supplier | 5’ TACCTATTGCCTACGGCA GCCGCTGGATTGTTATTACTC 3’ | |
Reverse PCR primer | general lab supplier | 5’ TGGTGATGGTGAGTACTA TCCAGGCCCAGCAGTGGGTTTG 3’ | |
Forward primer for NGS | general lab supplier | 5’ TCGTCGGCAGCGTCAGA TGTGTATAAGAGACAGGCA GCAAGCGGCGCGCATGC 3’; | |
Reverse primer for NGS | general lab supplier | 5’ GTCTCGTGGGCTCGGAGA TGTGTATAAGAGACAGGGG ATTGGTTTGCCGCTAGC 3’; |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten