PatentDe  


Dokumentenidentifikation DE69731285T2 09.03.2006
EP-Veröffentlichungsnummer 0000886644
Titel LANGWELLIG FLUOREZIERENDE PROTEINE
Anmelder The Regents of the University of California, Oakland, Calif., US;
Invitrogen Corp., Carlsbad, Calif., US;
The State of Oregon acting by and through The State Board of Higher Education on behalf of the University of Oregon, Eugene, Oreg., US
Erfinder TSIEN, Y., Roger, La Jolla, US;
CUBITT, B., Andrew, San Diego, US;
HEIM, Roger, Del Mar, US;
ORMO, F., Mats, S-141 73 Huddinge, SE;
REMINGTON, S., James, Eugene, US
Vertreter Dr. Volker Vossius, Corinna Vossius, Tilman Vossius, Dr. Martin Grund, Dr. Georg Schnappauf, 81679 München
DE-Aktenzeichen 69731285
Vertragsstaaten AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE, IT, LI, LU, MC, NL, PT, SE
Sprache des Dokument EN
EP-Anmeldetag 15.08.1997
EP-Aktenzeichen 979413507
WO-Anmeldetag 15.08.1997
PCT-Aktenzeichen PCT/US97/14593
WO-Veröffentlichungsnummer 0098006737
WO-Veröffentlichungsdatum 19.02.1998
EP-Offenlegungsdatum 30.12.1998
EP date of grant 20.10.2004
Veröffentlichungstag im Patentblatt 09.03.2006
IPC-Hauptklasse C07H 21/04(2006.01)A, F, I, ,  ,  ,   
IPC-Nebenklasse C07K 14/00(2006.01)A, L, I, ,  ,  ,      C07K 16/00(2006.01)A, L, I, ,  ,  ,      C12N 1/20(2006.01)A, L, I, ,  ,  ,      C12N 15/00(2006.01)A, L, I, ,  ,  ,      C12N 15/09(2006.01)A, L, I, ,  ,  ,      C12N 15/63(2006.01)A, L, I, ,  ,  ,      

Beschreibung[de]
HINTERGRUND DER ERFINDUNG

Diese Anmeldung beansprucht den Vorteil des frühren Anmeldedatums einer vorläufigen US-Patentanmeldung mit der Seriennummer 60/024,050, eingereicht am 16. August 1996, mit dem Titel "Long Wavelength Mutant Fluorescent Proteins" und dem US-Patent Nr. 6,124,128, eingereicht am 30. August 1996, mit dem Titel "Long Wavelength Engineered Fluorescent Proteins", wobei beide hier durch Bezugnahme eingeschlossen sind.

Diese Erfindung wurde zum Teil mit Regierungsunterstützung unter der Förderungsnummer MCB 9418479, erlassen durch die National Science Foundation, bewerkstelligt. Die Regierung darf die Rechte an dieser Erfindung haben.

Fluoreszierende Moleküle sind als Reportermoleküle in vielen Assay-Systemen aufgrund ihrer hohen Sensitivität und der einfachen Quantifizierung bevorzugt. Kürzlich waren fluoreszierende Proteine im Mittelpunkt des Interesses, da sie in vivo durch biologische Systeme hergestellt werden können und weil sie verwendet werden können, um intrazelluläre Ereignisse zu verfolgen, ohne dass man sie in die Zelle über Mikroinjektion oder Permeabilisierung einzuführen braucht. Das grün fluoreszierende Protein von Aequorea victoria ist als ein fluoreszierendes Protein von besonderem Interesse. Es wurde eine cDNA für das Protein kloniert (D. C. Prasher et al., "Primary structure of the Aequorea victoria greenfluorescent protein, Gene (1992), 111: 229–33). Es kann nicht nur die primäre Aminosäuresequenz des Proteins von der cDNA exprimiert werden, sondern das exprimierte Protein kann auch fluoreszieren. Dies zeigt, dass das Protein die Zyklisierung und Oxidation, von denen angenommen wird, dass sie für die Fluoreszenz notwendig sind, durchmacht. Das grün fluoreszierende Protein von Aequorea victoria ("GFP") ist eine stabile, Oroteolyse-resistente Einzelkette aus 238 Resten und hat zwei Absorptionsmaxima bei etwa 395 und 475 nm. Die relativen Amplituden dieser beiden Spitzen ist gegenüber Umweltfaktoren (W. W. Ward, Bioluminescence and Chemiluminescence (M. A. DeLuca und W. D. McElroy, Hrsg.), Academic Press, Seiten 235–242 (1981); W. W. Ward & S. H. Bokman, Biochemistry 21: 4535–4540 (1982); W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982)) und der Belichtungsfolge (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995)) sensitiv, was vermutlich zwei oder mehrere Grundstadien erkennen läßt. Eine Anregung bei der primären Absorptionsspitze von 395 nm ergibt ein Emissionsmaximum bei 508 nm mit einer Quantenausbeute von 0,72–0,85 (O. Shimomura und F. H. Johnson, J. Cell. Comp. Physiol. 59: 223 (1962); J. G. Morin und J. W. Hastings, J. Cell. Physiol. 77: 313 (1971); H. Morise et al., Biochemistry 13: 2656 (1974); W. W. Ward, Photochem. Photobiol. Reviews (Smith, K. C., Hrsg.) 4: 1 (1979); A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995); D. C. Prasher, Trends Genet. 11: 320–323 (1995); M. Chalfie, Photochem. Photobiol. 62: 651–656 (1995); W. W. Ward, Bioluminescence and Chemiluminescence (M. A. DeLuca und W. D. McElroy, Hrsg.), Academic Press, Seiten 235–242 (1981); W. W. Ward & S. H. Bokman, Biochemistry 21-4535-4540 (1982); W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982)). Die Fluorophore ist auf die autokatalytische Zyklisierung des Polypeptid-Rückgrats zwischen den Resten Ser65 und Gly67 und der Oxidation der &agr;-&bgr;-Bindung von Tyr66 zurückzuführen (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995); C. W. Cody et al., Biochemistry 32: 1212–1218 (1993); R. Heim et al., Proc. Natl. Acad. Sci. USA 91: 12501–12504 (1994)). Eine Mutation von Ser65 zu Thr (S65T) vereinfacht das Anregungsspektrum zu einer einzelnen Spitze bei 488 nm der verstärkten Amplitude (R. Heim et al., Nature 373: 664–665 (1995)), die nicht länger Anzeichen von Konformations-Isomeren aufweist (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995)).

Fluoreszierende Proteine wurden als Marker der Genexpression, als Tracer einer Zelllinie und als Fusions-Tags verwendet, um eine Protein-Lokalisierung innerhalb von lebenden Zellen vorzunehmen (M. Chalfie et al., "Green fluorescent protein as marker for gene expression", Science 263: 802–805; A. B. Cubitt et al., "Understanding, improving and using green fluorescent proteins", TIBS 20, November 1995, Seiten 448–455; US-Patent Nr. 5,491,084, M. Chalfie und D. Prasher). Weiterhin wurden modifizierte Versionen des grün fluoreszierenden Proteins von Aequorea gefunden, die veränderte Fluoreszenz-Charakteristiken aufweisen, einschließlich geänderter Anregungs- und Emissionsmaxima und Anregungs- und Emissionsspektren unterschiedlicher Formen (R. Heim et al., "Wavelength mutations and posttranslational autoxidation of green fluorescent protein", Proc. Natl. Acad. Sci. USA (1994), 91: 12501–04; R. Heim et al., "Improved green fluorescence", Nature (1995), 373: 663–665). Diese Eigenschaften fügen eine weitere Vielzahl und Anwendungsbereiche zu der Gruppe biologisch basierender fluoreszierender Indikatoren hinzu.

Es besteht ein Bedarf an modifizierten fluoreszierenden Proteinen mit verschiedenen fluoreszierenden Eigenschaften.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

1A1B. (A) Schematische Zeichnung des Rückgrats von GFP, erzeugt von Molscript (J. P. Kraulis, J. Appl. Cryst. 24: 946 (1991)). Das Chromophor ist als ein Kugel- und Stäbchenmodell gezeigt. (B) Schematische Zeichnung der Gesamtfaltung von GFP. Die ungefähre Restezahlen markieren den Anfang und das Ende der Elemente der Sekundärstruktur.

2A2C. (A) Stereodarstellung der Chromophore und der Reste in unmittelbarer Nachbarschaft. Kohlenstoffatome sind als offene Kreise dargestellt, Sauerstoff ist ausgefüllt und Stickstoff ist schattiert. Lösliche Moleküle sind als einzelne gefüllte Kreise gezeigt. (B) Teil der endgültigen 2F0-Fc-Elektronendichte-Karte, gezeichnet bei 1,0 Å, die die Elektronendichte zeigt, welche die Chromophore umgibt. (C) Schematisches Diagramm, das die ersten und zweiten Koordinationssphären der Chromophore zeigt. Wasserstoffbindungen sind als unterbrochene Linien gezeigt und besitzen die angegebenen Längen in A. Innenteil: vorgeschlagene Struktur des Carbinolamin-Zwischenprodukts, das vermutlich während der Herstellung der Chromophore gebildet wird.

3 zeigt die Nukleotidsequenz (SEQ ID NO: 1) und die abgeleitete Aminosäuresequenz (SEQ ID NO: 2) eines grün fluoreszierenden Proteins von Aequorea.

4 zeigt die Nukleotidsequenz (SEQ ID NO: 3) und die abgeleitete Aminosäuresequenz (SEQ ID NO: 4) des modifizierten, mit Aequorea verwandten fluoreszierenden Proteins S65G/S72A/T203Y, das bevorzugt Säugetier-Kodons und eine optimale Kozak-Sequenz beinhaltet.

5-1 bis 5-28 geben die Koordinaten der Kristallstruktur des mit Aequorea verwandten grün fluoreszierenden Proteins S65T wieder.

6 zeigt die Fluoreszenz-Anregungs- und -Emissionsspektren für die modifizierten fluoreszierenden Proteine 20A und 10C (Tabelle F). Die senkrechte Linie bei 528 nm vergleicht die Emissionsmaxima von 10C, links von der Linie, und von 20A, rechts von der Linie.

ZUSAMMENFASSUNG DER ERFINDUNG

Die Erfindung stellt funktionelle modifizierte fluoreszierende Proteine mit verschiedenen Fluoreszenzeigenschaften bereit, die leicht von gegenwärtig bestehenden grün und blau fluoreszierenden Proteinen unterschieden werden können. Solche modifizierten fluoreszierenden Proteine ermöglichen die gleichzeitige Messung von zwei oder mehreren Prozessen innerhalb von Zellen und können als Fluoreszenz-Energiespender oder -Akzeptoren verwendet werden, wenn sie zur Überwachung von Protein-Protein-Interaktionen über FRET eingesetzt werden. Modifizierte fluoreszierende Proteine mit längerer Wellenlänge sind besonders verwendbar, da die photodynamische Toxizität und Auto-Fluoreszenz von Zellen bei längeren Wellenlängen signifikant vermindert sind. Insbesondere bewirkt die Einführung der Substitution T203X, wobei X eine aromatische Aminosäure ist, einen Anstieg bei den Anregungs- und Emissionswellenlängenmaxima bei den mit Aequorea verwandten fluoreszierenden Proteinen.

In einem Aspekt stellt die Erfindung ein Nukleinsäuremolekül bereit, das eine Nukleotidsequenz umfasst, die für ein funktionelles modifiziertes fluoreszierendes Protein kodiert, dessen Aminosäuresequenz eine Identität von mindestens 80% mit der Aminosäuresequenz des grün fluoreszierenden Proteins von Aequorea (SEQ ID NO: 2) aufweist und das sich von SEQ ID NO: 2 durch mindestens eine Substitution bei T203, und insbesondere T203X unterscheidet, worin X eine aromatische Aminsäure ist, ausgewählt aus H, Y, W oder F, wobei das funktionelle modifizierte fluoreszierende Protein eine andere fluoreszierende Eigenschaft als das grün fluoreszierende Protein von Aequorea aufweist. In einer Ausführungsform umfasst die Aminosäuresequenz weiter eine Substitution bei S65, wobei die Substitution ausgewählt ist aus S65G, S65T, S65A, S65L und S65C. In einer weiteren Ausführungsform unterscheidet sich die Aminosäuresequenz durch nicht mehr als die Substitutionen S65T/T203H; S65T/T203Y; S72A/F64L/S65G/T203Y; S65G/V68L/Q69K/S72A/T203Y; S72A/S65G/V68L/T203Y; S65G/S72A/T203Y oder S65G/S72A/T203W. In einer anderen Ausführungsform unterscheidet sich die Nukleotidsequenz, die für das Protein kodiert, von der Nukleotidsequenz von SEQ ID NO: 1 durch die Substitution von mindestens einem Kodon durch ein bevorzugtes Säugetier-Kodon. In einer anderen Ausführungsform kodiert das Nukleinsäuremolekül für ein Fusionsprotein, wobei das Fusionsprotein ein Polypeptid von Interesse und das funktionelle modifizierte fluoreszierende Protein umfasst.

In einem weiteren Aspekt stellt die Erfindung einen Expressionsvektor bereit, der Expressions-Kontrollsequenzen umfasst, die operativ an ein beliebiges der zuvor genannten Nukleinsäuremolelüle verbunden sind. In einem weiteren Aspekt stellt die Erfindung eine rekombinante Wirtszelle bereit, die den zuvor genannten Expressionsvektor umfasst.

In einem weiteren Aspekt stellt die Erfindung ein funktionelles modifiziertes fluoreszierendes Protein bereit, dessen Aminosäuresequenz im Wesentlichen identisch mit der Aminosäuresequenz des fluoreszierenden Proteins von Aequorea (SEQ ID NO: 2) ist und das sich von SEQ ID NO: 2 zumindest durch die Aminosäure-Substitution bei T203 und insbesondere T203X unterscheidet, worin X eine aromatische Aminosäure ist, ausgewählt aus H, Y, W oder F, wobei das funktionelle modifizierte fluoreszierende Protein eine andere fluoreszierende Eigenschaft als das grün fluoreszierende Protein von Aequorea aufweist. In einer Ausführungsform umfasst die Aminosäuresequenz weiter eine Substitution bei S65, wobei die Substitution ausgewählt ist aus S65G, S65T, S65A, S65L und S65C. In einer anderen Ausführungsform unterscheidet sich die Aminosäuresequenz durch nicht mehr als die Substitutionen S65T/T203H; S65T/T203Y; S72A/F64L/S65G/T203Y; S72A/S65G/V68L/T203Y; S65G/V68L/Q69K/S72A/T203Y; S65G/S72A/T203Y oder S65G/S72A/T203W. In einer anderen Ausführungsform ist das modifizierte fluoreszierende Protein Teil eines Fusionsproteins, wobei das Fusionsprotein ein Polypeptid von Interesse und das funktionelle modifizierte fluoreszierende Protein umfasst.

In einem anderen Aspekt stellt die Erfindung einen mit Fluoreszenz markierten Antikörper bereit, der einen Antikörper umfasst, der an ein beliebiges der zuvor genannten funktionellen modifizierten fluoreszierenden Proteine gekoppelt ist. In einer Ausführungsform ist der fluoreszenzmarkierte Antikörper ein Fusionsprotein, wobei das Fusionsprotein den Antikörper umfasst, der mit dem funktionellen modifizierten fluoreszierenden Protein fusioniert ist.

In einem anderen Aspekt stellt die Erfindung ein Nukleinsäuremolekül bereit, das eine Nukleotidsequenz umfasst, die für einen Antikörper kodiert, die an eine Nukleotidsequenz fusioniert ist, die für ein erfindungsgemäßes funktionelles modifiziertes fluoreszierendes Protein kodiert.

Bevorzugt kann eine fluoreszenzmarkierte Nukleinsäure-Sonde, die eine Nukleinsäure-Sonde umfasst, an ein funktionelles modifiziertes fluoreszierendes Protein mit einer erfindungsgemäßen Aminosäuresequenz gekoppelt werden. Die Fusion kann über ein Linker-Peptid erfolgen.

Weiter kann die Erfindung verwendet werden für ein Verfahren zum Bestimmen, ob ein Gemisch ein Ziel enthält, umfassend das In-Kontakt-Bringen des Gemisches mit einer mit Fluoreszenz markierten Sonde, die eine Sonde und ein erfindungsgemäßes funktionelles modifiziertes fluoreszierendes Protein umfasst; und das Bestimmen, ob das Ziel an die Sonde gebunden hat. In einer Ausführungsform ist das Zielmolekül an einer festen Matrix gebunden.

Zusätzlich kann die Erfindung verwendet werden für ein Verfahren zum Modifizieren eines funktionellen modifizierten fluoreszierenden Proteins mit einer fluoreszierenden Eigenschaft, die anders ist, als die des grün fluoreszierenden Proteins von Aequorea, umfassend das Substituieren einer Aminosäure, die nicht mehr als 0,5 nm von einem Atom in der Chromophore eines mit Aequorea verwandten grün fluoreszierenden Proteins entfernt ist, mit einer anderen Aminosäure, wobei die Substitution eine fluoreszierende Eigenschaft des Proteins verändert. Die Aminosäure-Substitution kann die Elektronen-Umgebung der Chromophore verändern.

Darüber hinaus kann die Erfindung verwendet werden für ein Verfahren zum Modifizieren eines funktionellen modifizierten fluoreszierenden Proteins mit einer anderen fluoreszierenden Eigenschaft als die des grün fluoreszierenden Proteins von Aequorea, umfassend das Substituieren von Aminosäuren in einer Loop-Domäne eines mit Aequorea verwandten grün fluoreszierenden Proteins mit Aminosäuren, so dass eine Konsensus-Sequenz zur Phosphorylierung oder zur Proteolyse erzeugt wird.

Weiter kann die Erfindung verwendet werden für ein Verfahren zum Erzeugen von Fluoreszenz-Resonanz-Energie-Transfer, umfassend die Bereitstellung eines Spender-Moleküls, das ein erfindungsgemäßes funktionelles modifiziertes fluoreszierendes Protein umfasst; das Bereitstellen eines geeigneten Akzeptor-Moleküls für das fluoreszierende Protein und das Zusammenbringen des Spender-Moleküls und des Akzeptor-Moleküls in ausreichend nahem Kontakt, um einen Fluoreszenz-Resonanz-Energie-Transfer zu ermöglichen.

Zusätzlich kann die Erfindung verwendet werden für ein Verfahren zum Erzeugen von Fluoreszenz-Resonanz-Energie-Transfer, umfassend die Bereitstellung eines Akzeptor-Moleküls, das ein erfindungsgemäßes funktionelles modifiziertes fluoreszierendes Protein umfasst; das Bereitstellen eines geeigneten Spender-Moleküls für das fluoreszierende Protein und das Zusammenbringen des Spender-Moleküls und des Akzeptor-Moleküls in ausreichend nahem Kontakt, um einen Fluoreszenz-Resonanz-Energie-Transfer zu ermöglichen. Das Spender-Molekül kann ein modifiziertes fluoreszierendes Protein sein, dessen Aminosäuresequenz die Substitution T203I umfasst, und das Akzeptor-Molekül ist ein modifiziertes fluoreszierendes Protein, dessen Aminosäuresequenz die Substitution T203X umfasst, worin X eine aromatische Aminosäure ist, ausgewählt aus H, Y, W oder F, wobei das funktionelle modifizierte fluoreszierende Protein eine andere fluoreszierende Eigenschaft als das grün fluoreszierende Protein von Aequorea aufweist.

Ein Kristall eines Proteins, das ein fluoreszierendes Protein mit einer Aminosäuresequenz umfasst, die im Wesentlichen identisch mit SEQ ID NO: 2 ist, defraktiert mit einer Auflösung von mindestens 2,0 bis 3,0 Å.

Computerverfahren können verwendet werden, um ein fluoreszierendes Protein über ein dreidimensionales Modell eines kristallisierten fluoreszierenden Proteins, das ein fluoreszierendes Protein mit einem gebundenen Liganden umfasst, zu entwerfen, wobei das Verfahren das Bestimmen von mindestens einer interagierenden Aminosäure des fluoreszierenden Proteins, das mit mindestens einem ersten chemischen Rest des Liganden interagiert, und Auswählen von mindestens einer chemischen Modifikation des ersten chemischen Rests, um einen zweiten chemischen Rest zu erzeugen, mit einer Struktur, die entweder eine Interaktion zwischen der interagierenden Aminosäure und dem zweiten chemischen Rest im Vergleich zu der Interaktion zwischen der interagierenden Aminosäure und dem ersten chemischen Rest erniedrigt oder erhöht, umfasst.

Weiter kann ein Computerverfahren verwendet werden zum Modellieren der dreidimensionalen Struktur eines fluoreszierenden Proteins, wobei das Verfahren das Bestimmen einer dreidimensionalen Beziehung zwischen mindestens zwei Atomen, die in den Atomkoordinaten der 5-1 bis 5-28 genannt sind, umfasst.

Die Kristalldaten können in einer Vorrichtung gespeichert werden, die eine Speichervorrichtung und mindestens 10 in der Vorrichtung gespeicherte Atomkoordinaten, ausgewählt aus den Atomkoordinaten, die in den 5-1 bis 5-28 genannt sind, umfasst. Die Speichervorrichtung kann eine computerlesbare Vorrichtung sein, die den Code speichert, der als Input die Atomkoordinaten erhält. Weiter kann die computerlesbare Vorrichtung eine Diskette oder eine Festplatte sein.

GENAUE BESCHREIBUNG DER ERFINDUNG I. DEFINITIONEN

Soweit nicht anders definiert, haben alle hier verwendeten technischen und wissenschaftlichen Begriffe dieselbe Bedeutung, wie sie üblicherweise von dem Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, verstanden wird. Obwohl beliebige Verfahren und Materialien, die den hier beschriebenen ähnlich oder äquivalent sind, zur Durchführung oder Testen der vorliegenden Erfindung verwendet werden können, werden bevorzugte Verfahren und Materialien beschrieben. Für den Zweck der vorliegenden Erfindung sind die folgenden Ausdrücke wie folgt definiert.

"Bindungspaar" bezeichnet zwei Reste (z. B. chemische oder biochemische), die eine Affinität zueinander besitzen. Beispiele von Bindungspaaren umfassen Antigen/Antikörper, Lectin/Avidin, Ziel-Polynukleotid/Sonden-Oligonukleotid, Antikörper/anti-Antikörper, Rezeptor/Ligand, Enzym/Ligand und dergleichen. "Ein Mitglied eines Bindungspaars" bezeichnet einen Rest des Paars wie ein Antigen oder Ligand.

"Nukleinsäure" bezeichnet ein Desoxyribonukleotid- oder Ribonukleotid-Polymer, entweder in einzelsträngiger oder doppelsträngiger Form, und umfasst, soweit nicht anders beschränkt, bekannte Analoga von natürlichen Nukleotiden, die in ähnlicher Weise wie natürlich vorkommende Nukleotide funktionieren können. Es wird verstanden werden, dass, wenn ein Nukleinsäuremolekül durch eine DNA-Sequenz wiedergegeben wird, dies auch RNA-Moleküle mit der korrespondierenden RNA-Sequenz, in der "U" durch "T" ersetzt ist, einschließt.

"Rekombinantes Nukleinsäuremolekül" bezeichnet ein Nukleinsäuremolekül, das nicht natürlich vorkommt und das zwei Nukleotidsequenzen umfasst, die nicht in natürlicher Weise miteinander verbunden sind. Rekombinante Nukleinsäuremoleküle werden durch eine artifizielle Rekombination hergestellt, z. B. durch genetische Modifikationstechniken oder chemische Synthese.

Der Bezug auf eine Nukleotidsequenz, die für ein Polypeptid "kodiert", bedeutet, dass die Sequenz nach der Transkription und Translation von mRNA das Polypeptid erzeugt. Dies umfasst sowohl den kodierenden Strang, dessen Nukleotidsequenz identisch mit der mRNA ist und dessen Sequenz gewöhnlich im Sequenzprotokoll wiedergegeben ist als auch dessen Komplementärstrang, der als Matrize für die Transkription verwendet wird. Wie für jeden Fachmann ersichtlich, schließt dies auch alle degenerierten Nukleotidsequenzen, die für dieselbe Aminosäuresequenz kodieren, ein. Nukleotidsequenzen, die für ein Polypeptid kodieren, schließen Sequenzen ein, die Introns enthalten.

"Expressions-Kontrollsequenzen" bezeichnen Nukleotidsequenzen, die die Expression einer Nukleotidsequenz, an die sie operativ gebunden sind, regulieren. Expressions-Kontrollsequenzen sind an eine Nukleotidsequenz "operativ gebunden", wenn die Expressions-Kontrollsequenzen die Transkription und, soweit notwendig, die Translation der Nukleotidsequenz kontrollieren und regulieren. Daher können Expressions-Kontrollsequenzen geeignete Promotoren, Enhancer, Transkriptionsterminatoren, ein Start-Kodon (d. h. ATG) vor einem Proteinkodierenden Gen, Splicing-Signale für Introns, die Aufrechterhaltung des richtigen Leserasters dieses Gens, um eine saubere Translation der mRNA zu ermöglichen, und Stopp-Kodons einschließen.

"Natürlich vorkommend", wie hier verwendet, und wie es auf ein Objekt bezogen wird, bezeichnet die Tatsache, dass ein Objekt in der Natur anzutreffen ist. Zum Beispiel ist ein Polypeptid oder eine Polynukleotidsequenz, die in einem Organismus (einschließlich Viren) vorliegt, der aus einer Quelle in der Natur isoliert werden kann und der nicht durch den Menschen im Labor absichtlich modifiziert worden ist, natürlich vorkommend.

"Operabel verbunden" bezieht sich auf eine Nebeneinanderstellung, wobei die vorher beschriebenen Bestandteile in einer Beziehung zueinander stehen, die es ihnen erlaubt, in ihrer beabsichtigten Weise zu funktionieren. Eine Kontrollsequenz, die an eine kodierende Sequenz "operabel gebunden" ist, wird auf solch eine Weise ligiert, dass die Expression der kodierenden Sequenz unter Bedingungen, die mit den Kontrollsequenzen kompatibel sind, erreicht wird, beispielsweise wenn die notwendigen Moleküle (z. B. Inducer und Polymerasen) an die Kontroll- oder Regulationssequenz(en) gebunden sind.

"Kontrollsequenz" bezeichnet Polynukleotidsequenzen, die notwendig sind, um die Expression der kodierenden und nicht-kodierenden Sequenzen, an die sie ligiert sind, zu bewirken. Die Art solcher Kontrollsequenzen unterscheidet sich in Abhängigkeit von dem Wirtsorganismus; in Prokaryonten schließen solche Kontrollsequenzen im Allgemeinen einen Promotor, eine ribosomale Bindungsstelle und eine Transkriptions-Terminationssequenz ein; in Eukaryonten schließen solche Kontrollsequenzen im Allgemeinen Promotoren und eine Transkriptions-Terminationssequenz ein. Der Ausdruck "Kontrollsequenzen" soll zumindest solche Bestandteile einschließen, deren Gegenwart die Expression beeinflussen kann und kann auch zusätzliche Bestandteile einschließen, deren Vorkommen vorteilhaft ist, z. B. Leitsequenzen und Fusionspartner-Sequenzen.

"Isoliertes Polynukleotid" bezeichnet ein Polynukleotid von genomischem, cDNA- oder synthetischem Ursprung oder eine Kombination davon, wobei aufgrund dessen Ursprungs das "isolierte Polynukleotid" (1) nicht mit der Zelle, in der das "isolierte Polynukleotid" in der Natur angetroffen wird, assoziiert ist oder (2) mit einem Polynukleotid operabel verbunden ist, mit dem es nicht in der Natur verbunden ist.

"Polynukleotid" bezeichnet eine polymere Form von Nukleotiden mit einer Länge von mindestens 10 Basen, entweder Ribonukleotide oder Desoxynukleotide oder eine modifizierte Form eines Nukleotid-Typs davon. Der Ausdruck schließt einzelsträngige und doppelsträngige Formen von DNA ein.

Der Ausdruck "Sonde" bezeichnet eine Substanz, die spezifisch an eine andere Substanz (ein "Ziel") bindet. Sonden umfassen z. B. Antikörper, Nukleinsäuren, Rezeptoren und ihre Liganden.

"Modulation" bezeichnet die Fähigkeit, entweder eine funktionelle Eigenschaft einer biologischen Aktivität oder Prozesses zu verstärken oder zu inhibieren (z. B. Enzym-Aktivität oder Rezeptor-Bindung); eine solche Verstärkung oder Inhibition kann von dem Vorkommen eines spezifischen Ereignisses abhängig sein, wie die Aktivierung eines Signal-Transduktionsweges und/oder kann sich nur in bestimmten Zelltypen manifestieren.

Der Ausdruck "Modulator" bezeichnet eine Chemikalie (natürlich vorkommend oder nicht natürlich vorkommend), wie ein synthetisches Molekül (z. B. Nukleinsäure, Protein, Nicht-Peptid oder organisches Molekül) oder einen Extrakt, der aus biologischen Stoffen hergestellt wurde, wie Bakterien, Pflanzen, Pilze oder Tier-(insbesondere Säugetier-)Zellen oder -gewebe. Modulatoren können anhand ihrer potentiellen Aktivität als Inhibitoren oder Aktivatoren (direkt oder indirekt) eines biologischen Prozesses oder Prozesse (z. B. Agonist, Teil-Antagonist, Teil-Agonist, inverser Agonist, Antagonist, antineoplastische Agenzien, zytotoxische Agenzien, Inhibitoren der neoplastischen Transformation oder Zellproliferation, Zellproliferations-fördernde Agenzien und dergleichen) durch Einbeziehung in hier beschriebene Screening-Assays bewertet werden. Die Aktivität eines Modulators kann bekannt, unbekannt oder teilweise bekannt sein.

Der Ausdruck "Testchemikalie" bezeichnet eine Chemikalie, die durch ein oder mehrere erfindungsgemäße Screening-Verfahren als ein potentieller Modulator getestet werden soll. Eine Testchemikalie ist gewöhnlich nicht dafür bekannt, dass sie an das Ziel von Interesse bindet. Der Ausdruck "Kontroll-Testchemikalie" bezeichnet eine Chemikalie, die dafür bekannt ist, dass sie an das Ziel bindet (z. B. ein bekannter Agonist, Antagonist, Teil-Agonist oder inverser Agonist). Gewöhnlich werden verschiedene vorbestimmte Konzentrationen von Testchemikalien zum Screening verwendet, wie 0,01 &mgr;M, 0,1 &mgr;M, 1,0 &mgr;M und 10,0 &mgr;M.

Der Ausdruck "Ziel" bezeichnet einen biochemischen Rest, der in einem biologischen Prozess beteiligt ist. Ziele sind typischerweise Proteine, die eine nützliche Rolle bei der Physiologie oder Biologie eines Organismus spielen. Eine therapeutische Chemikalie bindet an das Ziel, um dessen Funktion zu verändern oder zu modulieren. Die hier verwendeten Ziele können Zelloberflächen-Rezeptoren, G-Proteine, Kinasen, Innenkanäle, Phospholipasen und andere hier erwähnte Proteine einschließen.

Der Ausdruck "Markierung" bezeichnet eine Zusammensetzung, die durch spektroskopische, photochemische, biochemische, immunochemische oder chemische Mittel nachweisbar ist. Zum Beispiel schließen nützliche Markierungen 32P, Fluoreszenzfarbstoffe, fluoreszierende Proteine, Elektronen-Dichte-Reagenzien, Enzyme (z. B. wie sie normalerweise in einem ELISA verwendet werden), Biotin, Dioxigenin oder Haptene und Proteine, für die Antiseren oder monoklonale Antikörper verfügbar sind, ein. Zum Beispiel können erfindungsgemäße Polypeptide als detektierbare Markierungen hergestellt werden, indem sie z. B. in ein Polypeptid eingefügt werden, und sie können verwendet werden, um Antikörper zu markieren, die mit dem Polypeptid in spezifischer Weise reaktiv sind. Eine Markierung erzeugt oft ein messbares Signal wie Radioaktivität, Fluoreszenzlicht oder eine Enzym-Aktivität, die verwendet werden kann, um die Menge an gebundener Markierung zu quantifizieren.

Der Ausdruck "Nukleinsäure-Sonde" bezeichnet ein Nukleinsäuremolekül, das an eine spezifische Sequenz oder Subsequenz eines anderen Nukleinsäuremoleküls bindet. Eine Sonde ist vorzugsweise ein Nukleinsäuremolekül, das über eine komplementäre Basenpaarung an die vollständige Sequenz oder an eine Subsequenz einer Ziel-Nukleinsäure bindet. Es soll so verstanden werden, dass Sonden Zielsequenzen, die keine vollständige Komplementarität mit der Sondensequenz aufweisen, in Abhängigkeit von der Stringenz der Hybridisierungsbedingungen binden können. Sonden sind vorzugsweise direkt oder indirekt mit Isotopen, Chromophoren, Lumiphoren, Chromogenen, fluoreszierenden Proteinen markiert, beispielsweise mit Biotin, an das nachher ein Streptavidin-Komplex binden kann. Durch das Untersuchen des Vorliegens oder des Fehlens der Sonde kann man das Vorliegen oder das Fehlen der ausgewählten Sequenz oder Subsequenz nachweisen.

Eine "markierte Nukleinsäure-Sonde" ist eine Nukleinsäure-Sonde, die entweder kovalent über einen Linker oder über ionische, van der Waals- oder Wasserstoffbindungen an eine Markierung gebunden ist, so dass das Vorliegen der Sonde durch den Nachweis des Vorliegens der an die Sonde gebundenen Markierung nachgewiesen werden kann.

Die Ausdrücke "Polypeptid" und "Protein" bezeichnen ein Polymer von Aminosäureresten. Die Ausdrücke beziehen sich sowohl auf Aminosäure-Polymere, in denen ein oder mehrere Aminosäurereste ein artifizielles chemisches Analog einer korrespondierenden natürlich vorkommenden Aminosäure ist, als auch natürlich vorkommende Aminosäure-Polymere. Der Ausdruck "rekombinantes Protein" bezeichnet ein Protein, das durch Expression einer Nukleotidsequenz, die für die Aminosäuresequenz des Proteins kodiert, aus einem rekombinanten DNA-Molekül hergestellt wird.

Der Ausdruck "rekombinante Wirtszelle" bezeichnet eine Zelle, die ein rekombinantes Nukleinsäuremolekül umfasst. Daher können z. B. rekombinante Wirtszellen Gene exprimieren, die nicht in der nativen (nicht-rekombinanten) Form der Zelle vorkommen.

Die Ausdrücke "isoliert", "aufgereinigt" oder "biologisch rein" bezeichnet Material, das im Wesentlichen oder fast vollständig von solchen Bestandteilen frei ist, die normalerweise in dessen nativem Zustand zusammen vorkommen. Die Reinheit und Homogenität werden typischerweise unter Verwendung von analytischen chemischen Techniken bestimmt, wie Polyacrylamid-Gelelektrophorese oder Hochleistungsflüssig-Chromatographie. Ein Protein oder Nukleinsäuremolekül, das die vorherrschende Protein- oder Nukleinsäurespezies in einer Präparation ist, wird im Wesentlichen als aufgereinigt angesehen. Im Allgemeinen wird ein Protein- oder Nukleinsäuremolekül mehr als 80% aller makromolekularen Spezies, die in der Präparation vorhanden sind, umfassen. Vorzugsweise ist das Protein so aufgereinigt, dass es mehr als 90% aller vorhandenen makromolekularen Spezies darstellt. Bevorzugter ist das Protein um mehr als 95% und am meisten bevorzugt ist das Protein im Wesentlichen bis zur Homogenität aufgereinigt, wobei andere makromolekulare Spezies nicht durch konventionelle Techniken nachgewiesen werden.

Der Ausdruck "natürlich vorkommend", wie es für ein Objekt verwendet wird, bezeichnet die Tatsache, dass ein Objekt in der Natur angetroffen werden kann. Zum Beispiel ist eine Polypeptid- oder Polynukleotidsequenz, die in einem Organismus (einschließlich Viren) vorliegt, der aus einer natürlichen Quelle isoliert werden kann und der nicht absichtlich durch den Menschen im Labor modifiziert worden ist, natürlich vorkommend.

Der Ausdruck "Antikörper" bezeichnet ein Polypeptid, das im Wesentlichen durch ein Immunglobulin-Gen oder Immunglobulin-Gene oder Fragmente davon, die spezifisch einen Analyten (Antigen) binden und erkennen, kodiert wird. Die erkannten Immunglobulin-Gene schließen die kappa-, lambda-, alpha-, gamma-, delta-, epsilon- und mu-Gene der konstanten Region ein und die unzähligen Immunoglobulin-Gene der variablen Region. Antikörper existieren z. B. als intakte Immunglobuline oder als eine Zahl gut charakterisierter Fragmente, die durch Spaltung mit verschiedenen Peptidasen erzeugt werden. Diese schließen z. B. Fab'- und F(ab)'2-Fragmente ein. Der Ausdruck "Antikörper", wie hier verwendet, umfasst auch Antikörperfragmente, die entweder durch Modifikation von ganzen Antikörpern hergestellt werden oder es sind solche, die de novo unter Verwendung rekombinanter DNA-Verfahren synthetisiert werden.

Der Ausdruck "Immunoassay" bezeichnet einen Assay, der einen Antikörper einsetzt, um spezifisch einen Analyten zu binden. Der Immunoassay ist charakterisiert durch die Verwendung von spezifischen Bindungseigenschaften eines bestimmten Antikörpers, um den Analyten zu isolieren, anzuvisieren und/oder zu quantifizieren.

Der Ausdruck "identisch" im Zusammenhang mit zwei Nukleinsäure- oder Polypeptidsequenzen bezeichnet die Reste in den zwei Sequenzen, die dieselben sind, wenn sie mit maximaler Übereinstimmung aneinander gelagert werden. Wenn ein Prozentsatz der Sequenzidentität bei Proteinen oder Peptiden verwendet wird, ist es anerkannt, dass Reste an Positionen, die nicht identisch sind, sich oft durch konservative Aminosäure-Substitution unterscheiden, d. h. Aminosäurereste die mit anderen Aminosäureresten mit ähnlichen chemischen Eigenschaften (z. B. Ladung oder Hydrophobizität) ersetzt werden, und die daher nicht die funktionellen Eigenschaften des Moleküls verändern. In Fällen, in denen sich die Sequenzen durch konservative Substitutionen unterscheiden, kann der Prozentsatz der Sequenzidentität nach oben angepasst werden, um die konservative Art der Substitution zu korrigieren. Mittel zur Durchführung einer solchen Anpassung sind für den Fachmann wohl bekannt. Typischerweise beinhaltet dies das Bewerten einer konservativen Substitution als einen Teil-Mismatch statt einem vollständigen Mismatch, wobei dadurch der Prozentsatz der Sequenzidentität erhöht wird. Daher wird z. B. in Fällen, in denen eine identische Aminosäure mit der Zahl 1 bewertet wird und eine nicht-konservative Substitution mit der Zahl 0 bewertet wird, eine konservative Substitution eine Zahl zwischen 0 und 1 ergeben. Die Zahl der konservativen Substitutionen wird z.B. durch bekannte Algorithmen berechnet. Siehe z. B. Meyers und Miller, Computer Applic. Biol. Sci. 4: 11–17 (1988); Smith und Waterman (1981), Adv. Appl. Math. 2: 482; Needleman und Wunsch (1970), J. Mol. Biol. 48: 443; Pearson und Lipman (1988), Proc. Natl. Acad. Sci. USA 85: 2444; Higgins und Sharp (1988), Gene 73: 237–244 und Higgins und Sharp (1989), CABIOS 5: 151–153; Corpet et al. (1988), Nucleic Acids Research 16: 10881–90; Huang et al. (1992), Computer Applications in the Biosciences 8: 155–65 und Pearson et al. (1994), Methods in Molecular Biology 24: 307–31. Eine Anlagerung wird auch oft mittels Augenschein und manueller Anlagerung durchgeführt.

"Konservativ modifizierte Variationen" einer bestimmten Nukleinsäuresequenz bezeichnet solche Nukleinsäuren, die für identische oder im Wesentlichen identische Aminosäuresequenzen kodieren oder in Fällen, in denen die Nukleinsäure nicht für eine Aminosäuresequenz kodiert, im Wesentlichen identische Sequenzen. Aufgrund der Degeneriertheit des genetischen Codes kodiert eine große Zahl funktionell identischer Nukleinsäuren für ein beliebiges gegebenes Polypeptid. Zum Beispiel kodieren die Kodons CGU, CGC, CGA, CGG, AGA und AGG alle für die Aminosäure Arginin. Daher kann an jeder Position, an der ein Arginin durch ein Kodon spezifiziert ist, das Kodon durch ein beliebiges der beschriebenen korrespondierenden Kodons verändert werden, ohne das kodierte Polypeptid zu verändern. Solche Nukleinsäure-Variationen sind "stille Variationen", die eine Art von "konservativ modifizierten Variationen" sind. Jede hier erwähnte Nukleinsäuresequenz, die für ein Polypeptid kodiert, beschreibt auch jede mögliche stille Variation. Der Fachmann wird erkennen, dass jedes Kodon in einer Nukleinsäure (außer AUG, das naturgemäß das einzige Kodon für Methionin ist) modifiziert werden kann, um ein funktionell identisches Molekül durch Standardtechniken zu erhalten. Daher ist jede "stille Variation" einer Nukleinsäure, die für ein Polypeptid kodiert, in jeder beschriebenen Sequenz implizit vorhanden. Weiter wird der Fachmann erkennen, dass individuelle Substitutionen, Deletionen oder Additionen, die eine einzelne Aminosäure oder einen kleineren Prozentsatz von Aminosäuren (typischerweise weniger als 5%, noch typischer weniger als 1%) in einer kodierten Sequenz verändern, hinzufügen oder deletieren "konservativ modifizierte Variationen" sind, wobei die Veränderungen eine Substitution einer Aminosäure mit einer chemisch ähnlichen Aminosäure bewirken. Konservative Aminosäure-Substitutionen, die eine Funktionalität ähnlicher Aminosäuren bereitstellen, sind auf dem Gebiet bekannt. Die folgenden sechs Gruppen enthalten jeweils Aminosäuren, die konservative Substitutionen einer anderen darstellen:

  • 1) Alanin (A), Serin (S), Threonin (T);
  • 2) Asparaginsäure (D), Glutaminsäure (E);
  • 3) Asparagin (N), Glutamin (Q);
  • 4) Arginin (R), Lysin (K);
  • 5) Isoleucin (I), Leucin (L), Methionin (M), Valin (V); und
  • 6) Phenylalanin (F), Tyrosin (Y), Tryptophan (W).

Der Ausdruck "komplementär" bedeutet, dass ein Nukleinsäuremolekül die Sequenz des Bindungspartners eines anderen Nukleinsäuremoleküls besitzt. Daher ist die Sequenz 5'-ATGC-3' komplementär zu der Sequenz 5'-GCAT-3'.

Eine Aminosäuresequenz oder eine Nukleotidsequenz ist "im Wesentlichen identisch" oder "im Wesentlichen ähnlich" zu einer Referenzsequenz, wenn die Aminosäuresequenz oder Nukleotidsequenz eine Sequenzidentität von mindestens 80% mit der Referenzsequenz über ein gegebenes Vergleichsfenster aufweist. Daher schließen im Wesentlichen ähnliche Sequenzen solche ein, die beispielsweise eine Sequenzidentität von mindestens 85%, eine Sequenzidentität von mindestens 90%, eine Sequenzidentität von mindestens 95% oder eine Sequenzidentität von mindestens 99% aufweisen. Zwei Sequenzen, die zueinander identisch sind, sind natürlich auch im Wesentlichen identisch.

Eine Nukleotidsequenz eines Subjekts ist "im Wesentlichen komplementär" zu einer Referenz-Nukleotidsequenz, wenn das Komplement der Nukleotidsequenz des Subjekts im Wesentlichen identisch mit der Referenz-Nukleotidsequenz ist.

Der Ausdruck "stringente Bedingungen" bezeichnet eine Temperatur und ionische Bedingungen, die zur Nukleinsäure-Hybridisierung verwendet werden. Stringente Bedingungen sind sequenzabhängig und sind bei verschiedenen Umgebungsparametern unterschiedlich. Im Allgemeinen werden stringente Bedingungen so ausgewählt, dass sie etwa 5°C bis 20°C niedriger sind als der thermale Schmelzpunkt (Tm) für die spezifische Sequenz bei einer definierten Ionenstärke und pH. Der Tm ist die Temperatur (bei definierter Ionenstärke und pH), bei der 50% der Zielsequenz an eine perfekt angelagerte Sonde hybridisiert.

Der Ausdruck "allelische Varianten" bezeichnet polymorphe Formen eines Gens bei einem bestimmten genetischen Locus und cDNAs, die von mRNA-Transkripten der Gene abgeleitet werden sowie Polypeptide, die von diesen kodiert werden.

Der Ausdruck "bevorzugtes Säugetier-Kodon" bezeichnet die Unterklasse von Kodons unter der Gruppe von Kodons, die für eine Aminosäure kodieren, die am häufigsten in Proteinen, die in Säugetierzellen exprimiert werden, verwendet werden, wie die in der folgenden Liste ausgewählten: Aminosäure Bevorzugte Kodans für eine Säugetier-Expression mit hohem Spiegel Gly GGC, GGG Glu GAG Asp GAC Val GUG, GUC Ala GCC, GCU Ser AGC, UCC Lys AAG Asn AAC Met AUG Ile AUC Thr ACC Trp UGG Cys UGC Tyr UAU, UAC Leu CUG Phe UUC Arg CGC, AGG, AGA Gln CAG His CAC Pro CCC

Fluoreszierende Moleküle sind für einen Fluoreszenz-Resonanz-Energie-Transfer ("FRET") verwendbar. FRET nutzt ein Spender-Molekül und ein Akzeptor-Molekül. Um die Effizienz und Nachweisbarkeit von FRET zwischen einem Spender- und Akzeptor-Molekül zu optimieren, müssen mehrere Faktoren ausgeglichen werden. Das Emissionsspektrum des Spenders sollte so viel wie möglich mit dem Anregungsspektrum des Akzeptors überlappen, um das Überlappungsintegral zu maximieren. Auch sollte die Quantenausbeute des Spender-Rests und der Extinktionskoeffizient des Akzeptors in gleicher Weise so hoch wie möglich sein, um R0 zu maximieren, d. h. die Distanz, bei der die Effizienz des Energietransfers 50% beträgt. Jedoch sollten die Anregungsspektren des Spenders und des Akzeptors so wenig wie möglich überlappen, so dass ein Wellenlängenbereich gefunden werden kann, bei dem der Spender effizient angeregt werden kann, ohne direkt den Akzeptor anzuregen. Fluoreszenz, die aus einer direkten Anregung des Akzeptors stammt, ist schwierig von einer Fluoreszenz zu unterscheiden, die aus FRET stammt. In gleicher Weise sollten die Emissionsspektren des Spenders und des Akzeptors so wenig wie möglich überlappen, so dass die zwei Emissionen klar voneinander unterschieden werden können. Eine große Fluoreszenz-Quantenausbeute des Akzeptor-Rests ist wünschenswert, wenn die Emission von dem Akzeptor entweder durch bloßes Ablesen oder als Teil eines Emissionsverhältnisses ermittelt werden muss. Ein Faktor, der bei der Wahl des Spender- und Akzeptorpaars berücksichtigt werden muss, ist die Effizienz des Fluoreszenz-Resonanz-Energie-Transfers zwischen den beiden. Vorzugsweise beträgt die Effizienz von FRET zwischen dem Spender und dem Akzeptor mindestens 10%, mehr bevorzugt mindestens 50% und am meisten bevorzugt mindestens 80%.

Der Ausdruck "fluoreszierende Eigenschaft" bezeichnet den molaren Extinktionskoeffizienten bei einer geeigneten Anregungswellenlänge, die Fluoreszenz-Quanteneffizienz, die Form des Anregungsspektrums oder Emissionsspektrums, das Maximum der Anregungswellenlänge und das Maximum der Emissionswellenlänge, das Verhältnis der Anregungsamplituden bei zwei verschiedenen Wellenlängen, das Verhältnis von Emissionsamplituden bei zwei verschiedenen Wellenlängen, die Lebenszeit des angeregten Zustands oder die Fluoreszenzanitotropie. Ein messbarer Unterschied in einer dieser Eigenschaften zwischen dem Wildtyp-Aequorea-GFP und der mutanten Form ist nützlich. Ein messbarer Unterschied kann bestimmt werden, indem die Menge einer beliebigen quantitativen fluoreszierenden Eigenschaft, z. B. die Menge an Fluoreszenz bei einer bestimmten Wellenlänge oder das Integral der Fluoreszenz über das Emissionsspektrum, bestimmt wird. Das Bestimmen der Verhältnisse der Anregungsamplitude oder der Emissionsamplitude bei zwei verschiedenen Wellenlängen ("Verhältnisbildung der Anregungsamplitude" bzw. "Verhältnisbildung der Emissionsamplitude") sind besonders vorteilhaft, da der Prozess der Verhältnisbildung eine interne Referenz bereitstellt und Variationen bei der absoluten Helligkeit der Anregungsquelle, der Sensitivität des Detektors und der Lichtstreuung oder dem Quenchen durch die Probe unberücksichtigt bleiben.

II. Modifizierte fluoreszierende Proteine mit langer Wellenlänge A. Fuuoreszierende Proteine

Der hier verwendete Ausdruck "fluoreszierendes Protein" bezeichnet ein beliebiges Protein, das in der Lage ist, zu fluoreszieren, wenn es durch eine geeignete elektromagnetische Strahlung angeregt wird. Dies schließt fluoreszierende Proteine ein, deren Aminosäuresequenzen entweder natürlich vorkommend oder modifiziert sind (d. h. Analoga oder Mutanten). Viele Cnidaria verwenden grün fluoreszierende Proteine ("GFPs") als Energietransfer-Akzeptoren bei der Bioluminszenz. Ein "grün fluoreszierendes Protein", wie hier verwendet, ist ein Protein, das grünes Licht fluoresziert. Gleichermaßen fluoreszieren "blau fluoreszierende Proteine" blaues Licht und "rot fluoreszierende Proteine" fluoreszieren rotes Licht. GFPs wurden aus der nordwestpazifischen Qualle Aequorea victoria, der Weichkoralle Renilla reniformis, und Phialidium gregarium isoliert. W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982); L. D. Levine et al., Comp. Biochem. Physiol. 72B: 77–85 (1982).

Eine Vielzahl von mit Aequorea verwandten fluoreszierenden Proteinen, die nützliche Anregungs- und Emissionsspektren besitzen, wurden hergestellt, indem die Aminosäuresequenz eines natürlich vorkommenden GFP aus Aequorea victoria modifiziert worden ist (D. C. Prasher et al., Gene 111: 229–233 (1992); R. Heim et al., Proc. Natl. Acad. Sci. USA 91: 12501–04 (1994); US-Patent Nr. 5,625,048, eingereicht am 10. November 1994; internationale Anmeldung WO 96/23810, eingereicht am 11.10.95).

Ein hier verwendetes fluoreszierendes Protein bezeichnet ein "mit Aequorea verwandtes fluoreszierendes Protein", wenn eine zusammenhängende Sequenz von 150 Aminosäuren des fluoreszierenden Proteins eine Sequenzidentität von mindestens 85% mit einer Aminosäuresequenz, entweder zusammenhängend oder nicht-zusammenhängend, aus der 238 langen Aminosäuresequenz des grün fluoreszierenden Wildtyp-Proteins von Aequorea aus 3 (SEQ ID NO: 2) aufweist. Bevorzugter ist ein fluoreszierendes Protein ein mit Aequorea verwandtes fluoreszierendes Protein, wenn eine zusammenhängende Sequenz von 200 Aminosäuren des fluoreszierenden Proteins eine Sequenzidentität von mindestens 95% mit einer Aminosäuresequenz, entweder zusammenhängend oder nicht-zusammenhängend, aus dem grün fluoreszierenden Wildtyp-Protein von Aequorea aus 3 (SEQ ID NO: 2) aufweist. Gleichermaßen kann das fluoreszierende Protein mit fluoreszierenden Wildtyp-Proteinen von Renilla oder Phialidium bei Verwendung derselben Standards verwandt sein.

Mit Aequorea verwandte fluoreszierende Proteine schließen z. B. und ohne Beschränkung Wildtyp-(natives)GFP von Aequorea victoria ein (D. C. Prasher et al., "Primary structure of the Aequorea victoria green fluorescent protein", Gene (1992), 111: 229–33), deren Nukleotidsequenz (SEQ ID NO: 1) und die davon abgeleitete Aminosäuresequenz (SEQ ID NO: 2) in 3 dargestellt sind; allelische Varianten dieser Sequenz, z. B. Q80R, bei der der Glutaminrest an Position 80 mit Arginin ersetzt ist (M. Chalfie et al., Science (1994), 263: 802–805); die hier beschriebenen modifizierten mit Aequorea verwandten fluoreszierenden Proteine, z. B. in Tabelle A oder Tabelle F, Varianten, die eine oder mehrere Faltungsmutationen und Fragmente dieser Proteine, die fluoreszierend sind, einschließen, wie grün fluoreszierendes Protein von Aequorea, von dem die zwei Amino-terminalen Aminosäuren entfernt worden sind. Mehrere dieser Proteine enthalten verschiedene aromatische Aminosäuren innerhalb der zentralen Chromophore und fluoreszieren bei einer weitaus geringeren Wellenlänge als die Wildtyp-Spezies. Zum Beispiel enthalten die modifizierten Proteine P4 und P4-3 (zusätzlich zu weiteren Mutationen) die Substitution Y66H, worin W2 und W7 (zusätzlich zu anderen Mutationen) Y66W enthalten. Andere Mutationen, die sowohl in der Nähe des Chromophorenbereichs des Proteins als auch davon entfernt in der Primärsequenz liegen, können die spektralen Eigenschaften von GFP beeinflussen und sind im ersten Teil der unten stehenden Tabelle aufgeführt.

TABELLE A

Zusätzliche Mutationen in mit Aequorea verwandten fluoreszierenden Proteinen, die auch als "Faltungsmutationen" bezeichnet werden, verbessern die Fähigkeit der fluoreszierenden Proteine, sich bei höheren Temperaturen zu falten und mehr fluoreszierend zu sein, wenn sie in Säugetierzellen exprimiert werden, die jedoch eine geringe oder keine Wirkung auf die Spitzen-Wellenlängen der Anregung und Emission haben. Es sollte bemerkt werden, dass diese mit Mutationen kombiniert werden können, die die spektralen Eigenschaften von GFP beeinflussen, um Proteine mit veränderten spektralen und Faltungseigenschaften zu erzeugen. Faltungsmutationen umfassen: F64L, V68L, S72A und auch T44A, F99S, Y145F, N146I, M153T oder A, V163A, I167T, S175G, S205T und N212K.

Der hier verwendete Ausdruck "Loop-Domäne" bezeichnet eine Aminosäuresequenz von einem mit Aequorea verwandten fluoreszierenden Protein, die die Aminosäuren, die bei der Sekundärstruktur der 11 Stränge des &bgr;-Faltblattes oder der zentralen &agr;-Helix (Reste 56–72) beteiligt sind, verbindet (siehe 1A und 1B).

Wie hier verwendet, ist der "fluoreszierende Proteinrest" eines fluoreszierenden Proteins der Teil der Aminosäuresequenz eines fluoreszierenden Proteins, die zwischen den Amino-terminalen und Carboxy-Terminalen Aminosäuren (einschließlich) der Aminosäuresequenz des natürlich vorkommenden fluoreszierenden Proteins liegt, wenn die Aminosäuresequenz des fluoreszierenden Proteinsubstrats in optimaler Weise an die Aminosäuresequenz eines natürlich vorkommenden fluoreszierenden Proteins angelagert ist.

Es wurde festgestellt, dass fluoreszierende Proteine genetisch mit anderen Ziel-Proteinen fusioniert werden können und als Marker verwendet werden können, um den Ort und die Menge des hergestellten Ziel-Proteins festzustellen. Daher stellt diese Erfindung Fusionsproteine bereit, die einen fluoreszierenden Proteinrest und zusätzliche Aminosäuresequenzen umfassen. Solche Sequenzen können beispielsweise bis zu etwa 15, bis zu etwa 50, bis zu etwa 150 oder bis zu etwa 1000 Aminosäuren lang sein. Die Fusionsproteine besitzen die Fähigkeit, zu fluoreszieren, wenn sie durch elektromagnetische Strahlung angeregt werden.

In einer Ausführungsform umfasst das Fusionsprotein ein Polyhistidin-Tag, um die Aufreinigung des Proteins zu erleichtern.

B. Verwendung der Kristallstruktur des grün fluoreszierenden Proteins, um Mutanten mit veränderten fluoreszierenden Eigenschaften zu entwerfen

Unter Verwendung von Röntgenstrahl-Kristallographie und Computerverarbeitung haben wir ein Modell der Kristallstruktur des grün fluoreszierenden Proteins von Aequorea entworfen, das die relative Anordnung der Atome in dem Molekül zeigt. Diese Information ist zur Identifizierung von Aminosäuren nützlich, deren Substitution die fluoreszierenden Eigenschaften des Proteins verändern.

Die fluoreszierenden Eigenschaften von mit Aequorea verwandten fluoreszierenden Proteinen hängen zum Teil von der Elektronen-Umgebung der Chromophore ab. Im Allgemeinen beeinflussen Aminosäuren, die innerhalb etwa 0,5 nm der Chromophore liegen, die Elektronen-Umgebung der Chromophore. Daher kann eine Substitution von solchen Aminosäuren fluoreszierende Proteine mit veränderten fluoreszierenden Eigenschaften erzeugen. Im angeregten Zustand tendiert die Elektronendichte sich vom Phenolat- zum Carbonyl-Ende der Chromophore zu verlagern. Daher tendiert eine Anlagerung einer zunehmenden positiven Ladung in der Nähe des Carbonyl-Endes der Chromophore die Energie des angeregten Zustands zu erniedrigen und eine Rot-Verlagerung beim Maximum der Absorptions- und Emissionswellenlänge des Proteins zu verursachen. Eine abnehmende Positivladung in der Nähe des Carbonyl-Endes der Chromophore hat die Tendenz, die gegenteilige Wirkung zu haben, d. h. eine Blau-Verlagerung in den Wellenlängen des Proteins zu bewirken.

Aminosäuren mit geladenen (ionisierten D, E, K und R), dipolaren (H, N, Q, S, T und nicht-geladenen D, E und K) und polarisierbaren Seitengruppen (z. B. C, F, H, M, W und Y) sind zur Veränderung der Elektronen-Umgebung der Chromophore verwendbar, speziell dann, wenn sie eine Aminosäure mit einer nicht-geladenen, unpolaren oder nicht-polarisierbaren Seitenkette substituieren. Im Allgemeinen verändern Aminosäuren mit polarisierbaren Seitengruppen zumindest die Elektronen-Umgebung und daher wird angenommen, dass sie eine im Vergleich geringere Veränderung in einer fluoreszierenden Eigenschaft bewirken. Aminosäuren mit geladenen Seitengruppen verändern die Umgebung am meisten und daher wird angenommen, dass sie eine im Vergleich größere Veränderung in einer fluoreszierenden Eigenschaft bewirken. Jedoch werden Aminosäuren mit geladenen Seitengruppen vermutlich die Struktur des Proteins zerstören und eine saubere Faltung verhindern, wenn sie neben der Chromphore, ohne irgendeine zusätzliche Solvation oder Salzverbrückung gesetzt werden. Daher werden geladene Aminosäuren vermutlich toleriert und ergeben nützliche Wirkungen, wenn sie andere geladene oder hochpolare Aminosäuren ersetzen, die bereits solvatiert sind oder bei Salzbrücken beteiligt sind. In bestimmten Fällen, in denen eine Substitution mit einer polarisierbaren Aminosäure gewählt wird, kann die Struktur des Proteins die Auswahl einer größeren Aminosäure, z. B. W, weniger geeignet machen. Alternativ können Positionen, die mit Aminosäure mit geladenen oder polaren Seitengruppen, die unvorteilhaft orientiert sind, besetzt sind, mit Aminosäuren substituiert werden, die weniger geladene oder polare Seitengruppen aufweisen. Bei einer anderen Alternative kann eine Aminosäure, deren Seitengruppe einen Dipol besitzt, der in eine Richtung in dem Protein orientiert ist, mit einer Aminosäure mit einem Dipol, der in eine andere Richtung orientiert ist, substituiert werden.

Mehr bevorzugt führt Tabelle B mehrere Aminosäure auf, die innerhalb etwa 0,5 nm der Chromophore lokalisiert sind, deren Substitution veränderte fluoreszierende Eigenschaften bewirken kann. Die Tabelle zeigt, unterstrichen, bevorzugte Aminosäure-Substitutionen an der gekennzeichneten Position, um eine fluoreszierende Eigenschaft des Proteins zu verändern. Um solche Substitutionen einzuführen, stellt die Tabelle auch Kodons für Primer bereit, die für eine Stellengerichtete Mutagenese unter Einbeziehung von Amplifikationen verwendet werden. Diese Primer wurden ausgewählt, um in wirtschaftlicher Weise die bevorzugten Aminosäuren zu kodieren, aber sie kodieren, wie gezeigt, auch andere Aminosäuren oder sogar ein Stopp-Kodon, was durch ein Z gekennzeichnet ist. Um Substitutionen unter Verwendung solcher degenerierter Primer einzuführen, besteht die am meisten wirksame Strategie darin, die Sammlung durchzumustern, um Mutanten mit der gewünschen Eigenschaft zu identifizieren und dann ihre DNA zu sequenzieren, um herauszufinden, welche der möglichen Substitutionen verantwortlich ist. Die Kodons sind in doppelsträngiger Form gezeigt, mit dem Sinn-Strang oben, dem Antisinn-Strang unten. In den Nukleinsäuresequenzen ist R = (A oder g); Y = (C oder T); M = (A oder C); K = (g oder T); S = (g oder C); W = (A oder T); H = (A, T oder C); B = (g, T oder C); V = (g, A oder C); D = (g, A oder T); N = (A, C, g oder T).

TABELLE B

Beispiele von Aminosäuren mit polaren Seitengruppen, die mit polarisierbaren Seitengruppen substituiert werden können, umfassen z. B. solche der Tabelle C.

TABELLE C

Eine Aminosäure, die in der Nähe einer zweiten Aminosäure innerhalb von etwa 0,5 nm der Chromphore liegt, kann nach einer Substitution die Elektronen-Eigenschaften der zweiten Aminosäure verändern und dadurch wiederum die Elektronen-Umgebung der Chromophore verändern. Tabelle D stellt zwei solcher Aminosäuren dar. Die Aminosäuren L220 und V224 befinden sich in der Nähe von E222 und sind in derselben Richtung in dem &bgr;-Faltblatt orientiert.

TABELLE D

Kristallkoordinaten können verwendet werden, um neu fluoreszierende Proteinmutationen durch Computerverfahren zu entwerfen und Kristalldaten, einschließlich von Koordinaten, können in Vorrrichtungen gespeichert werden. Zum Beispiel kann die Vorrichtung eine Speichervorrichtung umfassen und in der Vorrichtung können mindestens 10 Atomkoordinaten, ausgewählt aus den in den 5-1 bis 5-28 aufgeführten Atomkoordinaten gespeichert werden. Weitere Koordinaten können gespeichert werden in Abhängigkeit von der Komplexität der Berechnungen oder der Aufgabe, die der Verwendung der Koordinaten zugrunde liegt (z. B. etwa 100, 1000 oder mehr Koordinaten). Zum Beispiel sind größere Anzahlen von Koordinaten für eine detailgetreuere Darstellung der Struktur des fluoreszierenden Proteins wünschenswert. Typischerweise ist die Speichervorrichtung eine computerlesbare Vorrichtung, wie einen Code speichert, den sie als Input der Atomkoordinaten empfängt. Auch andere Speichermittel, die auf dem Gebiet bekannt sind, sind einzubeziehen. Die computerlesbare Vorrichtung kann eine Diskette oder eine Festplatte sein.

C. Herstellung von modifizierten fluoreszierenden Proteinen mit langer Wellenlänge

Die rekombinante Herstellung eines fluoreszierenden Proteins beinhaltet die Expression eines Nukleinsäuremoleküls mit Sequenzen, die für das Protein kodieren.

In einer Ausführungsform kodiert die Nukleinsäure für ein Fusionsprotein, indem ein einzelnes Polypeptid den fluoreszierenden Proteinrest innerhalb eines längeren Polypeptids einschließt. Das längere Polypeptid kann ein zweites funktionelles Protein einschließen, beispielsweise einen FRET-Partner oder ein Protein mit einer zweiten Funktion (z. B. ein Enzym, Antikörper oder ein anderes Bindeprotein). Nukleinsäuren, die für fluoreszierende Proteine kodieren, sind als Ausgangsmaterialien verwendbar.

Die fluoreszierenden Proteine können als Fusionsproteine durch rekombinante DNA-Technologie hergestellt werden. Die rekombinante Herstellung von fluoreszierenden Proteinen beinhaltet die Expression von Nukleinsäuren mit Sequenzen, die für die Proteine kodieren. Nukleinsäuren, die für die fluoreszierenden Proteine kodieren, können durch auf dem Gebiet bekannte Verfahren erhalten werden. Fluoreszierende Proteine können durch Stellen-spezifische Mutagenese von anderen Nukleinsäuren, die für fluoreszierende Proteine kodieren, oder durch Zufalls-Mutagenese, die ausgelöst wird, indem die Fehlerrate der PCR des ursprünglichen Polynukleotids mit 0,1 mM MnCl2 und unausgeglichenen Nukleotidkonzentrationen erhöht wird, hergestellt werden. Siehe z. B. US-Patent Nr. 5,625,048, einegereicht am 10. November 1994, oder die internationale Anmeldung WO 96/23810, eingereicht am 10. November 1995. Die Nukleinsäure, die für ein grün fluoreszierendes Protein kodiert, kann durch Polymerase-Kettenreaktion von cDNA aus A. victoria unter Verwendung von Frimern, die auf der DNA-Sequenz des grün fluoreszierenden Proteins von A. victoria basieren, wie in 3 dargestellt, isoliert werden. PCR-Verfahren sind z. B. beschrieben in US-Patent Nr. 4,683,195; Mullis et al. (1987), Cold Spring Harbor Symp. Quant. Biol. 51: 263; und Erlich, Hrsg., PCR Technology (Stockton Press, NY, 1989).

Die Konstruktion von Expressionsvektoren und die Expression von Genen in transfizierten Zellen beinhaltet die Verwendung von molekularen Klonierungstechniken, die auch auf dem Gebiet bekannt sind. Sambrook et al., Molecular Cloning – A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) und Current Protocols in Molecular Biology, F. M. Ausubel et al., Hrsg., (Current Protocols, a joint venture between Greene Publishing Associates, Inc. und John Wiley & Sons, Inc.). Der Expressionsvektor kann bezüglich der Funktion in Prokaryonten oder Eukaryonten durch Einschluss von geeigneten Promotoren, Replikationssequenzen, Markern, usw. angepasst werden.

Nukleinsäuren, die zur Transfektion von Zellen mit Sequenzen, die eine Expression des Polypeptids von Interesse kodieren, verwendet werden, werden im Allgemeinen in der Form eines Expressionsvektors vorliegen, einschließlich Expressionskontrollsequenzen, die operativ an eine Nukleotidsequenz, die für eine Expression des Polypeptids kodiert, gebunden sind. Der verwendete Ausdruck "Nukleotidsequenz, kodierend für eine Expression von" eines Polypeptids bezeichnet eine Sequenz, die nach Transfektion und Translation von mRNA das Polypeptid erzeugt. Diese kann Sequenzen einschließen, die z. B. Introns enthalten. Expressionskontrollsequenzen sind operativ an eine Nukleinsäuresequenz gebunden, wenn die Expressionskontrollsequenzen die Transkription und, wenn zweckmäßig, die Translation der Nukleinsäuresequenz kontrollieren und regulieren. Daher können Expressionskontrollsequenzen geeignete Promotoren, Enhancer, Transkriptions-Terminatoren, ein Start-Kodon (d. h. ATG) vor einem Protein-kodierenden Gen, Splice-Signale für Introns, die Aufrechterhaltung des richtigen Leserasters des Gens, um eine saubere Translation der mRNA zu ermöglichen, und Stopp-Kodons einschließen.

Verfahren, die dem Fachmann auf dem Gebiet gut bekannt sind, können verwendet werden, um Expressionsvektoren, die die für das fluoreszierende Protein kodierende Sequenz enthalten, und geeignete Transkriptions-/Translations-Kontrollsignale zu konstruieren. Diese Verfahren schließen rekombinante in vitro-DNA-Techniken, synthetische Techniken und in vivo-Rekombination/genetische Rekombination ein. (Siehe z. B. die in Manniatis et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, N.Y., 1989, beschriebenen Techniken).

Die Transformation einer Wirtszelle mit rekombinanter DNA kann durch für den Fachmann bekannte konventionelle Techniken durchgeführt werden. In Fällen, in denen der Wirt prokaryontisch ist, wie E. coli, können kompetente Zellen, die zur DNA-Aufnahme fähig sind, aus Zellen hergestellt werden, die nach einer exponentiellen Wachstumsphase geerntet worden sind, und anschließend durch das CaCl2-Verfahren durch auf dem Gebiet bekannte Prozeduren behandelt worden sind. Alternativ können MgCl2 oder RbCl verwendet werden. Eine Transformation kann auch durchgeführt werden, nach Bildung eines Protoplasten der Wirtszelle oder durch Elektroporation.

Wenn der Wirt ein Eukaryont ist, können solche Verfahren zur Transfektion von DNA, wie Calciumphosphat-Co-Präzipitate, konventionelle mechanische Verfahren wie Mikroinjektion, Elektroporation, Insertion eines Plasmids, der in Liposomen eingekapselt ist, oder Virusvektoren, verwendet werden. Eukaryontische Zellen können auch mit DNA-Sequenzen co-transfiziert werden, die für das erimdungsgemäße Fusionspolypeptid kodieren, und einem zweiten Fremd-DNA-Molekül, das für einen selektierbaren Phenotyp kodiert, wie dem Herpes simplex-Thymidin-Kinase-Gen. Ein weiteres Verfahren ist die Verwendung eines eukaryontischen viralen Vektors wie Simian-Virus 40 (SV40) oder Rinder-Papillom-Virus, um eukaryontische Zellen transient zu infizieren oder transformieren und das Protein zu exprimieren. (Eukaroytic Viral Vectors, Cold Spring Harbor Laboratory, Gluzman Hrsg., 1982). Vorzugsweise wird ein eukaryontischer Wirt als die hier beschriebene Wirtszelle eingesetzt. Techniken zur Isolierung und Aufreinigung der mikrobiell oder eukaryontisch exprimierten erfindungsgemäßen Polypeptide können durch beliebige konventionelle Mittel, wie beispielsweise präparative chromatographische Auftrennungen und immunologische Auftrennungen wie solche, welche die Verwendung von monoklonalen oder polyklonalen Antikörpern oder Antigen beinhalten, sein.

In einer Ausführungsform können rekombinante fluoreszierende Proteine durch Expression der Nukleinsäure, die für das Protein kodiert, in E. coli hergestellt werden. Aequorea-verwandte fluoreszierende Proteine werden am besten durch Zellen exprimiert, die zwischen etwa 15°C und 30°C kultiviert werden, wobei höhere Temperaturen (z. B. 37°C) möglich sind. Nach der Synthese sind diese Enzyme bei höheren Temperaturen (z. B. 37°C) stabil und können in Assays bei solchen Temperaturen verwendet werden.

Eine Reihe von Wirts-Expressionsvektorsystemen kann eingesetzt werden, um die für das fluoreszierende Protein kodierende Sequenz zu exprimieren. Diese umfassen, sind aber nicht beschränkt auf, Mikroorganismen wie Bakterien, die mit rekombinanten Bakteriophagen-DNA-, Plasmid-DNA- oder Plasmid-DNA-Expressionsvektoren, die eine für das fluoreszierende Protein kodierende Sequenz enthalten, transformiert worden sind, Hefe, die mit rekombinanten Hefe-Expressionsvektoren, die eine für das fluoreszierende Protein kodierende Sequenz enthalten, transformiert worden sind; Pflanzenzellsysteme, die mit rekombinanten Virus-Expressionsvektoren (z. B. Blumenkohl-Mosaikvirus, CaMV; Tabak-Mosaikvirus, TMV) infiziert worden sind oder mit rekombinanten Plasmid-Expressionsvektoren (z. B. Ti-Plasmid) transformiert worden sind, die eine für das fluoreszierende Protein kodierende Sequenz enthalten; Insektenzellsysteme, die mit rekombinanten Virus-Expressionsvektoren (z. B. Baculovirus), die eine für das fluoreszierende Protein kodierende Sequenz enthalten, infiziert worden sind; oder Tierzellsysteme, die mit rekombinanten Virus-Expressionsvektoren (z. B. Retroviren, Adenovirus, Vakzinia-Virus), die eine für das fluoreszierende Protein kodierende Sequenz enthalten, infiziert worden sind, oder transformierte Tierzellsysteme, die für eine stabile Expression konzipiert worden sind.

In Abhängigkeit von dem eingesetzten Wirts-/Vektorsystem kann eine beliebige Anzahl von geeigneten Transkriptions- und Translationselementen, einschließlich konstitutiver und induzierbarer Promotoren, Transkriptions-Enhancer-Elementen, Transkriptions-Terminatoren, usw. in dem Expressionsvektor verwendet werden (siehe z. B. Bitter et al., Methods in Enzymology 153: 516–544, 1987). Zum Beispiel kann für eine Klonierung in bakteriellen Systemen induzierbare Promotoren wie pL des Bakteriophagen &agr;, plac, ptrp, ptac (ptrp-lac-Hybrid-Promotor) und dergleichen verwendet werden. Bei Klonierung in Säugetierzellsystemen können Promotoren, die sich von dem Genom von Säugetierzellen ableiten (z. B. Metallothionein-Promotor) oder von Säugetierviren (z. B. dem retroviralen long terminal repeat; dem adenoviralen späten Promotor, dem Vakzinia-Virus 7.5K-Promotor) verwendet werden. Promotoren, die durch rekombinante DNA- oder synthetische Techniken hergestellt wurden, können auch verwendet werden, um eine Transkription der eingeführten, für das fluoreszierende Protein kodierenden Sequenz sicherzustellen.

In bakteriellen Systemen kann eine Anzahl von Expressionsvektoren vorteilhaft ausgewählt werden in Abhängigkeit der Verwendung, die für das exprimierte fluoreszierende Protein beabsichtigt ist. Zum Beispiel können Vektoren, welche die Expression von hohen Spiegeln der Fusionsprotein-Produkte, die leicht aufgereinigt sind, steuern, wünschenswert sein. Solche, die so kontruiert werden, dass sie eine Spaltungsstelle enthalten, um eine Wiedergewinnung des fluoreszierenden Proteins zu erleichtern, sind bevorzugt.

In Hefe können eine Anzahl von Vektoren, die konstitutive oder induzierbare Promotoren enthalten, verwendet werden. Zur Übersicht siehe Current Protocols in Molecular Biology, Bd. 2, Hrsg. Ausubel et al., Greene Publish. Assoc. & Wiley Interscience, Kapitel 13, 1988; Grant et al., Expression and Secretion Vectors for Yeast, in Methods in Enzymology, Hrsg. Wu & Grossman, 31987, Acad. Press, N.Y., Bd. 153, Seiten 516–544, 1987; Glover, DNA Cloning, Bd. II, IRL Press, Wash., D.C., Kapitel 3, 1986, und Bitter, Heterologous Gene Expression in Yeast, Methods in Enzymology, Hrsg. Berger & Kimmel, Acad. Press, N.Y., Bd. 152, Seiten 673–684, 1987; und The Molecular Biology of the Yeast Saccharomyces, Hrsg. Strathern et al., Cold Spring Harbor Press, Bd. I und II, 1982. Ein konstitutiver Hefe-Promotor wie ADH oder LEU2 oder ein induzierbarer Promotor wie GAL können verwendet werden (Cloning in Yeast, Kapitel 3, R. Rothstein, in DNA Cloning, Bd. 11, A Practical Approach, Hrsg. DM Glover, IRL Press, Wash., D.C., 1986). Alternativ können Vektoren verwendet werden, welche die Einführung von Fremd-DNA-Sequenzen in das Hefe-Chromosom fördern.

In Fällen, in denen Pflanzen-Expressionsvektoren verwendet werden, kann die Expression einer für das fluoreszierende Protein kodierenden Sequenz durch einen beliebigen einer Anzahl von Promotoren angetrieben werden. Zum Beispiel können virale Promotoren wie die 35S-RNA- und 19S-RNA-Promotoren von CaMV (Brisson et al., Nature 310: 511–514, 1984) oder der Hüllen-Protein-Promotor von TMV (Takamatsu et al., EMBO J. 6: 307–311, 1987) verwendet werden; alternativ können Pflanzen-Promotoren wie die kleine Untereinheit von RUBISCO (Coruzzi et al., 1984, EMBO J. 3: 1671–1680; Broglie et al., Science 224: 838–843, 1984) oder Hitzeschock-Promotoren, z. B. Sojabohnen-hsp17.5-E oder hsp17.3-B (Gurley et al., Mol. Cell. Biol. 6: 559–565, 1986) verwendet werden. Diese Konstrukte können in Pflanzenzellen unter Verwendung von Ti-Plasmiden, Ri-Plasmiden, Pflanzenvirus-Vektoren, direkter DNA-Transformation, Mikroinjektion, Elektroporation, usw. eingeführt werden. Für Übersichten zu solchen Techniken siehe z. B. Weissbach & Weissbach, Methods for Plant Molecular Biology, Academic Press, NY, Abschnitt VIII, Seiten 421–463, 1988; und Grierson & Corey, Plant Molecular Biology, 2. Auflage, Blackie, London, Kapitel 7–9, 1988.

Ein alternatives Expressionssystem, das verwendet werden könnte, um das fluoreszierende Protein zu exprimieren, ist ein Insektensystem. In einem solchen System wird das nukleare Polyhedrosis-Virus von Autographa californica (AcNPV) als ein Vektor verwendet, um Fremdgene zu exprimieren. Das Virus wächst in Spodoptera frugiperda-Zellen. Die für das fluoreszierende Protein kodierende Sequenz kann in nicht-essentielle Regionen (z. B. dem Polyhedrin-Gen) des Virus kloniert werden und unter der Kontrolle eines AcNPV-Promotors (z. B. dem Polyhedrin-Promotor) gesetzt werden. Eine erfolgreiche Insertion der für das fluoreszierende Protein kodierenden Sequenz wird eine Inaktivierung des Polyhedrin-Gens und die Herstellung von nicht-okkludentem rekombinantem Virus ergeben (d. h. Virus, dem die proteinhaltige Hülle, die durch das Polyhedrin-Gen kodiert wird, fehlt). Diese rekombinanten Viren werden dann verwendet, um Spodoptera frugiperda-Zellen zu infizieren, in denen das eingeführte Gen exprimiert wird; siehe Smith et al., J. Viol. 46: 584, 1983; Smith, US-Patent Nr. 4,215,051.

Eukaryontische Systeme und vorzugsweise Säugetier-Expressionssysteme ermöglichen, dass saubere post-translationale Modifikationen von exprimierten Säugetierproteinen stattfinden. Eukaryontische Zellen, welche die zelluläre Maschinerie für eine saubere Verarbeitung des Primärtranskripts, Glykosylierung, Phosphorylierung und vorteilhafterweise Sekretion des Genprodukts besitzen, sollten als Wirtszellen für die Expression des fluoreszierenden Proteins verwendet werden. Solche Wirtszellen können CHO, VERO, BHK, HeLa, COS, MDCK, Jurkat, HEK-293 und WI38 einschließen, sind aber nicht darauf beschränkt.

Säugetierzellsysteme, welche die rekombinanten Viren oder viralen Elemente einsetzen, um eine Expression anzutreiben, können konstruiert werden. Zum Beispiel kann die für das fluoreszierende Protein kodierende Sequenz an einen Adenovirus-Transkriptions-/Translations-Kontrollkomplex liegiert werden, z. B. dem späten Promotor und der dreiteiligen Leitsequenz. Dieses chimäre Gen kann dann in das Adenovirus-Genom durch in vitro- oder in vivo-Rekombination eingeführt werden. Die Insertion in eine nicht-essentielle Region des viralen Genoms (z. B. Region E1 oder E3) wird ein rekombinantes Virus hervorbringen, das lebensfähig ist und zur Expression des fluoreszierenden Proteins in infizierten Wirten fähig ist (z. B. siehe Logan & Shenk, Proc. Natl. Acad. Sci. USA 81: 3655–3659, 1984). Alternativ kann der 7.5K-Promotor von Vakzinia-Virus verwendet werden (z. B. siehe Mackett et al., Proc. Natl. Acad. Sci. USA 79: 7415–7419, 1982; Mackett et al., J. Virol. 49: 857–864, 1984; Panicali et al., Proc. Natl. Acad. Sci. USA 79: 4928–4931, 1982). Von besonderem Interesse sind Vektoren, die auf dem Rinder-Papillom-Virus basieren, die die Fähigkeit haben, als extrachromosomale Elemente zu replizieren (Sarver et al., Mol. Cell. Biol. 1: 486, 1981). Kurz nach dem Einschleusen dieser DNA in Mäusezellen repliziert das Plasmid mit etwa 100 bis 200 Kopien pro Zelle. Die Transkription der eingeführten cDNA benötigt keine Integration des Plasmids in das Chromosom des Wirts, wobei dadurch ein höherer Expressionsspiegel erreicht wird. Diese Vektoren können für eine stabile Expression verwendet werden, indem ein selektierbarer Marker in das Plasmid eingeführt wird, wie das neo-Gen. Alternativ kann das retrovirale Genom modifiziert werden zur Verwendung als Vektor, der zur Einführung und Steuerung der Expression des Gens für das fluoreszierende Protein in Wirtszellen fähig ist (Cone & Mulligan, Proc. Natl. Acad. Sci. USA 81: 6349–6353, 1984). Hohe Expressionsspiegel können auch unter Verwendung von induzierbaren Promotoren erreicht werden, einschließlich, aber nicht beschränkt auf den Metallothionin-IIA-Promotor und Hitzeschock-Promotoren.

Das funktionell modifizierte fluoreszierende Protein kann auch eine Lokalisierungssequenz einschließen, wie eine nukleare Lokalisierungssequenz, eine Lokalisierungssequenz des endoplasmatischen Retikulums, eine Peroxisomen-Lokalisierungssequenz, eine mitochondriale Lokalisierungssequenz oder ein lokalisiertes Protein. Lokalisierungssequenzen können Zielsequenzen sein, die z. B. in "Protein Targeting", Kapitel 35 von Stryer L., Biochemistry (4. Auflage), W. H. Freeman, 1995, beschrieben sind. Die Lokalisierungssequenz kann auch ein lokalisiertes Protein sein. Einige wichtige Lokalisierungssequenzen umfassen solche, die den Nukleus (KKKRK), das Mitochondrium (Amino-terminal MLRTSSLFTRRVQPSLFRNILRLQST), das endoplasmatische Retikulum (KDEL am C-Terminus, vorausgesetzt es ist eine Signalsequenz am N-Terminus), das Peroxisom (SKF am C-Terminus), eine Prenylation oder Insertion in die Plasmamembran (CaaX, CC, CXC oder CCXX am C-Terminus), die cytoplasmatische Seite der Plasmamembran (Fusion an SNAP-25) oder den Golgi-Apparat (Fusion an Furin) zum Ziel haben.

Für eine langfristige Herstellung von rekombinanten Proteinen mit hoher Ausbeute ist eine stabile Expression bevorzugt. Statt der Verwendung von Expressionsvektoren, die virale Replikationsstartpunkte enthalten, können Wirtszellen mit der cDNA des fluoreszierenden Proteins, die durch geeignete Expressionskontrollelemente kontrolliert wird (z. B. Promotor, Enhancer, Sequenzen, Transkriptions-Terminatoren, Polyadenylierungsstellen, usw.) und einem selektierbaren Marker transformiert werden. Der selektierbare Marker in dem rekombinanten Plasmid verleiht eine Resistenz für die Selektion und ermöglicht es den Zellen, das Plasmid stabil in deren Chromosomen zu integrieren und dass sie wachsen, um Foci zu bilden, die wiederum kloniert und in Zelllinien expandiert werden können. Zum Beispiel können nach der Einführung von Fremd-DNA modifizierte Zellen für 1 bis 2 Tage in einem angereicherten Medium wachsen gelassen werden und dann in ein selektives Medium überführt werden. Eine Anzahl von Selektionssystemen kann verwendet werden, einschließlich, aber nicht beschränkt auf Herpes simplex-Virus-Thymidinkinase- (Wigler et al., Cell 11: 223, 1977), Hypoxanthin-Guanin-Phosphoribosyltransferase- (Szybalska & Szybalski, Proc. Natl. Acad. Sci. USA 48: 2026, 1962) und Adenin-Phosphoribosyltransferase-Gene (Lowy et al., Cell 22: 817, 1989) können in tk-, hgprt- bzw. aprt-Zellen eingesetzt werden. Auch kann eine Anti-Metabolitenresistenz als Basis für eine Selektion für dhfr-, das Resistenz gegenüber Methotrexat verleiht (Wigler et al., Proc. Natl. Acad. Sci. USA 77: 3567, 1980; O'Hare et al., Proc. Natl. Acad. Sci. USA 8: 1527, 1981); gpt-, das Resistenz gegenüber Mycophenolsäure verleiht (Mulligan & Berg, Proc. Natl. Acad. Sci. USA 78: 2072, 1981); neo-, das Resistenz gegenüber dem Aminoglykosid G-418 verleiht (Colberre-Garapin et al., J. Mol. Biol. 150: 1, 1981) und hygro-, das Resistenz gegenüber Hygromycin verleiht (Santerre et al., Gene 30: 147, 1984) Gene, verwendet werden. Kürzlich wurden zusätzliche selektierbare Gene beschrieben, nämlich trpB, die es den Zellen ermöglichen, Indol anstelle von Tryptophan zu verwerten; hisD, das es den Zellen ermöglicht, Histinol anstelle von Histidin zu verwerten (Hartman & Mulligan, Proc. Natl. Acad. Sci. USA 85: 8047, 1988) und ODC (Ornithindecarboxylase), die Resistenz gegenüber dem Ornithindecarboxylase-Inhibitor, 2-(Difluormethyl)-DL-ornithin, DFMO (McConlogue L., in Current Communications in Molecular Biology, Cold Spring Harbor Laboratory, Hrsg., 1987) verleiht.

DNA-Sequenzen, die für das erfindungsgemäße Fluoreszenz-Proteinpolypeptid kodieren, können in vitro durch DNA-Transfer in eine geeignete Wirtszelle exprimiert werden. "Wirtszellen" sind Zellen, in denen ein Vektor vermehrt werden kann und dessen DNA exprimiert werden kann. Der Ausdruck umfasst auch jegliche Nachkommen der jeweiligen Wirtszelle. Es soll so verstanden werden, dass alle Nachkommen nicht identisch mit der Elternzelle sind, da Mutationen vorhanden sein können, die während der Replikation auftreten. Jedoch sind solche Nachkommen mit eingeschlossen, wenn der Ausdruck "Wirtszelle" verwendet wird. Es sind Verfahren für einen stabilen Transfer, d. h., wenn die Fremd-DNA kontinuierlich in dem Wirt gehalten wird, auf dem Gebiet bekannt.

Der Expressionsvektor kann in eine Wirtszelle zur Expression der rekombinanten Nukleinsäure transfiziert werden. Wirtszellen können auf hohe Expressionsspiegel ausgewählt werden, um das fluoreszierende Fusionsprotein aufzureinigen. E. coli ist für diesen Zweck verwendbar. Alternativ kann die Wirtszelle eine prokaryontische oder eukaryontische Zelle sein, die ausgewählt wird, um die Aktivität eines Enzyms, das durch die Zelle produziert wird, zu untersuchen. In diesem Fall ist das Linker-Peptid so ausgewählt, dass es eine Aminosäuresequenz einschließt, die durch die Protease erkannt wird. Die Zelle kann z. B. eine kultivierte Zelle oder eine Zelle in vivo sein.

Ein Hauptvorteil der fluoreszierenden Fusionsproteine ist, dass sie über eine normale Protein-Biosynthese hergestellt werden können, wobei dadurch vollständig eine organische Synthese und das Erfordernis von angepassten, nicht-natürlichen Aminosäure-Analoga vermieden wird. Die Konstrukte können in E. coli für in vitro-Assays in großen Mengen exprimiert werden. Eine Aufreinigung aus Bakterien wird erleichtert, wenn die Sequenzen Polyhistidin-Tags für eine Ein-Schritt-Aufreinigung mittels Nickel-Chelat-Chromatographie einschließen. Alternativ können die Substrate direkt in einer gewünschten Wirtszelle für in situ-Assays exprimiert werden.

Weiterhin kann die Nukleinsäuresequenz, die für das fluoreszierende Protein kodiert, in einem transgenen, nicht-humanen Tier exprimiert werden.

Die "nicht-humanen Tiere" umfassen ein beliebiges nicht-humanes Tier mit einer Nukleinsäuresequenz, die für ein fluoreszierendes Protein kodiert. Solche nicht-humanen Tiere umfassen Vertebraten wie Nager, nicht-humane Primaten, Schafe, Hunde, Kühe, Schweine, Amphibien und Reptilien. Bevorzugte nicht-humane Tiere sind ausgewählt aus der Nager-Familie einschließlich der Ratte und der Maus, am meisten bevorzugt ist die Maus. Die "transgenen nicht-humanen Tiere" werden erzeugt, indem "Transgene" in die Keimbahn des nicht-humanen Tiers eingeführt werden. Embryonale Zielzellen bei verschiedenen Entwicklungsstadien können verwendet werden, um Transgene einzuführen. Es werden verschiedene Verfahren verwendet in Abhängigkeit des Entwicklungsstadiums der embryonalen Zielzelle. Die Zygote ist das beste Ziel für eine Mikroinjektion. In der Maus erreicht der männliche Pro-Nukleus die Größe von etwa 20 &mgr;m im Durchmesser, was eine reproduzierbare Injektion von 1–2 pl DNA-Lösung ermöglicht. Die Verwendung von Zygoten als ein Ziel für einen Gentransfer weist einen Hauptvorteil auf, da in den meisten Fällen die injizierte DNA in das Wirts-Gen vor der ersten Spaltung eingeführt werden wird (Brinster et al., Proc. Natl. Acad. Sci. USA 82: 4438–4442, 1985). Als eine Konsequenz werden alle Zellen des transgenen nicht-humanen Tiers das eingeführte Transgen tragen. Dies wird im Allgemeinen auch in der effizienten Übertragung des Transgens auf Nachkommen des Gründertiers widergespiegelt werden, da 50% der Keimzellen das Transgen in sich tragen werden. Eine Mikroinjektion von Zygoten ist das bevorzugte Verfahren zum Einführen von Transgenen bei der Durchführung der Erfindung.

Der Ausdruck "Transgen" wird verwendet, um ein Tier zu beschreiben, das exogenes genetisches Material in allen seinen Zellen beinhaltet. Ein "transgenes" Tier kann durch Kreuzzüchtung zweier chimärer Tiere erzeugt werden, die exogenes genetisches Material innerhalb der Zellen beinhalten, die zur Reproduktion verwendet werden. 25% der entstehenden Nachkommen werden transgen sein, d. h. Tiere, die das exogene genetische Material in allen ihren Zellen in beiden Allelen einschließen. 50% Der entstehenden Tiere werden das exogene genetische Material innerhalb eines Allels einschließen und 25% werden kein exogenes genetisches Material einschließen.

Eine retrovirale Infektion kann auch verwendet werden, um ein Transgen in ein nicht-humanes Tier einzuführen. Das sich entwickelnde nicht-humane Embryo kann in vitro bis zum Blastozysten-Stadium kultiviert werden. Während dieser Zeit können die Blastomere Ziele für eine retrovirale Infektion sein (Jaenich R., Proc. Natl. Acad. Sci. USA 73: 1260–1264, 1976). Eine effiziente Infektion der Blastomere wird durch enzymatische Behandlung bewirkt, um die Zona pellucida zu entfernen (Hogan et al. (1986), in Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Das zur Einführung des Transgens verwendete virale Vektorsystem ist typischerweise ein Replikations-defizientes Retrovirus, das das Transgen trägt (Jahner et al., Proc. Natl. Acad. Sci. USA 82: 6927–6931, 1985; Van der Putten et al., Proc. Natl. Acad. Sci. USA 82: 6148–6152, 1985). Eine Transfektion wird leicht und effizient durch Kultivierung der Blastomere auf einer Monoschicht der Virus-produzierenden Zellen erhalten (Van der Putten, supra; Stewart et al., EMBO J. 6: 383–388, 1987). Alternativ kann eine Infektion in einem späteren Stadium durchgeführt werden. Das Virus oder die Virus-produzierende Zellen können in die Blastocoele injiziert werden (D. Jahner et al., Nature 298: 623–628, 1982). Die meisten der Ursprungstiere werden bezüglich des Transgens mosaikartig sein, da eine Einführung lediglich in eine Untergruppe der Zellen stattfindet, die das transgene nicht-humane Tier bilden. Weiter kann das Gründertier verschiedene retrovirale Insertionen des Transgens an unterschiedlichen Positionen innerhalb des Genoms enthalten, die sich im Allgemeinen auf die Nachkommen aufteilen werden. Zusätzlich ist es möglich, durch eine intrauterine retrovirale Infektion des sich im mittleren Reifeprozess befindlichen Embryos Transgene in die Keimbahn einzuführen, obgleich mit geringer Effizienz (D. Jahner et al., supra).

Ein dritter Typ von Zielzelle für eine transgene Einführung ist die embryonale Stammzelle (ES). ES-Zellen werden aus Präimplantations-Embryonen erhalten, die in vitro kultiviert wurden und mit Embryonen fusioniert wurden (M. J. Evans et al., Nature 292: 154–156, 1981; M. O. Bradley et al., Nature 309: 255–258, 1984; Gossler et al., Proc. Natl. Acad. Sci. USA 83: 9065–9069, 1986; und Robertson et al., Nature 322: 445–448, 1986). Transgene können effizient in die ES-Zellen durch DNA-Transfektion oder durch Retrovirus-vermittelte Transduktion eingeführt werden. Solche transformierten ES-Zellen können danach mit Blastozysten von einem nicht-humanen Tier kombiniert werden. Die ES-Zellen kolonisieren das Embryo danach und tragen zur Keimbahn des entstehenden chimären Tiers bei. (Zur Übersicht siehe Jaenisch R., Science 240: 1468–1474, 1988).

"Transformiert" bezeichnet eine Zelle, in der (oder in einem Vorläufer von ihr) ein heterologes Nukleinsäuremolekül mittels rekombinanter Nukleinsäure-Techniken eingeführt worden ist. "Heterolog" bezeichnet eine Nukleinsäuresequenz, die entweder aus einer anderen Spezies stammt oder die in ihrer ursprünglichen Form oder der in der Zelle chimär exprimierten Form modifiziert worden ist.

"Transgen" bezeichnet ein DNA-Stück, das künstlich in eine Zelle eingeführt wurde und Teil des Genoms des Organismus wird (d. h. das entweder stabil integriert ist oder als ein stabiles extrachromosomales Element), der sich von dieser Zelle entwickelt. Ein solches Transgen kann ein Gen einschließen, das teilweise oder vollständig heterolog (d. h. fremd) zu dem transgenen Organismus ist, oder es kann ein Gen sein, das homolog zu einem endogenen Gen des Organismus ist. Eingeschlossen in diese Definition ist ein Transgen, das erzeugt wird, indem eine RNA-Sequenz bereitgestellt wird, die in DNA transkribiert wird und dann in das Genom eingeführt wird. Die erfindungsgemäßen Transgene umfassen DNA-Sequenzen, die für das fluoreszierende Protein kodieren und die in einem transgenen nicht-humanen Tier exprimiert werden können. Der hier verwendete Ausdruck "Transgen" schließt zusätzlich einen beliebigen Organismus ein, dessen Genom durch in vitro-Manipulation des frühen Embryos oder des befruchteten Eis oder durch eine beliebige transgene Technologie verändert worden ist, um ein spezifisches Gen-knockout zu induzieren. Der hier verwendete Ausdruck "Gen-knockout" bezeichnet die zielgerichtete Zerstörung eines Gens in vivo mit einem vollständigen Funktionsverlust, der durch eine beliebige, auf dem Gebiet bekannte Technologie bewirkt wurde. In einer Ausführungsform sind transgene Tiere mit Gen-knockouts solche, in denen das Ziel-Gen funktionsunfähig gemacht wurde, indem eine Insertion durch homologe Rekombination auf das Gen, das funktionsuntüchtig gemacht werden soll, gerichtet wird. Der hier verwendete Ausdruck "transgen" schließt eine beliebige transgene, auf dem Gebiet bekannte Technologie ein, die einen Organismus erzeugen kann, der ein eingeführtes Transgen trägt oder einer, bei dem ein endogenes Gen funktionsuntüchtig oder zum "knockout" gemacht wurde.

III. VERWENDUNGEN DER MODIFIZIERTEN FLUORESZIERENDEN PROTEINE

Die erfindungsgemäßen Proteine sind in beliebigen Verfahren verwendbar, die fluoreszierende Proteine einsetzen.

Die modifizierten erfindungsgemäßen fluoreszierenden Proteine sind als fluoreszierende Marker auf vielfältige Weise, in der fluoreszierende Marker bereits Verwendung finden, verwendbar. Dies schließt z. B. die Kopplung von modifizierten fluoreszierenden Proteinen an Antikörper, Nukleinsäuren oder andere Rezeptoren ein, zur Verwendung in Detektions-Assays wie Immunoassays oder Hybridisierungs-Assays.

Die erfindungsgemäßen modifizierten fluoreszierenden Proteine sind verwendbar, um die Bewegung von Proteinen in Zellen zu verfolgen. In dieser Ausführungsform wird ein Nukleinsäuremolekül, das für das fluoreszierende Protein kodiert, an ein Nukleinsäuremolekül, das für das Protein von Interesse kodiert in einem Expressionsvektor, fusioniert. Nach Expression innerhalb der Zelle kann das Protein von Interesse basierend auf der Fluoreszenz lokalisiert werden. In einer anderen Version werden zwei Proteine von Interesse mit zwei modifizierten fluoreszierenden Proteinen mit unterschiedlichen fluoreszierenden Eigenschaften fusioniert.

Die erfindungsgemäßen modifizierten fluoreszierenden Proteine sind in Systemen verwendbar, um die Induktion der Transkription nachzuweisen. In bestimmten Ausführungsformen wird eine Nukleotidsequenz, die für das modifizierte fluoreszierende Protein kodiert, an Expressionskontrollsequenzen von Interesse fusioniert und der Expressionsvektor wird in eine Zelle transfiziert. Die Induktion des Promotors kann gemessen werden, indem die Expression nachgewiesen wird und/oder die Fluoreszenz quantifiziert wird. Solche Konstrukte können verwendet werden, um Signalwege von dem Rezeptor bis zum Promotor nachzuverfolgen.

Die erfindungsgemäßen modifizierten fluoreszierenden Proteine sind auch in Applikationen verwendbar, bei denen FRET Einsatz findet. Solche Applikationen können Ereignisse als eine Funktion der Bewegung von fluoreszierenden Spendern und Akzeptoren zueinander oder voneinander weg nachweisen. Ein oder beide der Spender-/Akzeptorpaare kann ein fluoreszierendes Protein sein. Ein bevorzugtes Spender- und Rezeptorpaar für FRET-basierende Assays ist ein Spender mit einer T203I-Mutation und ein Akzeptor mit der Mutation T203X, worin X eine aromatische Aminosäure-39 ist, insbesondere T203Y, T203W oder T203H. In einem besonders verwendbaren Paar enthält der Spender die folgenden Mutationen: S72A, K79R, Y145F, M153A und T203I (mit einem Anregungs-Peak bei 395 nm und einem Emissions-Peak bei 511 nm) und der Akzeptor enthält die folgenden Mutationen: S65G, S72A, K79R und T203Y. Dieses spezielle Paar erlaubt einen großen Abstand zwischen den Anregungs- und Emissionsspitzen des Spenders und stellt eine gute Überlappung zwischen dem Emissionsspektrum des Spenders und dem Anregungsspektrum des Akzeptors sicher. Andere in den Rotbereich verlagerte Mutanten, wie z. B. die hier beschriebenen, können auch als Akzeptor in einem solchen Paar verwendet werden.

In einem Aspekt wird FRET verwendet, um die Spaltung eines Substrats nachzuweisen, das den Spender und den Akzeptor an das Substrat auf gegenüberliegenden Seiten der Spaltungsstelle gekoppelt hat. Nach Spaltung des Substrats trennt sich das Spender-/Akzeptorpaar physikalisch auf und eliminiert FRET. Die Assays beinhalten das In-Kontakt-Bringen des Substrats mit einer Probe und das Bestimmen einer qualitativen oder quantitativen Änderung beim FRET. In einer Ausführungsform wird das modifizierte fluoreszierende Protein als ein Substrat für &bgr;-Lactamase verwendet. Beispiele solcher Substrate sind beschrieben in US-Patent Nr. 5,741,657, eingereicht am 20. März 1995, und der internationalen Anmeldung WO 96/30540, eingereicht am 20. März 1996. In einer anderen Ausführungsform ist ein modifiziertes fluoreszierendes Protein-Spender-/Akzeptorpaar Teil eines Fusionsproteins, das an ein Peptid mit einer proteolytischen Spaltungsstelle gekoppelt ist. Solche fluoreszierenden Tandem-Proteine sind in der US-Patentanmeldung 08/594,575, eingereicht am 31. Januar 1996, beschrieben.

In einem weiteren Aspekt wird FRET verwendet, um Veränderungen bei der Spannung über einer Membran nachzuweisen. Ein Spender und ein Akzeptor werden auf gegenüberliegenden Seiten einer Membran so platziert, dass einer eine Übertragung über die Membran als Folge einer Spannungsänderung durchmacht. Dies erzeugt einen messbaren FRET. Ein solches Verfahren ist beschrieben im US-Patent Nr. 5,661,035, eingereicht am 7. Juni 1995, und in der internationalen Anmeldung WO 96/41166, eingereicht am 6. Juni 1996.

Das modifizierte erfindungsgemäße Protein ist für die Herstellung von fluoreszierenden Substraten für Proteinkinasen verwendbar. Solche Substrate bauen eine Aminosäuresequenz ein, die durch Proteinkinasen erkennbar ist. Nach einer Phosphorylierung macht das modifiziere fluoreszierende Protein eine Veränderung in einer fluoreszierenden Eigenschaft durch. Solche Substrate sind nützlich zum Nachweis und zur Messung der Proteinkinase-Aktivität in einer Probe von einer Zelle nach einer Transfektion und Expression des Substrats. Vorzugsweise wird die Kinase-Erkennungsstelle innerhalb von etwa 20 Aminosäuren an einem Terminus des modifizierten fluoreszierenden Proteins platziert. Die Kinase-Erkennungsstelle kann auch in einer Loop-Domäne des Proteins platziert werden (siehe z. B. 1B.). Verfahren zur Herstellung von fluoreszierenden Substraten für Proteinkinasen sind beschrieben in der US-Patentanmeldung 08/680,877, eingereicht am 16. Juli 1996.

Eine Protease-Erkennungsstelle kann auch in eine Loop-Domäne eingeführt werden. Nach der Spaltung verändert sich die fluoreszierende Eigenschaft in einer messbaren Weise.

Die funktionellen modifizierten fluoreszierenden Proteine oder die Polynukleotide, die für diese funktionellen modifizierten fluoreszierenden Proteine kodieren, können in einem Verfahren zum Identifizieren einer Testchemikalie verwendet werden. Solche Verfahren umfassen das In-Kontakt-Bringen einer Testchemikalie mit einer Probe, die einen biologischen Rest enthält, der mit einem funktionellen, modifizierten fluoreszierenden Protein oder einem Polynukleotid, das für dieses funktionelle, modifizierte fluoreszierende Protein kodiert, markiert ist. Durch Überwachung der Fluoreszenz (d. h. einer fluoreszierenden Eigenschaft) von der Probe, die das funktionelle modifizierte fluoreszierende Protein enthält, kann bestimmt werden, ob eine Testchemikalie aktiv ist. Kontrollen können mit einbezogen werden, um die Spezifität des Signals sicherzustellen. Solche Kontrollen umfassen die Messungen einer fluoreszierenden Eigenschaft in der Abwesenheit der Testchemikalie, in der Anwesenheit einer Chemikalie mit einer erwarteten Aktivität (z. B. einem bekannten Modulator) oder künstliche Kontrollen (z. B. die Abwesenheit eines manipulierten fluoreszierenden Proteins, der Abwesenheit eines Polynukleotids für das manipulierte fluoreszierende Protein oder der Abwesenheit einer operablen Verbindung des manipulierten fluoreszierenden Proteins).

Die Fluoreszenz in der Gegenwart einer Testchemikalie kann größer oder geringer sein als in der Abwesenheit dieser Testchemikalie. Zum Beispiel kann die Testchemikalie die Genexpression herauf- oder herunterregulieren, wenn das manipulierte fluoreszierende Protein als Reporter der Genexpression verwendet wird. Für solche Screening-Arten wird das Polynukleotid, das für das funktionelle manipulierte fluoreszierende Protein kodiert, operativ an ein genomisches Polynukleotid gebunden. Alternativ wird das funktionelle, modifizierte fluoreszierende Protein an ein zweites funktionelles Protein fusioniert. Diese Ausführungsform kann verwendet werden, um die Lokalisation des zweiten Proteins zu verfolgen oder um Protein-Protein-Interaktionen unter Verwendung von Energietransfer zu verfolgen.

IV. VERFAHRENSWEISEN

Die Fluoreszenz in einer Probe wird unter Verwendung eines Fluorimeters gemessen. Im Allgemeinen geht die Anregungsstrahlung von einer Anregungsquelle mit einer ersten Wellenlänge durch die Anregungsoptiken hindurch. Die Anregungsoptiken erzeugen die Anregungsstrahlung, um die Probe anzuregen. Als Antwort darauf emittieren fluoreszierende Proteine in der Probe eine Strahlung, die eine Wellenlänge besitzt, die sich von der Anregungswellenlänge unterscheidet. Sammeloptiken sammeln dann die Emissionsstrahlung von der Probe ein.

Die Vorrichtung kann ein Temperaturkontrallgerät einschließen, um die Probe bei einer bestimmten Temperatur zu halten, während sie durchmustert wird. Gemäß dieser einen Ausführungsform bewegt eine Multi-Achsen-Übertragungsbühne eine Mikrotiterplatte, die eine Vielzahl von Proben hält, um verschiedene Vertiefungen zur Exposition in Position zu bringen. Die Multi-Achsen-Übertragungsbühne, das Temperaturkontrollgerät, das Autofocus-Element und die Elektroniken, die mit der Bilderzeugung und der Datensammlung verbunden sind, können durch einen in geeigneter Weise programmierten digitalen Computer verwaltet werden. Der Computer kann auch die gesammelten Daten während des Assays in eine andere Form zur Präsentation umwandeln. Dieser Prozess kann im kleinen Format und automatisiert ablaufen, um das Screening von vielen Tausend Verbindungen zu ermöglichen.

Verfahren zur Durchführung von Assays auf fluoreszierenden Materialien sind auf dem Gebiet bekannt und z. B. beschrieben in Lakowicz, J. R., Principles of Fluorescence Spectroscopy, New York: Plenum Fress (1983); Herman, B., Resonance energy transfer microscopy, in: Fluorescence Microscopy of Living Cells in Culture, Teil B, Methods in Cell Biology, Bd. 30, Hrsg. Taylor, D. L. & Wang, Y. L., San Diego: Academic Press (1989), Seiten 219–243; Turro, N. J., Modern Molecular Photochemistry, Menlo Park: Benjamin/Cummings Publishing Col., Inc. (1978), Seiten 296–361.

Die folgenden Beispiele dienen der Veranschaulichung nicht, jedoch der Beschränkung.

BEISPIELE

Als eine Stufe zum Verständnis der Eigenschaften von GFP und als Hilfe, um GFPs mit veränderten Eigenschaften entsprechend zu konstruieren, haben wir die dreidimensionale Struktur der S65T-Mutante von GFP aus A. victoria mit einer Auflösung von 1,9 Å bestimmt (R. Heim et al., Nature 373: 664–665 (1995)). Diese Mutante entält auch die ubiquitäre Q80R-Substitution, die zufällig bei der frühen Verbreitung der GFP-cDNA eingeführt worden ist und nicht dafür bekannt ist, eine Wirkung auf die Proteineigenschaften zu haben (M. Chalfie et al., Science 263: 802–805 (1994)).

Histidin-Tag-markiertes S65T-GFP (R. Heim et al., Nature 373: 664–665 (1995)) wurde in JM109/pRSETB in 4 l YT-Brühe plus Ampicillin bei 37°C, 450 Upm und 5 l/min Luftzufuhr überexprimiert. Die Temperatur wurde auf 25°C bei A595 = 0,3 abgesenkt, gefolgt von einer Induktion mit 1 mM Isopropylthiogalactosid für 5 Stunden. Die Zellpaste wurde bei –80°C über Nacht gelagert und dann in 50 mM HEPES, pH 7,9, 0,3 M NaCl, 5 mM 2-Mercaptoethanol, 0,1 mM Phenylmethyl-Sulfonylfluorid (PMSF) resuspendiert, einmal über eine French-Presse bei 10 000 psi durchlaufen gelassen und dann mit 20 K Upm für 45 min zentrifugiert. Der Überstand wurde auf eine Ni-NTA-Agarose-Säule (Qiagen) aufgetragen, gefolgt von einem Waschschritt mit 20 mM Imidazol und dann mit 100 mM Imidazol eluiert. Grüne Fraktionen wurden gepoolt und einer chymotryptischen Proteolyse (Sigma) (1 : 50 w/w) für 22 Stunden bei Raumtemperatur ausgesetzt. Nach Zusatz von 0,5 mM PMSF wurde der Verdau erneut auf die Ni-Säule aufgetragen. Die N-terminale Sequenzierung bestätigte das Vorkommen des korrekten N-terminalen Methionins. Nach Dialyse gegen 20 mM HEPES, pH 7,5, und einer Konzentration bei A490 = 20 wurden stäbchenförmige Kristalle bei Raumtemperatur in hängenden Tropfen, die 5 &mgr;l Protein und 5 &mgr;l Vertiefungslösung, 22–26% PEG 4000 (Serva), 50 mM HEPES, pH 8,0–8,5, 50 mM MgCl2 und 10 mM 2-Mercaptoethanol enthielten, innerhalb von 5 Tagen erhalten. Die Kristalle waren 0,05 mm breit und bis zu 1,0 mm lang. Die Raum-Gruppe beträgt P212121 mit a = 51,8, b = 62,8, c = 70,7 Å, Z = 4. Es wurden zwei Kristallformen von Wildtyp-GFP, die mit der gegenwärtigen Form nicht verwandt sind, von M. A. Perrozo, K. B. Ward, R. B. Thompson & W. W. Ward., J. Biol. Chem. 203, 7713–7716 (1988), beschrieben.

Die Struktur von GFP wurde durch multiples isomorphes Ersetzen und durch unregelmäßige Streuung (Tabelle E), Lösungsmittel-Abflachung, Phasenkombination und einer kristallographischen Verfeinerung bestimmt. Das am bemerkenswerteste Merkmal der Faltung von GFP ist ein 11-strängiges &bgr;-Faltblatt, das eine einzelne zentrale Helix umwickelt (1A und 1B), wobei jeder Strang aus etwa 9–13 Resten besteht. Das Blatt bildet einen beinahe perfekten Zylinder mit einer Länge von 42 Å und einem Durchmesser von 24 Å. Die N-terminale Hälfte des Polypeptids umfasst drei anti-parallele Stränge, die zentrale Helix und dann drei weitere anti-parallele Stränge, wobei sich der letztere (Reste 118–123) parallel zum N-terminalen Strang (Reste 11–23) befindet. Das Polypeptid-Rückgrat kreuzt dann den "Boden" des Moleküls, um die zweite Hälfte des Blatts in einem 5-strängigen Greek-Key-Motiv zu bilden. Das obere Ende des Zylinders wird durch drei kurze verformte helikale Segmente eingekapselt, während ein kurzes, sehr verformtes helikales Segment den Boden des Zylinders einkapselt. Die Wasserstoffbindung der Hauptkette, welche die Oberfläche des Zylinders durchzieht, ist sehr wahrscheinlich für die ungewöhnliche Stabilität des Proteins gegenüber einer Denaturierung und Proteolyse verantwortlich. Es gibt keine großen Segmente des Polypeptids, die ausgeschnitten werden könnten, während die Intaktheit der Schale um das Chromophor bewahrt bleibt. Es würde daher schwierig erscheinen, GFP neu zu konstruieren, um dessen Molekulargewicht mit einem großen Prozentsatz zu reduzieren (J. Dopf & T. M. Horiagon, Gene 173: 39–43 (1996)).

Die p-Hydroxybenzylidenimidazolidinon-Chromophore (C. W. Cody et al., Biochemistry 32: 1212–1218 (1993)) wird vollständig vom Großteil des Lösungsmittels geschützt und ist in dem Molekül zentral lokalisiert. Die vollständige und vermutlich starre Einkapselung ist vermutlich für die kleine Stokes-Verschiebung (d. h. der Wellenlängenunterschied zwischen den Anregungs- und Emissionsmaxima), die hohe Quantenausbeute an Fluoreszenz, dem Unvermögen von O2, den angeregten Zustand zu löschen (B. D. Nageswara Rao et al., Biophys. J. 32: 630–632 (1980)) und die Resistenz der Chromophore gegenüber einer Titration des externen pH's (W. W. Ward, Bioluminescence and Chemiluminescence (M. A. DeLuca und W. D. McElroy, Hrsg.), Academic Press, Seiten 235–242 (1981); W. W. Ward & S. H. Bokman, Biochemistry 21: 4535–4540 (1982); W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982)) verantwortlich. Es ermöglicht einem auch, gedanklich zu erfassen, warum eine Fluorophoren-Bildung ein spontaner intramolekularer Prozess sein sollte (R. Heim et al., Proc. Natl. Acad. Sci. USA 91: 12501–12504 (1994)), da es schwierig ist, sich vorzustellen, wie ein Enzym Zugang zum Substrat gewinnen könnte. Die Ebene der Chromophore ist etwa senkrecht (60°) zu der Symmetrieachse des umgebenden Blatts. Eine Seite der Chromophore befindet sich gegenüber einer überraschend großen Höhle, die ein Volumen von etwa 135 Å3 einnimmt (B. Lee & F. M. Richards, J. Mol. Biol. 55: 379–400 (1971)). Die atomaren Radien entsprechen denen, die Lee & Richards mit Hilfe des Programms MS, mit einem Sondenradius von 1,4 Å berechnet haben (M. L. Connolly, Science 221: 709–713 (1983)). Die Höhle weitet sich nicht durch den Großteil des Lösungsmittels aus. Es befinden sich vier Wassermoleküle in der Höhle und bilden eine Kette von Wasserstoffbindungen, welche die verdeckten Seitenketten von Glu222 und Gln69 verbinden. Man würde erwarten, dass eine solch große Höhle, wenn sie nicht besetzt ist, das Protein um mehrere kcal/mol destabilisiert (S. J. Hubbard et al., Protein Engineering 7: 613–626 (1994); A. E. Eriksson et al., Science 255: 178–183 (1992)). Ein Teil des Volumens der Höhle könnte die Konsequenz der Kompartitierung sein, die auf eine Zyklisierung und Dehydrations-Reaktionen zurückzuführen ist. Die Höhle könnte auch vorübergehend das Oxidationsmittel beherben, vermutlich O2 (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995); R. Heim et al., Proc. Natl. Acad. Sci. USA 91: 12501–12504 (1994); S. Inouye & F. I. Tsuji, FEBS Lett. 351: 211–214 (1994)), das die &agr;-&bgr;-Bindung von Tyr66 dehydrogeniert. Die Chromophore, die Höhle und die Seitenketten, die mit der Chromophore in Kontakt sind, sind in 2A gezeigt und ein Teil der endgültigen Elektronendichte-Karte ist in diesem Bereich in 2B.

Die gegenüberliegende Seite der Chromophore ist gegen mehrere aromatische und polare Seitenketten gepackt. Von besonderem Interesse ist das aufwendige Netzwerk von polaren Interaktionen mit der Chromophore (2C). His148, Thr203 und Ser205 bilden Wasserstoffbindungen mit der phenolischen Hydroxylgruppe; Arg96 und Gln94 interagieren mit der Carbonylgruppe des Imidazolidinonrings und Glu222 bildet eine Wasserstoffbindung mit der Seitenkette von Thr65. Zusätzliche polare Interaktionen wie Wasserstoffbindungen an Arg96 von der Carbonylgruppe von Thr62 und der Carbonylgruppe der Seitenkette von Gln183 stabilisieren vermutlich das verborgene Arg96 in dessen protonierter Form. Die verborgene Ladung wiederum legt nahe, dass eine teilweise negative Ladung auf dem Sauerstoff der Carbonylgruppe des Imidazolidinonrings der deprotonierten Fluorophore vorhanden ist, was kürzlich vorgeschlagen worden ist (W. W. Ward., Bioluminescence and Chemiluminescence (M. A. DeLuca und W. D. McElroy, Hrsg.), Academic Press, Seiten 235–242 (1981); W. W. Ward & S. H. Bokman, Biochemistry 21: 4535–4540 (1982); W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982)). Arg96 ist vermutlich für die Bildung der Fluorophore essentiell und kann dazu beitragen, den anfänglichen Ringschluss zu katalysieren. Schließlich zeigt Tyr145 eine typische stabilisierende Edge-Face-Interaktion mit dem Benzylring. Trp57, das einzige Tryptophan in GFP, ist 13 Å bis 15 Å von der Chromophore entfernt und die langen Achsen der zwei Ringsysteme sind beinahe parallel. Dies zeigt, dass ein effizienter Energietransfer zum Letzteren erfolgen sollte und erklärt, warum keine getrennte Tryptophan-Emission beobachtbar ist (D. C. Prasher et al., Gene 111: 229–233 (1992). Die zwei Cysteine in GFP, Cys48 und Cys70, liegen 24 Å auseinander, zu weit, um eine Disulfidbrücke auszubilden. Von einem solchen Reagenz, 5,5'-Dithiobis(2-nitrobenzolsäure), ist berichtet worden, dass es GFP markiert und dessen Fluoreszenz löscht (S. Inouye & F. I. Tsuji, FEBS Lett. 351: 211–214 (1994)). Diese Wirkung ist auf das Erfordernis einer freien Sulfhydrylgruppe zurückzuführen, könnte aber auch ein spezifisches Löschen durch den 5-Thio-2-nitrobenzoatrest widerspiegeln, der an Cys48 gebunden sein würde.

Obwohl die Elektronendichte-Karte bei den meisten Teilen mit der vorgeschlagenen Struktur der Chromophore in der cis[Z-]-Konfiguration übereinstimmt (D. C. Prasher et al., Gene 111: 229–233 (1992); C. W. Cody et al., Biochemistry 32: 1212–1218 (1993)), ohne dass es einen Beweis für eine substantielle Fraktion des gegenteiligen Isomers um die Doppelbindung der Chromophore gibt, werden verschiedene Merkmale bei > 4 &sgr; bei der endgültigen (F0-Fc)Elektronendichte-Karte festgestellt, die entweder als Darstellung des intakten, nicht-zyklisierten Polypeptids oder eines Carbinolamins interpretiert werden können (Einfügung in 2C). Dies legt nahe, dass eine signifikante Fraktion, vielleicht mehr als 30% der Moleküle in dem Kristall, keine finale Dehydrations-Reaktion durchgemacht haben. Eine Bestätigung, die für eine unvollständige Dehydration spricht, stammt aus der Elektrospray-Massenspektrometrie, die in konsistenter Weise zeigt, dass die Durchschnittsmassen sowohl des Wildtyp- als auch des S65T-GFP (31086 ± 4 bzw. 31099,5 ± 4 Da) um 6–7 Da größer sind als für die vollständig ausgereiften Proteine vorhergesehen (31079 bzw. 31093 Da). Eine solche Diskrepanz könnte durch eine 30–35%ige molare Fraktion von Apoprotein oder Carbinolamin mit einem 18 oder 20 Da höheren Molekulargewicht erklärt werden. Die natürliche Anreicherung von 13C und 2H und die begrenzte Auflösung des für diese Messungen verwendeten Hewlett-Packard 5989B-Elektrospray-Massenspektrometers erlauben keine Auflösung der individuellen Spitzen, sondern ergeben eine durchschnittliche Massenspitze mit einer vollen Breite bei einem Halbmaximum von etwa 15 Da. Die gezeigten Molekulargewichte umfassen den His-Tag, der die Sequenz MRGSHHHHHH GMASMTGGQQM GRDLYDDDDK DPPAEF (SEQ ID NO: 5) aufweist. GFP-Mutanten, welche die Effizienz der Fluorphoren-Reifung erhöhen, könnten etwas hellere Präparationen hervorbringen. In einem Modell für das Apoprotein, liegt die Thr65-Tyr66-Peptidbindung etwa in der &agr;-helikalen Konformation vor, während das Peptid von Tyr66-Gly67 beinahe senkrecht zur Helixachse über dessen Interaktion mit Arg96 zu stehen scheint. Dies stützt weiter die Annahme, dass Arg96 zur Herstellung der Konformation, die für eine Zyklisierung notwendig ist, wichtig ist und möglicherweise auch, um den Angriff von Gly67 auf den Carbonyl-Kohlenstoff von Thr65 zu fördern (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995)).

Die Ergebnisse von früheren Zufalls-Mutagenesen deuteten darauf hin, dass mehrere Aminosäuren-Seitengruppen wesentliche Wirkungen auf die Spektren haben und das Atommodell bestätigt, dass diese Reste in der Nähe der Chromophore liegen. Die Mutationen T203I und E222G haben starke, aber gegensätzliche Auswirkungen auf das Absorptionsspektrum (T. Ehrig et al., FEBS Letters 367: 163–166 (1995)). T203I (mit Wildtyp-Ser65) fehlt die Absorptionsspitze bei 475 nm, die normalerweise der anionischen Chromophore zuzurechnen ist, und zeigt lediglich die Spitze bei 395 nm, von der angenommen wird, dass sie die neutrale Chromophore widerspiegelt (R. Heim et al., Proc. Natl. Acad. Sci. USA 91: 12501–12504 (1994); T. Ehrig et al., FEBS Letters 367: 163–166 (1995)). Tatsächlich ist Thr203 an den Phenol-Sauerstoff der Chromophore über Wasserstoff gebunden, so dass das Ersetzen durch Ile eine Ionisierung des Phenol-Sauerstoffs verhindern sollte. Eine Mutation von Glu222 zu Gly (T. Ehrig et al., FEBS Letters 367: 163–166 (1995)) hat im Wesentlichen dieselbe spektroskopische Wirkung wie das Ersetzen von Ser65 durch Gly, Ala, Cys, Val oder Thr, nämlich die Spitze bei 395 nm und zugunsten einer Spitze bei 470–490 nm zu suprimieren (R. Heim et al., Nature 373: 664–665 (1995); S. Delagrave et al., Bio/Technology 13: 151–154 (1995)). Tatsächlich sind Glu222 und der Rest von Thr65 miteinander über Wasserstoff in der gegenwärtigen Struktur gebunden, vermutlich mit der ungeladenen Carboxylgruppe von Glu222, die als Spender wirkt, für den Sauerstoff der Seitengruppe von Thr65. Die Mutationen E222G, S65G, S65A und S65V würden alle solche H-Bindungen supprimieren. Um zu erklären, warum lediglich das Wildtyp-Protein beide Anregungsspitzen aufweist, wird angenommen, dass Ser65, im Gegensatz zu Thr65, eine Konformation annehmen kann, in der dessen Hydroxylgruppe eine Wasserstoffbindung zur Verfügung stellt, und Glu222 als ein Anion, dessen Ladung dann eine Ionisierung der Chromophore inhibiert, stabilisiert. Die Struktur erklärt auch, warum manche Mutationen neutral erscheinen. Zum Beispiel ist Gln80 ein Oberflächenrest, der weit von der Chromophore entfernt liegt, was erklärt, warum dessen zufällige und ubiquitäre Mutation zu Arg keine offensichtliche intramolekulare spektroskopische Wirkung zu haben scheint (M. Chalfie et al., Science 263: 802–805 (1994)).

Die Entwicklung von GFP-Mutanten mit rot verlagerten Anregungs- und Emissionsmaxima stellt eine interessante Wandlung bei der Protein-Konstruktion dar (A. B. Cubitt et al., Trends Biochem. Sci. 20: 448–455 (1995); R. Heim et al., Nature 373: 664–665 (1995); S. Delagrave et al., Bio/Technology 13: 151–154 (1995)). Solche Mutanten würden auch zum Vermeiden einer zellulären Autofluoreszenz bei kurzen Wellenlängen, für ein gleichzeitiges mehrfarbiges Anzeigen der Aktivität von zwei oder mehreren zellulären Prozessen und zur Bewertung des Fluoreszenz-Resonanz-Energie-Transfers als ein Signal einer Protein-Protein-Interaktion wertvoll sein (R. Heim & R. Y. Tsien, Current Biol. 6: 178–182 (1996)). Ausgiebige Versuche mittels Zufalls-Mutagenese haben das Emissionsmaximum um maximal 6 nm zu den längeren Wellenlängen nach 514 nm verschoben (R. Heim & R. Y. Tsien, Current Biol. 6: 178–182 (1996)); kürzlich beschriebene "nach Rot verlagerte" Mutanten supprimieren lediglich die Anregungsspitze bei 395 nm zugunsten der Spitze bei 475 nm ohne eine signifikante Rot-Verschiebung der Emission bei 505 nm (S. Delagrave et al., Bio/Technology 13: 151–154 (1995)). Da Thr203 benachbart zum Phenol-Ende der Chromophore liegt, mutierten wir es zu polaren aromatischen Resten wie His, Tyr und Trp in der Hoffnung, dass die zusätzliche Polarisierbarkeit von deren &pgr;-Systemen die Energie des angeregten Zustands der benachbarten Chromophore erniedrigen würde. Alle drei Substitutionen verlagerten tatsächlich die Emissionsspitze zu mehr als 520 nm (Tabelle F). Eine besonders wirkungsvolle Mutation war T203Y/S65G/V68L/S72A mit Anregungs- und Emissionsspitzen bei 513 bzw. 527 nm. Diese Wellenlängen unterscheiden sich ausreichend von früheren GFP-Mutanten und sind leicht mittels geeigneter Filtersätze auf einem Fluoreszenzmikroskop unterscheidbar. Der Extinktionskoeffizient, 36 500 Mcm–1, und die Quantenausbeute, 0,63, sind beinahe so hoch wie die von S65T (R. Heim et al., Nature 373: 664–665 (1995)).

Ein Vergleich von GFP aus Aequorea mit anderen Proteinpigmenten ist lehrreich. Leider wurde dessen am nächsten charakterisiertes Homolog, das GFP aus der Weichkoralle Renilla reniformis (O. Shimomura und F. H. Johnson, J. Cell. Comp. Physiol. 59: 223 (1962); J. G. Morin und J. W. Hastings, J. Cell. Physiol. 77: 313 (1971); H. Morise et al., Biochemistry 13: 2656 (1974); W. W. Ward, Photochem. Photobiol. Reviews (Smith, K. C. Hrsg.) 4: 1 (1979); W. W. Ward, Bioluminescence and Chemiluminescence (M. A. DeLuca und W. D. McElroy, Hrsg.), Academic Press, Seiten 235–242 (1981); W. W. Ward & S. H. Bokman, Biochemistry 21: 4535–4540 (1982); W. W. Ward et al., Photochem. Photobiol. 35: 803–808 (1982)) wurde nicht sequenziert oder kloniert, obwohl dessen Chromophore von derselben FSYG-Sequenz abstammt wie in dem Wildtyp-GFP von Aequorea (R. M. San Pietro et al., Photochem. Photobiol. 57: 63S (1993)). Das nächste Analog, für das eine dreidimensionale Struktur verfügbar ist, ist die des photoaktiven Gelb-Proteins (PYP, G. E. O. Borgstahl et al., Biochemistry 34: 6278–6287 (1995)), ein 14-kDa-Photorezeptor aus halophilen Bakterien. PYP absorbiert in dessen nativem Dunkelzustand maximal bei 446 nm und überträgt Licht mit einer Quantenausbeute von 0,64, was in etwa dem langwelligen Absorptionsmaximum bei etwa 475 nm der Wildtyp-GFPs und einer Fluoreszenz-Quantenausbeute von 0,72–0,85 entspricht. Die grundlegende Chromophore in beiden Proteinen ist eine anionische p-Hydroxycinnamylgruppe, die kovalent an das Protein über eine Thioester-Bindung in PYP und einer heterocyclischen Iminolactamgruppe in GFP gebunden ist. Beide Proteine stabilisieren die negative Ladung auf der Chromophore mit Hilfe verborgener kationischer Arginin- und neutraler Glutaminsäuregruppen, Arg52 und Glu46 in PYP und Arg96 und Glu222 in GFP; obwohl die Reste in PYP in der Nähe des Oxyphenylrings liegen, wohingegen sie in GFP näher am Carbonyl-Ende der Chromophore liegen. Jedoch hat PYP eine Gesamt-&agr;-&bgr;-Faltung mit einer angemessenen Flexibilität und Signal-Transduktions-Domänen, um es ihm zu ermöglichen, die zellulären phototaktische Antwort zu vermitteln, während GFP ein viel reguläreres und starres &bgr;-Blatt ist, um eine parasitische Zerstreuung der Energie des angeregten Zustands als Konformations-Bewegungen zu minimieren. GFP ist ein schönes Beispiel, wie eine sichtbar wahrnehmbare und extrem nützliche Funktion, eine effiziente Fluoreszenz, spontan durch eine zusammengehaltene und effiziente Proteinstruktur erzeugt werden kann.

A. Zusammenfassung der Bestimmung der GFP-Struktur

Die Daten wurden bei Raumtemperatur im Gebäudeinneren unter Verwendung von Molecular Structure Corp. R-Achsen II oder San Diego Multiwire Systems (SDMS)-Detektoren (Cu☐) gesammelt und später bei Beamline X4A am Brookhaven National Laboratory an der Absorptionskante (☐ = 0,979 Å) von Selen unter Verwendung von Bild-Platten gesammelt. Die Daten wurden unter Verwendung des HKL-Pakets bewertet (Z. Otwinowski, in Proceedings of the CCP4 Study Weekend: Data Collection and Processing, L. Sawyer, N. Issacs, S. Bailey, Hrsg. (Science and Engineering Research Council (SERC), Daresbury Laboratory, Warrington, UK, (1991)), Seiten 56–62; W. Minor, XDISPLAYF (Purdue University, West Lafayette, Ind., 1993)) oder der SDMS-Software (A. J. Howard et al., Meth. Enzymol. 114: 452–471 (1985)). Jeder Datensatz wurde von einem einzelnen Kristall gesammelt. Das Eintauchen von schweren Atomen wurde bei 2 mM in Stammflüssigkeit für 2 Tage durchgeführt. Die anfänglichen Elektronendichte-Karten basierten auf drei Derivaten schwerer Atome unter Verwendung von in-house-Daten, die dann später mit den Synchrotron-Daten ersetzt wurden. Die EMTS-Differenz-Patterson-Karte wurde nach Prüfung gelöst und dann verwendet, um Differenz-Fourier-Karten der anderen Derivate zu berechnen. Eine "lack of closure"-Verfeinerung der Parameter der schweren Atome wurde unter Verwendung des Protein-Pakets durchgeführt (W. Steigemann, Doktorarbeit, Technische Universität, München, 1974). Die MIR-Karten waren viel schlechter als die Gesamtwertungszahl vermuten lassen würde und es war klar, dass die isomorphen EMTS-Differenzen die Phasenbildung dominierten. Die verstärkte anomale Okupanz für die Synchrotron-Daten stellten eine Teillösung für das Problem bereit. Es ist zu bemerken, dass die Phasenleistung bei den Synchrotron-Daten reduziert war, jedoch blieb die Wertungszahl unverändert. Alle experimentellen Elektronendichte-Karten wurden durch Lösungsmittel-Abflachung unter verwendung des Programms DM der CCP4- (CCP4: A Suite of Programs for Protein Crystallography (SERC Daresbury Laboratory, Warrington WA4 4AD UK, 1979)) Paket bei einem angenommenen Lösungsmittelgehalt von 38% verbessert. Eine Phasenvereinigung wurde mit PHASCO2 des Protein-Pakets unter Verwendung von einem Gewicht von 1 auf dem Atommodell durchgeführt. Die Parameter der schweren Atome wurden danach durch Verfeinerung gegenüber kombinierten Phasen verbessert. Die Modellierung wurde mit FRODO und O fortgeführt (T. A. Jones et al., Acta. Crystallogr. Sect. A 47: 110 (1991); T. A. Jones, in Computational Crystallography D. Sayre, Hrsg. (Oxford University Press, Oxford, 1982), Seiten 303–317) und die kristallographische Verfeinerung wurde mit dem TNT-Paket durchgeführt (D. E. Tronrud et al., Acta Cryst. A 43: 489–503 (1987)). Die Bindungslängen und -winkel der Chromophore wurden unter Verwendung von CHEM3D (Cambridge Scientific Computing) geschätzt. Die endgültige Verfeinerung und Modellierung wurden gegen den X4A-Selenmethionin-Datensatz unter Verwendung von (2F0-Fc)-Elektronendichte-Karten durchgeführt. Die Daten außerhalb der 1,9-Å-Auflösung wurden an diesem Stadium nicht verwendet. Das Endmodell enthält die Reste 2–229, da die terminalen Reste in der Elektronendichte-Karte nicht sichtbar sind und die Seitenketten von mehreren ungeordneten Oberflächenresten weg gelassen wurden. Die Dichte ist bei den Resten 156–158 gering und die Koordinaten dieser Reste sind nicht zuverlässig. Die fehlende Ordnung stimmt mit vorhergehenden Analysen überein, die zeigen, dass die Reste 1 und 233–238 überflüssig sind, dass aber weitere Verkürzungen das Auftreten von Fluoreszenz verhindern können (J. Dopf & T. M. Horiagon, Gene 173: 39–43 (1996)). Das Atommodell wurde in der Protein-Datenbank hinterlegt (Zugangscode 1EMA).

Tabelle E

Statistiken von Diffraktionsdaten
Phasen-Statistiken
Atommodell-Statistiken Protein-Atome 1790 Lösungsmittel-Atome 94 Auflösungsbereich (Å) 20–1,9 Anzahl der Reflektionen (F > 0) 17676 Vollständigkeit 84 R. Faktor(h) 0,175 Durchschnittlicher B-Wert (Å) 24,1
Abweichungen von den Idealwerten Bindungslängen (Å) 0,014 Bindungswinkel (°) 1,9 Zurückgehaltene B-Werte (Å2) 4,3 Ramachandran-Ableger 0

Bemerkungen
  • (a) Vollständigkeit bezeichnet das Verhältnis der beobachteten Reflektionen zu den theoretisch möglichen, ausgedrückt als ein Prozentsatz.
  • (b) Rumpf bezeichnet die höchste Auflösung des Rumpfes, typischerweise 0,1–0,4 Å in der Breite.
  • (c) Rmerge = &Sgr;|i – <I>|/&Sgr;I, worin <I> der Durchschnittswert der einzelnen Beobachtungen der Intensität des I ist.
  • (d) Riso = &Sgr;|IDER – INAT|/&Sgr;INAT
  • (e) Derivate waren EMTS = Ethylquecksilberthiosalicylat (Reste sind mit Cys48 und Cys70 modifiziert), SeMet = Selenmethionin-substituiertes Protein (Met1 und Met233 konnten nicht lokalisiert werden); HgI4-SeMet = Doppelderivat HgI4 auf SeMet-Hintergrund.
  • (f) Phasenleistung = <FH>/<E>, worin <FH> = r. m. s. Streuung der schweren Atome und <E> = "lack of closure".
  • (g) FOM, mittlere Wertezahl
  • (h) Kristallographischer Standard R-Faktor, R = &Sgr;||Fobs| – |Fkalk||&Sgr;|Fobs|
B. Spektrale Eigenschaften von Thr203 ("T203")-Mutanten im Vergleich zu S65T

Die Mutationen F64L, V65L und S72A verbesserten die Faltung von GFP bei 37°C (B. P. Cormack et al., Gene 173: 33 (1996)), führten jedoch nicht zu einer signifikanten Verlagerung der Emissionsspektren.

TABELLE F

Die vorliegende Erfindung stellt neue modifizierte langwellige fluoreszierende Proteine bereit. Während spezifische Beispiele bereitgestellt worden sind, dient die oben genannte Beschreibung der Illustration und soll nicht als beschränkend aufgefasst werden. Dem Fachmann werden die vielen Variationen der Erfindung nach Studium dieser Beschreibung ersichtlich sein. Der Umfang der Erfindung sollte daher nicht im Zusammenhang mit der oben genannten Beschreibung bestimmt werden, sondern sollte unter Bezug auf die anhängenden Ansprüche zusammen mit dem vollen Umfang der Äquivalente bestimmt werden.

SEQUENZPROTOKOLL

Anspruch[de]
  1. Ein Nukleinsäuremolekül, umfassend eine Nukeotidsequenz, die für ein funktionsfähiges manipuliertes fluoreszierendes Protein kodiert, dessen Aminosäuresequenz eine mindestens 80%ige Identität mit der Aminosäuresequenz des grün fluoreszierenden Proteins aus Aeguorea (SEQ ID NO: 2) aufweist und das sich von SEQ ID NO: 2 durch mindestens die Substitution T203X unterscheidet, wobei X eine aromatische Aminosäure ist, die ausgewählt ist aus H, Y, W oder F, wobei das funktionsfähige manipulierte fluoreszierende Protein eine andere fluoreszierende Eigenschaft besitzt als das grün fluoreszierende Protein aus Aequorea.
  2. Das Nukleinsäuremolekül nach Anspruch 1, wobei die Aminosäuresequenz weiterhin eine Substitution von S65 umfasst, wobei die Substitution ausgewählt ist aus der Gruppe bestehend aus S65G, S65T, S65A, S65L und S65C.
  3. Das Nukleinsäuremolekül nach Anspruch 1, wobei die Aminosäuresequenz sich von SEQ ID NO: 2 durch nicht mehr als die Substitutionen

    S65T/T203H;

    S65T/T203;

    S72A/F64L/S65G/T203Y;

    S72A/S65G/V68L/T203Y;

    S65G/V68L/Q68K/S72A/T203Y;

    S65TG/S72A/T203Y; oder

    S65G/S72A/T203W

    unterscheidet.
  4. Das Nukleinsäuremolekül nach einem Beliebigen der Ansprüche 1 bis 3, wobei die Nukleotidsequenz, die für das Protein kodiert, sich von der Nukleotidsequenz von SEQ ID NO: 1 durch die Substitution von mindestens einem Kodon durch ein bevorzugtes Säugetier-Kodon unterscheidet.
  5. Das Nukleinsäuremolekül nach einem Beliebigen der Ansprüche 1 bis 4, das für ein Fusionsprotein kodiert, wobei das Fusionsprotein ein Polypeptid von Interesse und das funktionsfähige manipulierte fluoreszierende Protein umfasst.
  6. Ein Expressionsvektor, umfassend Expressions-Kontrollsequenzen, die wirksam an ein Nukleinsäuremolekül verknüpft sind, das eine Nukleotidsequenz nach einem Beliebigen der Ansprüche 1 bis 5 umfasst.
  7. Eine transformierte Wirtszelle, umfassend einen Expressionsvektor nach Anspruch 6.
  8. Die transformierte Wirtszelle nach Anspruch 7, die eine prokaryotische Zelle oder eine eukaryotische Zelle ist.
  9. Ein funktionsfähiges manipuliertes fluoreszierendes Protein, das von den Nukleinsäuremolekülen nach einem Beliebigen der Ansprüche 1 bis 4 kodiert wird.
  10. Ein mit Fluoreszenz markierter Antikörper, umfassend einen Antikörper, der an ein funktionsfähiges manipuliertes fluoreszierende Protein nach Anspruch 9 gekoppelt ist.
  11. Der mit Fluoreszenz markierter Antikörper nach Anspruch 10, der ein Fusionsprotein ist, wobei das Fusionsprotein den Antikörper umfasst, der mit dem funktionsfähigen manipulierten fluoreszierenden Protein fusioniert ist.
  12. Ein Nukleinsäuremolekül, umfassend eine Nukleotidsequenz, die für einen Antikörper kodiert, der mit einer Nukleotidsequenz fusioniert ist, die für ein funktionsfähiges manipuliertes fluoreszierendes Protein nach Anspruch 9 kodiert.
Es folgen 36 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com