PatentDe  


Dokumentenidentifikation DE10155707B4 16.11.2006
Titel Massenbestimmung für Biopolymere
Anmelder Bruker Daltonik GmbH, 28359 Bremen, DE
Erfinder Decker, Jens, 04109 Leipzig, DE;
Kuhn, Michael, 04827 Machern, DE;
Macht, Marcus, 04318 Leipzig, DE
DE-Anmeldedatum 13.11.2001
DE-Aktenzeichen 10155707
Offenlegungstag 28.05.2003
Veröffentlichungstag der Patenterteilung 16.11.2006
Veröffentlichungstag im Patentblatt 16.11.2006
IPC-Hauptklasse G01N 27/62(2006.01)A, F, I, 20051017, B, H, DE
IPC-Nebenklasse G01N 33/483(2006.01)A, L, I, 20051017, B, H, DE   H01J 49/26(2006.01)A, L, I, 20051017, B, H, DE   

Beschreibung[de]

Die Erfindung betrifft die massenspektrometrische Bestimmung der Massen von Biopolymeren oder ihrer Fragmente ohne die Verwendung von internen oder externen Referenzsubstanzen.

Die Erfindung besteht darin, in solchen Massenspektrometern, die zwar eine stabile Massenkalibrierung aufweisen, aber keine besonders gute Massengenauigkeit erreichen, jede gemessene Masse durch die nächstliegende, für die organische Substanz oder für das Biopolymer wahrscheinlichste Masse zu ersetzen, wodurch im Massenbereich bis etwa 3000 atomaren Masseneinheiten automatisch eine Genauigkeit besser als etwa 0,1 Masseneinheiten erreicht wird. Für Proteine führt diese Genauigkeit zu überraschenden Verbesserungen bei Suchen in Proteinsequenzdatenbanken.

In Massenspektrometern werden die Massensignale in der Regel als Funktion der Scan- oder Flugzeit gemessen. Die Zeiten des Erscheinens dieser Signale werden dann über eine so genannte Kalibrierkurve in Massen umgerechnet. Die Genauigkeit der Massenbestimmung ist nicht immer zufriedenstellend; sie hängt von der Art des Massenspektrometers und vom Ionisierungsverfahren ab. "Genauigkeit" ist hier als Fehlerstreubreite definiert. "Fehler" ist die Abweichung zwischen dem gemessenen und dem wahren Massenwert. Die Verteilung der Fehler um den wahren Wert wird hier als Fehlerstreuung bezeichnet. Ein Maß für die Fehlerstreuung ist die "Standardabweichung", ein anschaulicheres Maß ist die "Fehlerstreuungshalbwertsbreite", gemessen als volle Breite der Fehlerstreuung in halber Maximalhöhe.

Massenspektrometer können immer nur die "Masse pro Ladung" eines Ions messen. Es sei daher vorausgesetzt, dass bei der hier diskutierten Massenbestimmung die Ladung in bekannter Weise ermittelt und auskorrigiert wurde.

Aus dem Stand der Technik sind verschiedene Verfahren bekannt, in denen ein gemessenes Massenspektrum mit virtuell erzeugten oder gemessenen Massenspektren aus Datenbanken verglichen werden, z.B. bei der Bestimmung der Elementzusammensetzung einer Probe (GB 2 308 917 A) oder bei der Identifizierung von Mikroorganismen (WO 01/79523 A2) oder bei der Bestimmung der Aminosäurensequenz eines Proteins aus einem Fragmentionenspektrum (EP 1 047 107 A2).

Durch die Arbeiten von Mathias Mann ist bekannt, dass Peptide und Proteine nicht alle möglichen bruchteiligen Massenwerte annehmen können, sondern sich um Massenmittelwerte konzentrieren, die jeweils um 1,00048 atomare Masseneinheiten auseinanderliegen und eine Verteilungshalbwertsbreite von etwa 0,2 Masseneinheiten haben (Mann, M.: Useful Tables of Possible and Probable Peptide Masses. In: Proceedings of the 43. ASMS Conference on Mass Spectrometry and Allied Topics, Atlanta, Georgia, USA, 1995, Seite 639). Aus den Abständen kann man leicht eine "Mittelwertsgerade" bilden, auf der die Mittelwerte der Verteilungen liegen. Diese Mittelwerte bilden die "wahrscheinlichsten" Massenwerte für Peptidionen.

Diese Kenntnis kann in geeigneten Massenspektrometern zu einer Rekalibrierung und damit zu einer Verbesserung der Massenbestimmung verwendet werden. Voraussetzung ist, dass diese Massenspektrometer eine „glatte" Massenkalibrierkurve besitzen, die sich gut durch eine mathematische Funktion, beispielsweise ein Polynom niedriger Ordnung, angleichen lässt. Wenn nun systematische Fehler der mit ihnen bestimmten Massen auftreten, die auf den Ionisierungsprozess zurückzuführen sind und alle Ionen gleichmäßig betreffen, kann diese Rekalibrierung eingesetzt werden. Ein Beipiel sind MALDI-Flugzeitmassenspektrometer, die eine sehr glatte Kalibrierkurve besitzen, in denen aber durch den Ionisierungsprozess der matrixunterstützten Laserdesorption (MALDI) Schwankungen der Anfangsenergie der Ionen auftreten, die in systematischer Weise auf die Massenbestimmung durchschlagen.

Für diese Rekalibrierung werden zunächst die gemessenen Massen durch die wahrscheinlichsten Massen ersetzt, die sich durch obige Abstände (also durch die „Mittelwertsgerade") ergeben, und durch diese wahrscheinlichsten Massen und die zuhörigen Scanzeiten wird, beispielsweise nach dem Verfahren der minimalen quadratischen Abweichungen, eine bestangeglichene mathematische Kurve hindurchgelegt. Die wahrscheinlichsten Massenwerte werden also wie eine große Anzahl an Referenzmassen behandelt. Diese Kurve stellt dann eine wahrscheinlichste Kalibrierkurve dar, und die gemessenen Massen werden anhand dieser neuerstellten wahrscheinlichsten Kalibrierkurve „rekalibriert". Die Rekalibrierung beseitigt die im Massenspektrometer auftretenden systematischen Fehler.

Neuere Arbeiten haben die Massen der Peptide und ihre Verteilungen genauer untersucht, als es durch die theoretische Vorrausberechnung von M. Mann möglich war. Durch einen virtuellen tryptischen Verdau aller Proteine einer großen Proteinsequenzdatenbank kann man die mittleren Massen aller durch das Enzym Trypsin erzeugten Verdaupeptide und ihre Verteilungshalbwertsbreiten bestimmen. Dabei kommt man auf mittlere Massen mit einem gemittelten Massenabstand von jeweils 1,0045475 atomaren Masseneinheiten, mit einer Verteilungshalbwertsbreite, die bei Masse 1000 bei nur etwa 0,1 Masseneinheiten liegt (S. Gay, P-A. Binz, D.F. Hochstrasser und R. D. Appel, Electrophoresis 1999, 20, 3527-3534). zeigt zwei typische Verteilungen. Die hier gegebene „Mittelwertsgerade" hat eine geringfügig andere Steigung als bei Mann angegeben.

Eine genauere Betrachtung der individuellen mittleren Massen von Peptiden und Proteinen ergibt charakteristische Abweichungen der einzelnen Massenmittelwerte von der „Mittelwertsgeraden". Die Abweichungen weisen im mittleren Teil des Massenbereichs von etwa 300 bis 1400 atomaren Masseneinheiten eine Periode von 14 Masseneinheiten auf; die Abweichungsamplitude dieser Periode nimmt dabei von etwa 60 Millimasseneinheiten (Spitze-Spitze) zu höheren Massen hin ab und verschwindet bei etwa 1400 Masseneinheiten. Jenseits von 3000 Masseneinheiten gibt es statistische Schwankungen der individuellen Massenmittelwerte, die zu höheren Massen immer größer werden, aber keine erkennbare Periodizität besitzen.

Diese individuellen Abweichungen der Peptidmassen können für eine genauere Rekalibrierung benutzt werden, indem die individuellen Mittelwerte für die Massenzahlen, nicht die Werte der „Mittelwertsgeraden", für das Rekalibrierungsverfahren benutzt werden. („Massenzahl" ist hier die Nukleonenzahl, also die Anzahl von Protonen und Neutronen zusammengezählt).

In ähnlicher Weise kann man für andere Klassen von Biopolymeren mittlere Werte für die Massen durch Kombinatorik berechnen oder durch virtuellen Verdau ermitteln. Solche Klassen können beispielsweise die Glucoproteine, Lipoproteine, Saccharine oder DNA umfassen. Es können aber auch die Proteine von Säugetieren und die Proteine von Bakterien als zwei verschiedene Klassen betrachtet werden, da die Proteine von Bakterien andere prozentuale Anteile der verschiedenen Aminosäuren und damit ein anderes mittkeres Nukleonengewicht aufweisen. Die Biopolymere ausgewählter Klassen haben um die individuellen Massenmittelwerte herum zum Teil Verteilungsbreiten, die noch schmaler als die der Proteine sind, also noch genauer sind.

Die angegebenen Verfahren der Rekalibrierung können jedoch nicht verwendet werden, wenn das Massenspektrometer statistische oder pseudostatistische Fehlerstreuungen der Massenbestimmung zeigt. Unter „pseudostatistischen Fehlerstreuungen" sollen hier solche Massenfehler verstanden werden, die zwar von Aufnahme zu Aufnahme reproduzierbar sind, aber doch stets größere Differenzen zwischen gemessenen und wahren Massen zeigen, die längs der Massenskala kurzabständig abwechselnd positiv wie auch negativ sind, so dass sie nicht durch eine glatte Kalibrierkurve dargestellt werden können.

Zu den Massenspektrometern dieser Art gehören beispielsweise die Hochfrequenz-Ionenfallenmassenspektrometer, bei denen die pseudostatistischen Abweichungen möglicherweise durch winzige Regelschwankungen des Hochfrequenz-Scans verursacht werden. Andere Ursachen sind aber auch Einflüsse der Raumladung und der Ordnungsstruktur innerhalb der Ionenwolke auf das Scanverhalten und damit auf die Massenbestimmung.

Es gibt jedoch auch andere Massenspektrometer, die dieses Phänomen statistischer oder pseudostatistischer Massenabweichungen aufweisen.

Aufgabe der Erfindung

Es ist die Aufgabe der Erfindung, für Massenspektrometer mit Streuungshalbwertsbreiten der statistischen Fehler von mehr als einem Zwanzigstel Masseneinheiten eine Genauigkeitsverbesserung für die Massenbestimmung in bestimmten Substanzklassen, vorzugsweise in Klassen von Biopolymeren, zu erzielen. Es soll damit beispielsweise erreicht werden, dass Suchen nach der Identität von Proteinen, die mit den Massenwerten der Verdaupeptide oder deren Fragmenten in Proteinsequenz- oder Genomdatenbanken durchgeführt werden, schneller und mit höherer Identifizierungssicherheit verlaufen.

Diese Aufgabe wird gelöst durch ein Verfahren nach Anspruch 1 und ein Massenspektrometer nach Anspruch 15.

Kurze Beschreibung der Erfindung

Die Erfindung besteht darin, dass für relativ ungenau messende, aber durchaus stabil arbeitende Massenspektrometer die gemessenen Massenwerte einfach durch die wahrscheinlichsten Massenwerte für die untersuchte Substanzklasse ersetzt werden. Wenn die Fehlerstreubreite der massenspektrometrischen Massenbestimmung größer ist als die etwa halbe Verteilungshalbwertsbreite der möglichen Massenwerte bei einer Massenzahl für ein bestimmte Klasse von Biopolymeren, wird automatisch eine Verbesserung der Massengenauigkeit erreicht. Die Fehlerstreubreite der Ergebnisse sinkt auf Werte unter einem Zehntel Masseneinheit.

Es können dabei bereits die Massenwerte der „Mittelwertsgeraden" eine erhebliche Verbesserung bringen. Die Berechnung der wahrscheinlichsten Masse folgt hier einer sehr einfachen Geradengleichung, die mit hoher Geschwindigkeit durchgeführt werden kann. Es können aber auch – wenn bekannt – die in einer Tabelle gespeicherten massenindividuellen Mittelwerte verwendet werden, die durch Verfahren der mathematischen Kombinatorik, durch virtuellen Verdau oder durch virtuelle Fragmentierung der Substanzen einer Datenbank gewonnen werden können. Diese massenindividuellen Mittelwerte bringen nochmals eine erhebliche Verbesserung.

Beispielsweise kann man für Massenspektren von Verdaupeptiden der Proteine entweder einen virtuellen Verdau der in einer Datenbank gespeicherten bekannten Proteine vornehmen, oder auch die Kombinationen aus einer großen Zahl von Aminosäuren berechnen und daraus die Mittelwerte und Verteilungen bei den einzelnen Massenzahlen bestimmen. Für die Kombinationen kann man die statistischen Häufigkeiten der Aminosäuren und sogar die durch das Verdauenzyms bewirkten Eigenschaften der Peptide berücksichtigen. Für den virtuellen Verdau kann man verschiedene Verdauenzyme verwenden, die das Protein an verschiedenen Stellen schneiden.

Für die Aufnahme von Tochterionenspektren fragmentierter Ionen kann man die Massenwerte durch virtuelle Fragmentierung nach den bekannten Fragmentierungsregeln oder auch wieder durch Kombinatorik ermitteln. Die Fragmentmassen haben, besonders im unteren Massenbereich und besonders für die so genannten b-Fragmente, etwas andere Mittelwerte als die Verdaupeptidionen.

Statt eine Tabelle mit gespeicherten Mittelwerten für die Massen zu verwenden, kann man auch die Periodizität und ihre abnehmende Abweichungsamplitude (wie bei Proteinen) durch eine mathematische Gleichung annähern und diese Gleichung zur Berechnung der wahrscheinlichsten Massenmittelwerte benutzten. Die Gleichung kann dabei auch nur einen Teil des Massenbereichs umfassen.

Sind die statistischen oder pseudostatistischen Fehlerstreuungen der Massen, die durch das Massenspektrometer erzeugt werden, nur relativ klein und machen nur einen Teil der Schwankungen aus, wobei ein Rest der Schwankungen der wahren Massen auf die gemessenenen Schwankungen durchschlägt, so ist auch eine Korrektur der gemessenenen Massen möglich. Es wird dabei zunächst die gemessene Masse durch den wahrscheinlichsten Massenwert, also den individuellen Mittelwert, ersetzt, dann aber mit einem vorher festgelegten Bruchteil der Differenz zwischen diesem und dem gemessenen Wert wieder in Richtung auf den gemessenenen Wert hin korrigiert. Dieser Bruchteil kann auch massenabhängig definiert werden. Dieses Verfahren stellt mathematisch die Verwendung eines gewichteten Mittelwertes aus gemessenem Massenwerte und wahrscheinlichstem Massenwert dar.

Neigt das Massenspektrometer auch noch zu systematischen Fehlern, beispielsweise durch Temperaturdriften, so können diese systematischen Fehler vor Anwendung der Erfindung durch eine Rekalibrierung, wie sie oben geschildert wurde, ausgemerzt werden.

Bei Proteinen führen die mit dieser Erfindung erreichten Verbesserungen der Massengenauigkeit zu überraschenden Verbesserungen der Identitätssuche durch die herkömmlichen Suchmaschinen in Proteinsequenz-, EST- oder Genomdatenbanken. Die Suche ist häufig außerordentlich viel schneller, führt aber auch zu wesentlich sichereren Ergebnissen durch größere Gütezahlenabstände zu den nächstbesten Ergebnissen für andersartige Proteine. Die von diesen Suchmaschinen erreichten Resultate reagieren anscheinend besonders scharf auf eine Verbesserung der Suchtoleranz von Werten größer als eine halbe Masseneinheit zu Werten von etwa 0,2 bis 0,3 Masseneinheiten, vermutlich weil damit das fälschliche Einfangen von Peptiden mit Nachbarmassen verhindert wird.

Kurze Beschreibung der Abbildungen

zeigt eine Häufigkeitsverteilung aller Peptidmassen des Massenbereichs von 902 bis 904 atomaren Masseneinheiten, die durch einen vituellen tryptischen Verdau der SwissProt-Proteinsequenzdatenbank erhalten werden (S. Gray et al., oben zitiert). Aus diesen Werten lässt sich ein Mittelwert und eine Verteilungsbreite bilden. Man sieht, dass die Verteilungshalbwertsbreite nur etwa 0,1 atomare Masseneinheiten breit ist und dass gut x des Massenbereiches leer ist, das heißt, hier können überhaupt keine Peptidmassen vorkommen. Für jede Massenzahl, das heißt, für jede ganzzahlige Nukleonenanzahl, gibt es eine solche Verteilung, die die mittlere Massen der Nukleonen und die Streung der Nukleonenmassen wiedergibt. Die Streuung der Nukleonenmassen rührt von den verschiedenen Kernbindungsenergien der Elemente und ihrer Isotope und der daraus resultierenden Molekulargewichte her. Nur näherungsweise haben alle Nukleonen eine Masse von je einer atomaren Masseneinheit. (Nukleonen sind Protonen oder Neutronen, deren Massen aber beim Zusammenschluss im Kern der Elemente einen Massenschwund erleiden, der der Bindungsenergie im Kern des Atoms entspricht. Diese Bindungsenergien bewirken die verschiedenen von der Ganzzahligkeit abweichenden Isotopengewichte der Elemente.)

zeigt die Massenabweichungen von Verdaupeptiden, die durch virtuellen tryptschen Verdau der SwissProt-Datenbank gewonnen wurden, im Ausschnitt von Masse 600 bis 1200 atomaren Masseneinheiten (eigene Arbeiten). Die Massenabweichungen sind Abweichungen von der Massenmittelwertsgeraden nach M. Mann. Es ist die Periode über jeweils 14 Masseneinheiten sichtbar, die zu höheren Massen hin verebbt. Die Abbildung ist ein Ausschnitt aus .

zeigt die Massenabweichungen gegenüber der Massenmittelwertsgeraden im Massenbereich von 1 bis 7500 atomaren Masseneinheiten. Im unteren Massenbereich unterhalb von Masse 1400 atomaren Masseneinheiten (siehe ) herrscht eine Periodizität über jeweils 14 Masseneinheiten, im Massenbereich oberhalb von 3000 Masseneinheiten herrschen nichtperiodische, statistische Abweichungen vor. Für die Messung an Verdaupeptiden ist in der Regel nur der Massenbereich bis 3000 Masseneinheiten interessant, Messungen oberhalb dieses Bereichs finden eher selten statt. Aber auch hier können mit dem erfindungsgemäßen Verfahren Verbesserungen der Massengenauigkeit erzielt werden.

Die in den Abbildungen verwendete Masseneinheit Da (Dalton) ist eine veraltete Einheit, die aber in der Molekularbiologie eine lebhafte Wiederkehr erlebt. Obwohl ursprünglich anders definiert, wird sie inzwischen wie die in Deutschland als „nichtkohärente SI-Einheit" gesetzlich vorgegebene „vereinheitlichte atomare Masseneinheit" (Abkürzung u) verwendet.

Bevorzugte Ausführungsformen

Es werde hier zunächst von Hochfrequenz-Ionenfallenmassenspektrometern für die Proteinanalytik ausgegangen. Diese Geräte sind besonders gut geeignet für Proteinanalysen, da sie sich über Elektrosprüh-Ionenquellen mit flüssigchromatographischen Trennverfahren für die Verdaupeptide aus Proteingemischen koppeln lassen und weil sie in der Lage sind, über ein so genanntes Tandem-in-Zeit-Verfahren auch Spektren der durch Stoßfragmentierung in der Falle erzeugten Tochter- oder sogar Enkelionen zu messen. Die Tochterionen werden auch Fragmentionen genannt. Die in der Ionenfalle durch niederenergetische Stöße erzeugten Fragmente sind besonders gut für Protein-Identifizierungen durch Suchen in Proteinsequenzdatenbanken geeignet.

Die handelsüblichen so genannten Suchmaschinen (Programmsysteme) für diese Suchen arbeiten umso besser, je enger die Massentoleranz gewählt werden kann, je enger also die wahre Masse des Peptids oder Peptidfragments durch die gemessene Masse und eine vorgegebene Toleranz vorgegeben werden kann. „Besseres Arbeiten" wird hier zum einen durch die Güteziffern der Suchmaschine für die gefundenen Proteine angezeigt, andererseits durch die Zeitdauer, die die Suche benötigt. Besonders bei Suchen im Genom, bei dem ja in allen drei Leserahmen gesucht werden muss, ist die Zeitdauer ausschlaggebend.

Nun sind leider die in Ionenfallenmassenspektrometern erzielbaren Massengenauigkeiten nicht überwältigend gut. Die Gründe dafür sind nicht im Einzelnen bekannt, mögen aber darin liegen, dass während des Scannens der Hochfrequenzspannung, die bis zu einigen Zehn Kilovolt Spannung führt, winzige Regelschwingungen auftreten können, die zwar von Scan zu Scan reproduzierbar sind, aber eben winzige positive und negative Abweichungen in der Größenordnung von 0,01 % von der gewünschten linearen Scankurve ergeben können. Und 0,01 % sind bei Masse 1000 bereits 0,1 atomare Masseneinheiten, bei Masse 3000 bereits 0,3 Masseneinheiten. Diese Abweichungen der Hochfrequenzspannung vom Sollwert entsprechen direkt den Abweichungen der gemessenen Massen. Die Regelschwingungen lassen sich auch nicht durch eine mathematisch angefittete Funktion ausgleichen, man müsste dazu ein Polynom so hoher Ordnung verwenden, dass die Fehler durch den mathematischen Ausgleich größer würden als die schon jetzt vorhandenen Fehler.

Weitere Ursachen für die statistischen Fehler in der Massenbestimmung mit Ionenfallen sind aber auch Einflüsse der Raumladung und der Ordnungsstruktur innerhalb der Ionenwolke auf das Scanverhalten und damit auf die Massenbestimmung. Es ist bekannt, dass die Ionen innerhalb der Ionenwolke eine geordnete, quasikristalline Anordnungsstruktur annehmen können, die Ionen innerhalb der Wolke festhält, so dass ein Überschuss an Energie aufzuwenden ist, um die Ionen auszuwerfen. Die Ornungstrukturen treten auf, wenn im Spektrum freie Bereiche sind, also über eine gewisse Zeit keine Ionen während des Scanvorgangs ausgeworfen werden. Die Wolke wird dann nicht durch die schwingenden Ionen „umgerührt" und kann so auskristallisieren.

Die durch Elektrosprühen erzeugten Peptidionen sind vorwiegend ein-, zwei- und dreifach geladen. Es ist zwar mit einigen Suchmaschinen möglich, mit diesen Spektren direkt zu suchen; um die Suche aber erträglich schnell zu machen, sind die Spektren zunächst durch eine so genannte Dekonvolution auf einfach geladene Ionenmassen umzurechnen. Diese Umrechnung mittelt zwar in der Regel zwischen den verschiedenen Massenberechnungen, kann aber auch nochmals zu einer leichten Verschlechterung der Genauigkeit beitragen.

Ionenfallenmassenspektrometer zeigen zwar statistische Massenabweichungen mit einer Fehlerstreubreite in einer störenden Größenordnung, ergeben aber andererseits sehr stabile Ergebnisse. Man kann sich im Rahmen eines Massenfehlers von etwa 0,3 Masseneinheiten sehr gut auf die Ergebnisse verlassen.

Für eine Verbesserung der Massengenauigkeit kommt die hier vorgestellte Erfindung zum Zuge. Die aus den gemessenen Ionensignalen gewonnenen Massenwerte für die Ionenmassen werden jetzt einfach durch die wahrscheinlichsten Massenwerte für diese Substanzklasse ersetzt. Da für Biopolymere die Streuung aller möglichen Einzelmassen um den Mittelwert herum eine sehr kleine Halbwertsbreite von unter einem Zehntel einer Masseneinheit besitzt, verbessert sich die hohe Fehlerstreubreite des Massenspektrometers auf diese von der Natur vorgegebene Verteilungsbreite (siehe ). Die Verbesserung rührt also daher, dass die Substanzklasse der vermessenen Substanzen bekannt ist und dass in dieser Substanzklasse andere Massenwerte nicht vorkommen können.

Wenn man durch Kenntnis der Baupläne weiß, dass in einer Siedlung drei Typen von Häusern mit genau 7,80 Metern, genau 9,00 Metern und genau 10,20 Metern Breite gebaut worden sind und ein Abschreiten einer Hausfront etwa 8 Meter ergibt, dann weiß man sicher, dass es sich hier um ein Haus mit 7,80 Metern Breite handelt. Das Wissen rührt von der Kenntnis her, dass die Bauleute mit Sicherheit genauer gebaut haben, als es der Messmethode des Abschreitens entspricht, aber dass das Abschreiten auch wiederum nicht so unsicher ist, dass ein Fehler größer als 0,3 Meter auftreten sollte.

Da jetzt die Massentoleranzwerte für die Suchmaschinen, die für diese Massenspektrometer bisher eine volle Masseneinheit betragen mussten, auf etwa 0,3 Masseneinheiten zurückgenommen werden können, springen die von den Suchmaschinen für ihre Fundsachen ausgegebenen Güteziffern (Scores) um Faktoren von 2 bis 3 in die Höhe. Insbesondere wird der Abstand der Güteziffern zu den nächsten, nichtverwandten Proteinen deutlich größer, das heißt, es ist die Gefahr vermindert, falsche Positividentifizierungen zu erhalten. Die Identifizierung wird sicherer.

In der Praxis ergibt sich bereits eine große Verbesserung der Genauigkeit der Massenbestimmung, wenn man die gemessenen Massen im Falle der Proteine durch die Massenwerte der Mittelwertsgeraden nach M. Mann ersetzt. Die Mittelwertsgerade für Proteine ist nach M. Mann durch einen Abstand der Einzelmassenmittelwerte von 1,00048 atomare Massen charakterisiert. Für andere Klassen von Biopolymeren kann man andere Mittelwertsgeraden angeben. Die Abstände der Mittelwertsgeraden ergeben sich sehr einfach durch die gemittelte Zusammensetzung der Biopolymerklasse aus den Elementen, multipliziert mit den präzisen Molekulargewichten der Elemente, geteilt durch die gemittelte Anzahl der Nukleonen in der gemittelten Zusammensetzung. Die Abstände entsprechen dem gemittelten Nukleonengewicht für diese Klasse von Biopolymeren. (Nukleonen sind die Protonen und Neutronen zusammengezählt).

Die Massenbestimmung der Biomoleküle kann demgegenüber noch genauer werden, wenn man die individuellen Mittelwerte der einzelnen Massen einsetzt, die sich durch Untersuchungen an geeigneten Datenbanken – beispielsweise durch einen virtuellen tryptischen Verdau mit anschließender statistischer Auswertung aller Verdaumassen – ergeben. Diese individuellen Massenmittelwerte können beispielsweise in einer Speichertabelle abgelegt sein. Diese weisen für Proteine im unteren Massenbereich die Periodizität von 14 Masseneinheiten für Abweichungen von der Mittelwertsgeraden auf, wie in gezeigt.

Individuelle Massenmittelwerte können auch durch mathematische Kombinatorik erhalten werden. Für Proteine und Peptide und besonders auch für Peptidfragmentionen, die für die Aufnahme von Tochterionenspektren durch Stoßfragmentierung oder andere Fragmentierungsarten erzeugt werden, können die individuellen Massenmittelwerte durch große Anzahlen von Kombinationen aus den möglichen 20 Aminosäuren erhalten werden. Dabei können insbesonders die relativen Häufigkeiten der Aminosäuren in der Natur, im Grenzfall in der untersuchten Spezies, verwendet werden. Für andere Arten von Biopolymeren werden deren Bausteine für die Kombinatorik verwendet.

Für Tochterionenspektren sind nicht die Verdaupeptidmassen, sondern die Massen der aus ihnen gewonnenen Fragmentionen maßgebend. Die Fragmentierung der Peptide gehorcht relativ einfachen Regeln. Diese Regeln und die heute verwendete Nomenklatur der Peptidfragmente als a-, b-, c-, x-, y-, z-, i-, d-, und w-Fragmente sind in der Arbeit Fohlmann et al. (1988) Int. J. Mass Spectrom. a. Ion Proc. 86, 137, zu finden. In Ionenfallenmassenspektrometern kommen dabei praktisch nur b- und y-Fragmente vor, in sehr seltenen Fällen auch a-Fragmente.

Die mittleren Massenwerte der Fragmentionen können nun wiederum durch virtuelle Fragmentierung einer großen Anzahl von virtuell erzeugten Verdaupeptiden einer Proteinsequenzdatenbank ermittelt werden, aber auch durch mathematische Kombinatorik der Aminosäuren mit Berücksichtigung der Fragmentierungregeln. So haben b-Fragmentionen ein leicht anderes mittleres Nukleonengewicht als y-Fragmentionen. Bei der mathematischen Kombinatorik ist auch zu berücksichtigen, dass einige Aminosäuren auch in veränderter Form vorkommen können, beispielsweise Methionin im Oxidationszustand. Es zeigt sich, dass die Massenmittelwerte im Massenbereich oberhalb von etwa 400 atomaren Masseneinheiten mit denen der Verdaupeptide praktisch übereinstimmen. Im unteren Massenbereich ergeben sich Besonderheiten:

  • a) unterhalb der Masse 68 atomare Masseneinheiten gibt es keine Peptid- oder Fragmentmassen;
  • b) im Bereich von 68 bis etwa 130 atomaren Masseneinheiten gibt es nur die so genannten Immonium-Ionen (i-Fragmente), die jeweils nur von der C-terminalen Aminosäure gebildet werden und nur bei relativ wenigen Massenzahlen vorkommen können;
  • c) bis in den Massenbereich von etwa 400 Masseneinheit hinauf ergeben sich immer wieder Lücken, das heißt, es gibt Massen, bei denen überhaupt keine Fragmentmasse vorkommen kann; die Lücken werden geringer in ihrer Anzahl, wenn man auch seltenere Veränderungen der Aminosäuren wie Methylierung oder Amidierung mit einbezieht;
  • d) bis in diesen Massenbereich hinein gibt es immer wieder Massen, bei denen nur eine einzige Peptid- oder Peptidfragmentmasse vorkommt;
  • e) nur wenn zwei oder mehrere Massenwerte vorkommen, wird ein Mittelwert gebildet.

Für den erfindungsgemäßen Ersatz der gemessenen Massenwerte durch die wahrscheinlichsten Massenwerte bedeutet das, dass für solche Massen, bei denen nur ein einziger Massenwert vorkommt, der präzise Massenwert statt des normalerweise verwendeten Mittelwerts eingesetzt wird. Das ergibt eine Erhöhung der Massengenauigkeit in diesem Bereich. Für die Lücken wird zweckmäßigerweise der Wert der Mittelwertsgeraden (oder ein Wert, der die Periodizität berücksichtigt) eingesetzt, da man seltene Modifizierungen der Aminosäuren, die diese Masse ergeben, nicht ausschließen kann und dieser Wert nach wie vor der wahrscheinlichste ist.

Für solche Massen, an denen nur zwei Massenwerte existieren, die relativ weit auseinanderliegen, kann man auch beide Werte in einer Tabelle speichern und von einem gemessenenen Wert ausgehend den nächstliegenden Massenwert als Ersatzwert benutzen. Ähnlich kann man vorgehen, wenn es deutlich zwei Schwerpunkte für die Massenverteilung gibt.

Die für Proteine im Bereich bis 1400 Masseneinheiten gefundene Periodizität von 14 Massen ist bei allen Substanzklassen organischer Verbindungen zu finden. Sie beruht auf der Periodizität der stets vorwiegend vorhandenen Kohlenwasserstoffanteile, die nur alle 14 Masseneinheiten volle Sättigung mit Wasserstoff erreichen, wobei die Massen dazwischen nur von ungesättigten Kohlenwasserstoffen gebildet werden können. Es schwankt also der mittlere Wasserstoffanteil. Die gesättigten Kohlenwasserstoffe haben die Formel CnH2n+2, den ungesättigten fehlen einige Paare Wassertoff H2. Da der Wasserstoff mit 1,008 atomaren Masseneinheiten pro Nukleon relativ schwerer ist als der Kohlenstoff (12, 0000 atomare Masseneinheiten mit 12 Nukleonen für das Isotop 12C), sind die gesättigten Kohlenwasserstoffe relativ am schwersten, die ungesättigten dagegen relativ deutlich leichter. Fehlen einem ungesättigten Kohlenwasserstoff beispielsweise 7 Paare Wasserstoff (14 Masseneinheiten), so ist dieser gesättigte Kohlenwasserstoff um 14·0,008 = 0,112 Masseneinheiten leichter als der gesättigte Kohlenwasserstoff gleicher Massenzahl, der eine Methylgruppe CH2 (ebenfalls 14 Masseneinheiten) weniger besitzt. Insbesondere sind Leucin und Isoleucin die wasserstoffreichsten Aminosäuren.

Die Periodizität der Massenabweichungen in solchen Biopolymerklassen, die in unterschiedlichen Verhältnissen auch Stickstoff, Sauerstoff, Phosphor und Schwefel enthalten, verschwindet zunehmend zu höheren Massen hin, weil ein zunehmender Gehalt dieser Elemente zu höheren Massen hin das Massenmaximum der Periodizität verschiebt. Statistisch schwankende Anteile dieser Elemente in verschiedenen Substanzen dieser Klasse führen zu Interferenzen der periodischen Verteilungen und lassen die Periodizität zu hohen Massen hin verebben. Dabei müssen in diesen Substanzklassen nicht immer Anteile an ungesättigten Kohlenwasserstoffen vorhanden sein, der Wasserstoffschwund kann auch durch Ringbildungen (besonders aromatische Ringe) oder durch die Art des Einbaus der anderen Elemente, beispielsweise als Carboxylgruppen, verursacht werden.

Es ist möglich, diese periodischen Schwankungen der Massenmittelwerte gegenüber der Massenmittelwertsgeraden näherungsweise in eine Gleichung zu fassen, und diese Gleichung für die Berechnung des mittleren Massenwertes zu verwenden, der einen gemessenen Wert ersetzen soll.

Das erfindungsgemäße Verfahren unterscheidet sich ganz wesentlich von der eingangs geschilderten Rekalibrierung. Gemeinsam ist beiden Verfahren eine Verbesserung der Massengenauigkeit durch die Kenntnis der gemessenen Biopolymerklasse. Bei der Rekalibrierung wird eine neue, wahrscheinlichste Kalibrierkurve erstellt, mit der dann die gemessenen Massenwerte neu kalibriert werden. Damit erreicht man Genauigkeiten der Massenbestimmung, die wesentlich besser sind als mit der hier vorgestellten erfindungsgemäßen Methode des reinen Werte-Ersatzes. Die Rekalibrierung kann aber nur für Messungen mit dazu geigneten Arten von Massenspektrometern eingesetzt werden.

Das erfindungsgemäße Verfahren ist dagegen sehr viel einfacher, kann aber nur bei anderen, ungenauer messenden Klassen von Massenspektrometern mit relativ hoher Fehlerstreubreite für die Massenbestimmung mit Erfolg eingesetzt werden. Es ist ein bloßer Ersatz der gemessenen Massenwerte durch die für die Substanzklasse wahrscheinlichsten Werte.

Statt des Ersatzes der gemessenen Massenwerte durch die wahrscheinlichsten kann auch eine etwas abweichende Methode verwendet werden: es kann ein Ersatz durch gewichtete Mittelwerte vorgenommen werden, wobei die gewichteten Mittelwerte sich aus den gemessenen Massenwerten und den wahrscheinlichsten Massenwerten zusammensetzen. Dieser Ersatz kommt immer dann in Frage, wenn die Streuung der Massenwerte, die vom Massenspektrometer ermittelt wurden, nicht nur statistische Abweichungen aufweisen, sondern wenn die Streuung der wahren Massen noch durchschlägt. Tragen die wahren Massen nur einen kleinen Teil bei, kann beispielsweise ein Mittelwert benutzt werden, der aus x wahrscheinlicher Masse und R gemessener Masse zusammengesetzt ist. Ist der Einfluss der wahren Massen stärker, so kann auch ein hälftiger Mittelwert gebildet werden. Die Gewichtswahl für die Mittelwertsbildung hängt also davon ab, wie stark die wahre Masse die Streuung der Massenwerte beeinflusst. Die Gewichtswahl kann sogar massenabhängig gewählt werden. Zum Beispiel kann im unteren Massenbereich ein großer Anteil der gemessenen Masse, im oberen Massenbereich zunehmend ein kleinerer Teil der gemessenen Massen in die Mittelwertsbildung einfließen.

Der Einsatz des erfindungsgemäßen Verfahrens ist aber nicht nur auf Ionenfallenmassenspektrometer beschränkt. Es kann bei allen Massenspektrometern eingesetzt werden, die statistisch streuende Werte der Massenbestimmung liefern. Beispielsweise liefert das PSD-Verfahren zur Messung von Fragmentionenspektren in Flugzeitmassenspektrometern ähnliche Fehlerstreubreiten wie ein Ionenfallenmassenspektrometer. PSD (Post Source Decay) benutzt den Zerfall metastabiler Ionen zur Erzeugung der Fragmentionen. Die Fehlerstreubreiten rühren aber hier nicht vom Ionisierungsprozess, sondern eher von anderen Ursachen her, die hier nicht genauer untersucht zu werden brauchen. Es ist aber interessant, dass sich auch hier das erfindungsgemäße Verfahren mit großem Erfolg einsetzten läßt.

Für dieses massenspektrometrische PSD-Verfahren, wie auch für die modernen Tandem-Flugzeitspektrometer („TOF/TOF"), ist das erfindungsgemäße Verfahren insofern besonders interessant, weil es auch die Ionen im unteren Massenbereich misst, die bei Ionenfallenmassenspektrometern für gewöhnlich fehlen, da sie unterhalb der Speichergrenze für Ionen liegen. Im unteren Massenbereich kommen die Immoniumionen und weitere Massen vor, bei denen nur jeweils eine Fragmentmasse eines Peptids vorkommen kann. Es steigt daher hier die Massengenauigkeit durch das erfindungsgemäße Verfahren stark an.

Das Verfahren kann in geeignete Massenspektrometer fest eingebaut werden. Das Massenspektrometer ist dabei entweder fest auf die Messung von bestimmten Substanzklassen ausgelegt, oder es enthält eine Auswahlmöglichkeit für die Substanzklasse. Es kann eine Wahlmöglichkeit für einen Betriebsmodus geben, der den automatischen Ersatz der gemessenen Massenwerte durch die wahrscheinlichsten Massenwerte für diese Substanzklasse bewirkt; es kann aber auch ein solcher Betrieb fest vorgegeben sein.


Anspruch[de]
Verfahren zur Massenbestimmung von Ionen aus einer bekannten Klasse von Biopolymeren, bei der die möglichen Massenwerte der Biopolymere um Massenmittelwerte konzentriert sind, mit einem Massenspektrometer, dadurch gekennzeichnet,

(a) dass ein Massenspektrum von Ionen oder von Fragmentionen der bekannten Klasse von Biopolymeren aufgenommen wird und die Massenwerte der auftretenden Ionen ermittelt werden, und

(b) dass die gemessenen Massenwerte ersetzt werden, indem jeweils der einzelne gemessene Massenwert durch denjenigen Massenmittelwert ersetzt wird, der dem gemessenen Massenwert am nächsten liegt, oder durch einen gewichteten Mittelwert zwischen dem gemessenen Massenwert und demjenigen Massenmittelwert ersetzt wird, der dem gemessenen Massenwert am nächsten liegt.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Massenmittelwerte, die für das Ersetzen der gemessenen Massenwerte verwendet werden, einen konstanten Abstand aufweisen. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Massenmittelwerte, die für das Ersetzen der gemessenen Massenwerte verwendet werden, durch Verfahren der mathematischen Kombinatorik, durch virtuellen Verdau oder durch virtuelle Fragmentierung von Biopolymeren aus einer Datenbank berechnet werden. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Massenmittelwerte, die für das Ersetzen der gemessenen Massenwerte verwendet werden, Abstände aufweisen, die mit einer Periodizität von einem konstanten Abstand abweichen. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, dass jeder gemessene Massenwert durch den nächstliegenden Massenmittelwert ersetzt wird. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, dass jeder gemessene Massenwert durch den gewichteten Mittelwert aus dem gemessenen Massenwert und dem nächstliegenden Massenmittelwert ersetzt wird. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die Gewichte zur Berechnung des gewichteten Mittelwertes für alle Massen gleich sind. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die Gewichte zur Berechnung des gewichteten Mittelwertes massenabhängig festgelegt sind. Verfahren nach Anspruch 1 bis 8, dadurch gekennzeichnet, dass es sich bei der Klasse von Biopolymeren um Proteine handelt. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass es sich bei der Klasse von Biopolymeren um Verdaupeptide handelt, die durch einen enzymatischen Verdau aus Proteinen gewonnen wurden. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass die Massenmittelwerte für die Verdaupeptide durch virtuellen Verdau der Proteine einer Proteinsequenzdatenbank oder durch mathematische Kombinatorik von Aminosäuren, beide unter Berücksichtigung der Art des Verdaus der Proteine zu Peptiden, gewonnen wurden. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass das aufgenommene Massenspektrum das Fragmentionenspektrum eines Peptides ist. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass die Massenmittelwerte durch virtuelle Fragmentierung von Peptiden einer Datenbank oder durch mathematische Kombinatorik, beide unter Berücksichtigung der Fragmentierungsregeln, gewonnen wurden. Verfahren nach Anspruch 1 bis 13, dadurch gekennzeichnet, dass es sich bei dem Massenspektrometer um ein Hochfrequenz-Ionenfallenmassenspektrometer handelt. Massenspektrometer für die Massenbestimmung von Biopolymeren, dadurch gekennzeichnet, dass es für die Massenbestimmung innerhalb einer Klasse von Biopolymeren ausgerichtet ist, bei der die möglichen Massenwerte der Biopolymere um Massenmittelwerte konzentriert sind, und dass es einen Betriebsmodus gibt, in dem jeder gemessene Massenwert eines aufgenommenen Massenspektrums durch den nächstliegenden Massenmittelwert oder durch einen gewichteten Mittelwert zwischen dem gemessenen Massenwert und dem nächstliegenden Massenmittelwert ersetzt wird. Massenspektrometer nach Anspruch 15, dadurch gekennzeichnet, dass es eine Einstellmöglichkeit für die Klasse von Biopolymeren gibt.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com