PatentDe  


Dokumentenidentifikation DE102004015018A1 20.01.2005
Titel Verfahren und Vorrichtungen zum Identifizieren verwandter Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten
Anmelder Agilent Technologies, Inc. (n.d.Ges.d.Staates Delaware), Palo Alto, Calif., US
Erfinder Thompson, Dean R., Fort Collins, Col., US;
Old, William M., Boulder, Col., US;
Gines, David Lee, Fort Collins, Col., US
Vertreter Schoppe, Zimmermann, Stöckeler & Zinkler, 82049 Pullach
DE-Anmeldedatum 26.03.2004
DE-Aktenzeichen 102004015018
Offenlegungstag 20.01.2005
Veröffentlichungstag im Patentblatt 20.01.2005
IPC-Hauptklasse G01N 27/62
IPC-Nebenklasse G01N 33/483   G01N 35/00   
Zusammenfassung Beschrieben sind Techniken zum Verarbeiten von Datensätzen, die durch ein Analysieren einer Probe erzeugt werden. Der Eingangsdatensatz wird als Zeilen von Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) dargestellt. Eine Korrelationsmatrix wird erzeugt, in der jede Zeile des Eingangsdatensatzes mit jeder weiteren Zeile in dem Eingangsdatensatz korreliert wird. Die Korrelationsmatrix wird derart geclustert oder gruppiert, daß diese stark korrelierten m/z-Bereiche in der gleichen Gruppe enthalten sind. Ein Satz einer oder mehrerer Abtastungen wird für jede Gruppe ausgewählt, was interessierende Zeiträume innerhalb jeder Gruppe darstellt. Unter Verwendung der m/z-Werte, die in jeder Gruppe enthalten sind, wird ein resultierendes Probenspektrum für jede der ausgewählten Abtastungen erzeugt. Die Verarbeitungstechniken können verwendet werden, um Stamm- und verwandte Fragmentionen in dem Eingangsdatensatz zu identifizieren, sowie als ein Vor-Verarbeiter verwendet werden, der resultierende abgetastete Spektren erzeugt, die als Eingabe zur nachfolgenden Verarbeitung verwendet werden.

Beschreibung[de]

Diese Anmeldung ist eine Teilfortführungsanmeldung der US-Patentanmeldung Nr. 10/388,088, eingereicht am 13. März 2003, mit dem Titel „Methods and Devices for Identifying Biopolymers Using Mass Spectroscopy" von Dean R. Thompson und Steven M. Fischer, die hierin in ihrer Gesamtheit durch Bezugnahme aufgenommen ist.

Diese Anmeldung bezieht sich auf eine Massenspektralanalyse und insbesondere auf ein Verarbeiten von Massenspektren, die durch eine Massenspektralanalyse erzeugt werden.

Die Massenspektroskopie ist ein leistungsstarkes analytisches Werkzeug, das beim Identifizieren unbekannter Verbindungen, sowie ihrer Mengen verwendet werden kann. Die Massenspektroskopie kann z. B. auch beim Ermitteln der Struktur und chemischer Eigenschaften von Molekülen nützlich sein und kann in Verbindung mit sowohl organischen als auch anorganischen Substanzen verwendet werden. Die Identifizierung von Proteinen und weiteren Molekülen in einer komplexen Mischung, die aus biologischen Quellen hergeleitet ist, kann unter Verwendung der Massenspektroskopie durchgeführt werden. Eine Vielzahl unterschiedlicher Techniken wurde zur Verwendung bei der Identifizierung von Molekülen, wie z. B. Proteinen, entwickelt.

Vor einem Durchführen einer Massenspektroskopie trennt eine Technik verschiedene Proteine in der Mischung unter Verwendung einer zweidimensionalen Gel-Elektrophorese (2DE). Die resultierenden Punkte können herausgeschnitten und -gezogen werden, um die Proteine in kürzere Polypeptid-Ketten zu zerlegen. Diese Auszüge können über Massenspektroskopie analysiert werden und das resultierende Spektrum kann mit Spektren verglichen werden, die aus Aminosäuresequenzen und Informationen, die in Datenbanken enthalten sind, vorausgesagt werden. Die vorangegangene Technik weist z. B. eine Schwierigkeit beim Auflösen stark saurer und hydrophober Proteine auf.

Um die vorangegangenen Schwierigkeiten bei der ersten Technik zu überwinden, wurden Anstrengungen unternommen, um die Trennung derartiger Mischungen über eine Hochleistungs-Flüssigchromatographie (HPLC) durchzuführen. Diese Bemühungen umfassen ein Herausziehen aller Proteine in der Mischung vor einem Angehen von Trenntechniken, was zu einer hyper-komplexen Mischung führt. Unter Verwendung einer derartigen hyper-komplexen Mischung ist es unter Umständen weder praktisch noch möglich, eine vollständige und perfekte Trennung zu schaffen. Vielmehr sind in dem Eluat, das in das Massenspektrometer gelangt, unter Umständen mehrere Peptide zu jedem Zeitpunkt vorhanden, derart, daß mehrere Peptide ko-eluieren, was zu Massenspektren führt, die eine Mischung von Ionen von den verschiedenen vorhandenen Peptiden enthalten können.

Das Vorangegangene kann durch zwei zusätzliche Faktoren weiter verkompliziert werden. Erstens neigen große Moleküle, wie z. B. Peptide, unter Umständen dazu, eine große Ladung während einer Elektro-Sprüh-Ionisierung zu sammeln. Als ein Ergebnis der Elektro-Sprüh-Ionisierung und der Sammlung einer großen Ladung kann das Spektrum jedes Peptids unter Umständen mehrere Spitzen bzw. Peaks aufweisen, die den mehreren Ladungszuständen entsprechen. Zusätzlich lösen hochauflösende Massenspektrometer, wie z. B. Laufzeitvorrichtungen, unter Umständen mehrere isotope Spitzen für jeden Ladungszustand auf. Als ein Ergebnis der obigen Faktoren kann ein sehr komplexes Spektrum resultieren.

Um die Komplexität der resultierenden Spektren zu reduzieren, können Techniken, wie z. B. eine Ladungszuweisung und eine Isotoprückbildung, durchgeführt werden. Diese Techniken können jedoch empfindlich auf verschiedene Typen von Interferenz und Rauschen, sowohl chemischer als auch elektrischer Natur, sein.

Zusätzlich ist ein vollständiger Datensatz von Spektren, die z. B. durch eine Flüssigchromatographie/Massenspektrometrie-Verarbeitung (LC/MS) erzeugt werden, u. U. ziemlich groß. Ein Spektrum kann bei verschiednen Frequenzen, wie z. B. mehrere Male pro Sekunde oder alle paar Sekunden, über einen Zeitraum von mehreren Stunden genommen werden. Die Größe eines derartigen Datensatzes stellt eine Anzahl von Herausforderungen gemäß einem Analysieren derartiger großer Datenmengen dar.

Eine Technik zum Reduzieren der Rechenlast in Verbindung mit derartigen großen Datenmengen besteht darin, nur bestimmte zu analysierende Spektren detailliert gemäß bestimmten Kriterien auszuwählen. Diese Spektren werden jedoch üblicherweise manuell durch eine visuelle Inspektion der Chromatographiedaten ausgewählt, was zeitaufwendig, schwerfällig und fehleranfällig sein kann.

Folglich kann es wünschenswert sein, eine Technik zum Analysieren von Chromatographieinformationen, wie z. B. in einem LC/MS-Datensatz vorhanden sein können, und Verwenden der resultierenden Analyseinformationen zur Trennung verwandter Ionen in Spektren, die einzelne Verbindungen darstellen, bereitzustellen. Es kann ebenso wünschenswert sein, die resultierenden Analyseinformationen zu verwenden, um die bestimmten Spektren zur nachfolgenden Analyse zu identifizieren, die maximale Signalpegel bereitstellen. Es kann ebenso wünschenswert sein, ein Rauschen aus den Daten zu entfernen und zu filtern und die Größe und Komplexität des zu analysierenden Datensatzes wesentlich zu reduzieren. Es kann ebenso wünschenswert sein, eine derartige Technik in Verbindung mit einer Proteinidentifizierung zu verwenden, sowie dieselbe allgemein für die Analyse weiterer Klassen von Molekülen, die ähnliche Charakteristika teilen, anzuwenden.

Es ist die Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zum Identifizieren verwandter Ionen, ein verbessertes Verfahren zum Quantifizieren oder ein Computerprogrammprodukt mit verbesserten Charakteristika zu schaffen.

Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 oder 20 oder ein Computerprogrammprodukt gemäß Anspruch 21 oder 40 gelöst.

Gemäß einem Aspekt der Erfindung wird ein Verfahren zum Identifizieren verwandter Ionen in einem Eingangsdatensatz, der durch ein Analysieren einer Probe erzeugt wird, mit folgenden Schritten bereitgestellt: Korrelieren jeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind; Gruppieren (Clustern) der Korrelationsmatrix, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe kovariierende Chromatogramme darstellt; Auswählen zumindest eines interessierenden Zeitraums für jede Gruppe; und Erzeugen eines resultierenden Spektrums für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder Gruppe enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes.

Gemäß einem weiteren Aspekt der Erfindung wird ein Verfahren zum Quantifizieren zumindest eines Ions in einem Eingangsdatensatz, der durch ein Analysieren einer Probe erzeugt wird, mit folgenden Schritten bereitgestellt: Korrelieren jeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind; Gruppieren der Korrelationsmatrix, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe chemisch verwandte Komponenten darstellt, die ein korreliertes Chromatographieverhalten zeigen; Auswählen zumindest eines interessierenden Zeitraums für jede Gruppe; und Erzeugen eines resultierenden Spektrums für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes.

Gemäß einem weiteren Aspekt der Erfindung wird ein Computerprogrammprodukt zum Identifizieren verwandter Ionen in einem Eingangsdatensatz, der durch ein Analysieren einer Probe erzeugt wird, mit folgenden Merkmalen bereitgestellt: einem maschinenausführbaren Code, der jede Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind; einem maschinenausführbaren Code, der die Korrelationsmatrix gruppiert, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe ko-variierende Chromatogramme darstellt; einem maschinenausführbaren Code, der zumindest einen interessierenden Zeitraum für jede Gruppe auswählt; und einem maschinenausführbaren Code, der ein resultierendes Spektrum für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes erzeugt.

Gemäß noch einem weiteren Aspekt der Erfindung wird ein Computerprogrammprodukt zum Quantifizieren zumindest eines Ions in einem Eingangsdatensatz, der durch ein Analysieren einer Probe erzeugt wird, mit folgenden Merkmalen bereitgestellt: einem maschinenausführbaren Code, der jede Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangdatensatz dem Korrelationswert zugeordnet sind; einem maschinenausführbaren Code, der die Korrelationsmatrix gruppiert, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe chemisch verwandte Komponenten darstellt, die ein korreliertes Chromatographieverhalten zeigen; einem maschinenausführbaren Code, der zumindest einen interessierenden Zeitraum für jede Gruppe auswählt; und einem maschinenausführbaren Code, der ein resultierendes Spektrum für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes erzeugt.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beigefügten Zeichnungen näher erläutert. Es zeigen:

1 ein Beispiel eines Blockdiagramms, das Verarbeitungsschritte einer Substanz darstellt, die in ein Massenspektrometer eingegeben wird;

2 ein Beispiel eines Ausführungsbeispiels eines Computersystems aus 1;

3 ein Beispiel eines Ausführungsbeispiels eines Hosts, der in dem Computersystem aus 2 enthalten ist;

4 ein Beispiel eines Funktionsblockdiagramms von Komponenten, die in einem Massenspektrometer aus 1 enthalten sind;

59 beispielhafte graphische Darstellungen alternativer Anzeigen von Daten, die aus dem Massenspektrometer aus 4 ausgegeben werden;

10 ein Flußdiagramm von Verfahrensschritten eines exemplarischen Ausführungsbeispiels zum Durchführen einer Ionenidentifizierung und Filterverarbeitung bezüglich Daten, die aus dem Massenspektrometer aus 4 ausgegeben werden;

11 ein Flußdiagramm von Verfahrensschritten eines beispielhaften Ausführungsbeispiels zum Verarbeiten unterschiedlicher Typen von Massenspektral-Datensätzen;

12 ein Flußdiagramm von Verfahrensschritten eines beispielhaften Ausführungsbeispiels zum Durchführen eines Clusterns oder einer Gruppierung stark korrelierter Zeilen, wie sie in den Verarbeitungsschritten des Flußdiagramms aus 10 oder 11 verwendet wird; und

1317 beispielhafte graphische Darstellungen von Datensätzen bei verschiedenen Verarbeitungsschritten des Verfahrens aus 11.

Bezug nehmend auf 1 ist ein Beispiel eines Blockdiagramms von Verarbeitungsschritten gezeigt, die in Verbindung mit einer Identifizierung eines Moleküls innerhalb einer Mischung bei einem Ausführungsbeispiel durchgeführt werden können. Bei diesem bestimmten Beispiel kann die Substanz eine Mischung aus einem oder mehreren Molekülen, wie z. B. Peptiden oder Proteinen, sein, die zur Identifizierung verarbeitet werden. Es wird darauf verwiesen, daß die hierin beschriebenen Techniken auch beim Durchführen einer quantitativen Analyse von Molekülen in einer Probe verwendet werden können. Eine Eingangsprobe oder Substanz 12 wird in der enzymatischen Auszugsverarbeitung (digestion processing) 14 herausgezogen (digeriert). Diese enzymatische Auszugsverarbeitung 14 bricht die Proteine in der Probe 12 in kürzere Polypeptid-Ketten auf. Danach können die Auszüge über eine Trennverarbeitungstechnik 16 getrennt werden. Jede einer Vielzahl unterschiedlicher Trennverarbeitungstechniken kann verwendet werden, wie z. B. Flüssigchromatographie, 2D-Gel-Trennung und dergleichen. Es wird darauf verwiesen, daß im allgemeinen jede Trenntechnik und/oder Auszugstechnik verwendet werden kann, um die verschiedenen Polypeptide z. B. gemäß Molekulargewicht, elektrischen Feldern und dergleichen zu trennen.

Nach der Trennverarbeitung 16 können die resultierenden Abscheidungen in ein Massenspektrometer 18 eingegeben werden, was Massenspektraldaten 20 als eine Ausgabe erzeugt. Die Massenspektraldaten können in eine Ionenidentifizierungs- und Filterverarbeitung 24 eingegeben werden. Die Ionenidentifizierungs- und Filterverarbeitung 24 kann ein Computersystem 26 in Verbindung mit einem Durchführen von Verarbeitungsschritten in demselben verwenden. Details über die spezifischen Verarbeitungsschritte, die in Verbindung mit der Ionenidentifizierungs- und Filterverarbeitung 24 durchgeführt werden, sind an anderer Stelle detaillierter beschrieben. Nachfolgend kann die Ausgabe der Ionenidentifizierungs- und Filterverarbeitung 24 als eine Eingabe in eine Nachverarbeitung 22 dienen.

Die Nachverarbeitung 22 kann z. B. ein Durchführen einer Isotoprückbildung oder Ladungszuweisung umfassen. Die Nachverarbeitung 22 kann z. B. auch einen Vergleich überwachter Ausgangsdaten mit bekannten Spektraldaten umfassen, um z. B. einen bestimmten bekannten Typ und eine Menge zu identifizieren, die Proteinen und dergleichen zugeordnet sind, die in der Probe 12 enthalten sein können. Die Nachverarbeitung 22 kann auch das Computersystem 26 verwenden. Es wird darauf verwiesen, daß die Nachverarbeitung 22 das gleiche oder ein anderes Computersystem als das verwenden kann, das in Verbindung mit den Verarbeitungsschritten der Ionenidentifizierungs- und Filterverarbeitung 24 verwendet wurde. Als eine Ausgabe der Nachverarbeitung können Probeinformationsergebnisse 23 erzeugt werden. Die Ergebnisse 23 können z. B. Typen bekannter Proteine und Mengen umfassen, die in der Probe 12 identifiziert werden.

Es wird angemerkt, daß, obwohl die bestimmte Probe oder Substanz 12, die im vorangegangenen und während dieses gesamten Beispiels beschrieben wird, ein Protein sein kann, die hierin beschriebenen Techniken auch in Verbindung mit anderen Typen von Substanzen oder Proben 12 zur Identifizierung weiterer Moleküle und/oder zugeordneter Mengen verwendet werden können. Ein Ausführungsbeispiel kann zusätzliche oder andere Verarbeitungsschritte als diejenigen, die hierin beschrieben sind, gemäß dem Typ von Probe oder Substanz 12, die zu analysieren ist, sowie den bestimmten zu identifizierenden Komponenten innerhalb der Probe oder Substanz umfassen. Dies kann die Verarbeitungsschritte beeinflussen, die sowohl vor als auch nach der Verarbeitung durch das Massenspektrometer durchgeführt werden. Die enzymatische Auszugsverarbeitung kann z. B. auch nicht in Verbindung mit einem Durchführen einer Analyse einer Probe oder Substanz verwendet werden, die keine Proteine umfaßt.

Bezug nehmend auf 2 ist ein detaillierteres Beispiel eines Ausführungsbeispiels des Computersystems 26 gezeigt. Es wird darauf verwiesen, daß 2 nur eine bestimmte Anordnung eines Computersystems darstellt, das in dem Ausführungsbeispiel 10 aus 1 enthalten sein kann.

Das Computersystem 26 umfaßt ein Datenspeichersystem 112, das mit Host-Systemen 114a114n und einem Datenverwaltersystem 116 durch ein Kommunikationsmedium 118 verbunden ist. Bei diesem Ausführungsbeispiel des Computersystems 26 können die N Hosts 114a114n und das Datenverwaltersystem 116 auf das Datenspeichersystem 112 z. B. beim Durchführen von Eingangs-/Ausgangs-(I/O-)Operationen oder Datenanforderungen zugreifen. Das Kommunikationsmedium 118 kann jedes einer Vielzahl von Netzen bzw. Netzwerken oder ein weiterer Typ von Kommunikationsverbindung sein, wie dies für Fachleute auf diesem Gebiet bekannt ist. Das Kommunikationsmedium 18 kann eine Netzverbindung, ein Bus und/oder ein weiterer Typ von Datenverbindung sein, wie z. B. eine Festverdrahtung oder weitere Verbindungen, die in der Technik bekannt sind. Das Kommunikationsmedium 118 kann z. B. das Internet, ein Intranet, Netz oder eine oder mehrere weitere Verbindungen sein, durch die die Host-Systeme 114a114n und das Datenverwaltersystem auf das Datenspeichersystem 112 zugreifen und mit demselben kommunizieren können und auch mit weiteren Elementen, die in dem Computersystem 26 enthalten sind, kommunizieren können.

Jedes der Host-Systeme 114a114n, das Datenverwaltersystem 116 und das Datenspeichersystem 112, die in dem Computersystem 26 enthalten sind, können mit dem Kommunikationsmedium 118 durch jede einer Vielzahl von Verbindungen verbunden sein, wie dies gemäß dem Typ von Kommunikationsmedium 118 vorgesehen und unterstützt wird. Die Prozessoren, die in den Host-Computersystemen 114a114n und dem Datenverwaltersystem 116 enthalten sind, können gemäß jedem bestimmen Ausführungsbeispiel und der Anwendung jedes einer Vielzahl kommerziell erhältlicher Ein- oder Mehrprozessorsysteme sein, wie z. B. ein Intel-basierter Prozessor, ein IBM-Mainframe oder ein weiterer Typ kommerziell erhältlichen Prozessors, der in der Lage ist, einen eingehenden Verkehr zu unterstützen.

Es wird darauf verwiesen, daß die bestimmten Details der Hardware und Software, die in jedem der Host-Systeme 114a-114n und dem Datenverwaltersystem 116 enthalten sind, sowie der Komponenten, die in dem Datenspeichersystem 112 enthalten sein können, bei jedem bestimmten Ausführungsbeispiel variieren können. Jeder der Host-Computer 114a114n, sowie das Datenverwaltersystem 116 können sich an dem gleichen physischen Ort befinden oder können sich alternativ auch an unterschiedlichen physischen Orten befinden. Beispiele des Kommunikationsmediums, das zur Bereitstellung der unterschiedlichen Typen von Verbindungen zwischen den Host-Computersystemen, dem Datenverwaltersystem und dem Datenspeichersystem des Computersystems 26 verwendet werden kann, können eine Vielzahl unterschiedlicher Kommunikationsprotokolle verwenden, wie z. B. SCSI, ESCON, Faserkanal oder GIGE(Gigabit-Ethernet) und dergleichen. Einige oder alle der Verbindungen, durch die die Hosts, das Datenverwaltersystem 116 und das Datenspeichersystem 112 mit dem Kommunikationsmedium 118 verbunden sein können, können durch weitere Kommunikationsvorrichtungen laufen, wie z. B. eine Connectrix- oder eine weitere Schaltausrüstung, die vorliegen kann, wie z. B. eine Telephonleitung, einen Repeater, einen Multiplexer oder sogar einen Satellit.

Jedes der Host-Computersysteme sowie das Datenverwaltersystem können unterschiedliche Typen von Datenoperationen gemäß unterschiedlichen Typen von Verwaltungsaufgaben durchführen. Bei dem Ausführungsbeispiel aus 2 kann jeder der Host-Computer 114a114n eine Datenanforderung an das Datenspeichersystem 112 ausgeben, um eine Datenoperation durchzuführen. Eine Anwendung kann z. B. in Verbindung mit der Ionenidentifizierungs- und Filterverarbeitung 24 aufgerufen werden und kann auf einem der Host-Computer 114a114n ausgeführt werden.

Es wird darauf verwiesen, daß das in dem System 10 aus 1 enthaltene Computersystem 26 auch ein einzelner Computer, wie z. B. ein Personalcomputer, sowie eine weitere Anordnung einer Mehrzahl von Computersystemen, wie oben beschrieben ist, sein kann.

Bezug nehmend auf 3 ist ein detaillierteres Beispiel eines Ausführungsbeispiel eines Host-Computersystem 114a-114n gezeigt, das in dem Computersystem 26 enthalten sein kann. Das Host-Computersystem 114a kann Komponenten, wie z. B. einen oder mehrere Prozessoren 130, einen Speicher 132 oder eine oder mehrere Datenspeichereinheiten 134, sowie eine Anzeige 136 und eine oder mehrere Eingabevorrichtungen 138 umfassen. All diese Komponenten innerhalb eines Computersystems 114a können Benutzerdaten und Befehlsinformationen unter Verwendung eines lokalen Bus 140 kommunizieren und übertragen.

Es wird darauf verwiesen, daß die für das Host-Computersystem 114a enthaltenen Komponenten auch diejenigen Komponenten sein können, die in einem Ausführungsbeispiel enthalten sind, bei dem das Computersystem 26 ein einzelner Computer, wie z. B. ein einzelner Personalcomputer, ist, der in Verbindung mit der Nachverarbeitung und der Ionenidentifizierungs- und Filterverarbeitung 24 verwendet werden kann.

Bezug nehmend auf 4 ist ein Beispiel eines Ausführungsbeispiels eines Massenspektrometers 18 gezeigt. Ein Massenspektrometer kann als ein Instrument charakterisiert werden, das die Masse-Ladung-Verhältnisse einzelner Moleküle, die in Ionen umgewandelt wurden, mißt. Wie in den folgenden Absätzen beschrieben ist, mißt ein Massenspektrometer tatsächlich nicht die Molekularmasse direkt, sondern bestimmt vielmehr ein Masse-Ladung-Verhältnis der Ionen, die aus einem bestimmten Molekül oder Molekülen gebildet werden. Eine nützliche Einheit für hierin beschriebene Zwecke ist eine Einheit, die sich auf eine Grundladungseinheit, die Größe der Ladung auf einem Elektron, bezieht. Die Ladung eines Ions kann durch die Ganzzahl z der Grundladungseinheit angegeben werden und das Masse-Ladung-Verhältnis kann als m/z bezeichnet werden.

4 umfaßt die unterschiedlichen Funktionseinheiten eines Massenspektrometers, das begrifflich in dem Blockdiagramm 18 aus 4 dargestellt sein kann. Eine Probe kann über einen Einlaß 156 in eine Vakuumkammer eingeführt werden. Es wird darauf verwiesen, daß eine Probe in einer einer Vielzahl unterschiedlicher Formen vorliegen kann, einschließlich z. B. einer flüssigen Lösung, eingebettet in eine feste Matrix, oder als Dampf. Abhängig von dem Typ von Einlaß und verwendeten Ionisierungstechniken kann die Probe auch bereits als Ionen in Lösung vorliegen oder sie kann in Verbindung mit ihrer Verflüchtigung oder durch weitere Verfahren in der Ionenquelle 150 ionisiert werden. Bei diesem Ausführungsbeispiel wird die Probe, wenn dieselbe in den Einlaß 156 eingeführt wird, in einer Gasphase plaziert und dann geladen, um Ionen zu erzeugen. Die Ionen werden durch einen Analysator 152 gemäß ihren Masse-Ladung- oder m/z-Verhältnissen sortiert und dann durch einen Ionendetektor 154 gesammelt. In dem Ionendetektor 154 kann der Ionenfluß in einen elektrischen Proportionalstrom umgewandelt werden. Die Ausgabe des Ionendetektors 54 dient als eine Eingabe in das Datensystem 158, das die Größe der verschiedenen elektrischen Signale als eine Funktion der m/z-Verhältnisse aufzeichnet und die Informationen in Massenspektrometerdaten 20 umwandelt.

Es wird darauf verwiesen, daß in der vorangegangenen allgemeinen Beschreibung bezüglich eines Massenspektrometers unterschiedliche Typen von Massenspektrometern von den in 4 enthaltenen Komponenten variieren können. Die oben beschrieben Ionensortierung kann z. B. in einem Quadrupolinstrument enthalten sein, jedoch nicht in einem TOF-Massenspektrometer, da das TOF-Massenspektrometer die Flugzeit der Ionen in einem Rohr mit fester Länge mißt. Die hierin beschriebenen Techniken können mit jedem Typ von Massenspektrometer verwendet werden und jede Beschreibung eines bestimmten Typs von Massenspektrometer sollte nicht als Einschränkung der Anwendung der hierin beschriebenen Techniken aufgefaßt werden.

Es wird darauf verwiesen, daß ein Ausführungsbeispiel eine Ionenauswahlverarbeitung als Teil der Ionensortierung 152 umfassen kann, bei der nur ein Teil der bestimmten Ionen zur weiteren Verarbeitung und Analyse ausgewählt wird. Wie an anderer Stelle hierin gezeigt und beschrieben ist, ist die Massenspektral-Datenausgabe aus dem Massenspektrometer 18 im allgemeinen ein Graph einer Ionenintensität auf der y-Achse als eine Funktion des Masse-Ladung-Verhältnis (m/z), das auf der x-Achse des Spektrums angezeigt sein kann. Es wird darauf verwiesen, daß die aus dem Massenspektrometer 18 kommenden Ionen sowohl positiv als auch negativ geladen sein können.

Wie dies hierin beschrieben ist, kann die Probe in einer einer Vielzahl von Formen vorliegen, wenn sie in den Einlaß 156 eingeführt wird. Wenn die Probe z. B. ein Feststoff ist, kann die Probe in eine Gasphase verdampft oder sublimiert werden, wie z. B. durch Erwärmen. Gase und Flüssigkeiten können durch Einlaßentwürfe eingeführt werden, die den Fluß steuern. Einige Ausführungsbeispiele können verschiedene Techniken bei der Verarbeitung kombinieren, wie z. B. Verflüchtigung und Ionisierung, die gleichzeitig auftreten. Die Probe kann auch eine Mischung sein, in der die einzelnen Komponenten vor einer Eingabe und Analyse durch das Massenspektrometer getrennt werden können. Eine Trennung ist in Verbindung mit dem Verarbeitungsschritt 16 aus 1 beschrieben. Die Trennung kann verwendet werden, um Massenspektren für eine Probe mit mehreren Komponenten zu vereinfachen, indem die Anzahl ko-eluierender Verbindungen reduziert wird. Eine Gaschromatographie kann mit der Massenspektrometrie als ein Mittel zur Trennung gekoppelt sein, wie hierin ebenso beschrieben ist. Die Gaschromatographie z. B. kann es ermöglichen, daß Verbindungen, die bereits in einer Dampfphase vorliegen, zeitlich getrennt in das Massenspektrometer gelangen, so daß Komponenten von Mischungen erfaßt und analysiert werden können. Flüssigchromatographen können auch verwendet werden, ebenso wie Kapillar-Elektrophorese-Vorrichtungen und weitere Typen von Hardware und/oder Software, die in Verbindung mit einem Durchführen der Trennverarbeitung vor einer Einführung einer Probe in ein Massenspektrometer 18 verwendet werden.

Molekular- und Fragmentionen können in der Ionenquelle 150 erzeugt werden, wie in 4 gezeigt ist. Wenn die Eingabe nicht bereits ionisiert ist, kann jede einer Vielzahl unterschiedlicher Ionisierungstechniken verwendet werden, z. B. einschließlich einer Elektro-Sprüh-Ionisierung (ESI). Es wird angemerkt, daß, obwohl sowohl positive als auch negative Ionen in der Ionenquelle gleichzeitig erzeugt werden können, eine einzelne Polarität zu einer bestimmten Zeit aufgezeichnet werden kann. Ein bestimmtes Massenspektrum kann positive oder negative Ionen umfassen. Die Ionen werden dann in das Ionensortieren oder den Analysator 152 eingegeben. Der Analysator kann eine Dispersion oder ein Filtern verwenden, um Ionen gemäß den Masse-Ladung-Verhältnissen oder anderen relativen Eigenschaften zu sortieren. Analysatoren können z. B. Magnetsektoren, Quadrupol-Massefilter, Fourier-Transformierungs-Ionenzyklotron-Resonanzspektrometer, Flugzeit-Massenanalysatoren und dergleichen umfassen. Nachfolgend werden die durch den Ionensortierer oder Analysator 152 erzeugten sortierten Ionen in die Ionenerfassungsverarbeitung 154 eingegeben, bei der die bestimmte Ladung der Ionen bestimmt wird.

Es wird darauf verwiesen, daß ein Computer in Verbindung mit einem Steuern des Massenspektrometers sowie bei einer Spektralerfassung, -speicherung und -vorlage verwendet werden kann. Wie hierin z. B. in Verbindung mit der Verarbeitung des Blockdiagramms 10 aus 1 beschrieben ist, können eine Software und/oder Hardware in einem Computersystem in Verbindung mit einem Durchführen einer Quantisierung, Spektralinterpretation und Verbindungsidentifizierung verwendet werden.

Es wird ebenso darauf verwiesen, daß zusätzlich zu der ESI-Technik zur Erzeugung von Ionen als ein Ergebnis der Quellenverarbeitung 150 innerhalb des Massenspektrometers eine chemische Ionisierung, Desorptionsionisierung, Elektro-Sprüh-Ionisierung und dergleichen in Verbindung mit einem Durchführen einer Ionisierung verwendet werden können. Es wird darauf verwiesen, daß für Polypeptide und dergleichen (Biomoleküle) Techniken, wie z. B. ESI, Matrix-gestützte Laserdesorptionsionisierung (MALDI), Atmosphärendruck-MALDI (AP-MALDI), und weitere „weiche" Ionisierungstechniken gegenüber „harten" Ionisierungstechniken bevorzugt werden. Weich und hart in bezug auf Ionisierungstechniken bezieht sich auf die Energiepegel, die zur Ionisierung der interessierenden Moleküle verwendet werden. Harte Ionisierungstechniken sind mit Biomolekülen nicht kompatibel, da sie zu einer ausgedehnten Fragmentierung führen.

Trenntechniken, wie z. B. Gaschromatographie (GC), Flüssigchromatographie (LC) und dergleichen, wie dies hierin beschrieben ist, können in Verbindung mit der Massenspektrometrie verwendet werden, um chemische Verbindungen zu identifizieren. In Verbindung mit der Verwendung eines Massenspektrometers (MS) mit einem Gas- oder Flüssigchromatographen kann eine Schnittstelle verwendet werden, um den Gasfluß in das Massenspektrometer einzuschränken oder zu reduzieren. Dies kann z. B. dazu führen, daß eine Schnittstelle zwischen der Trennverarbeitung 16 und dem Massenspektrometer 18 eingeführt wird, wie in Verbindung mit 1 gezeigt ist. Jede Chromatographietechnik, wie z. B. LC, C, FF-Elektrophorese und dergleichen, kann in Verbindung mit Biomolekülen verwendet werden. Die Verwendung von Flüssigphasentechniken kann aufgrund der Leichtigkeit, mit der dieselben schnittstellenmäßig mit einem Massenspektrometer verbunden werden können, zusätzlich zu der Fähigkeit einer Überwachung des Chromatographieverhaltens eluierender Komponenten bevorzugt werden.

In Verbindung mit GC/MS, LC/MS oder weiteren Kombinationen bestehen die Ausgangsdaten der Massenspektren 20 aus einer Serie von über der Zeit erfaßten Massenspektren. Um diese Informationen zu erzeugen, kann das Massenspektrometer den Massebereich für z. B. einen bestimmten m/z-Bereich wiederholt für einen bestimmten Chromatographiedurchlauf abtasten. Eine Abtastung kann bei einer vorbestimmten Frequenz, wie z. B. jede Sekunde oder mehrere Male pro Sekunde, durchgeführt werden.

Die bestimmte ausgewählte Abtastfrequenz kann gemäß einem Ausführungsbeispiel variieren. Ein Ausführungsbeispiel kann eine Abtastfrequenz auswählen, die mit der durchschnittlichen erwarteten Spitzenbreite variiert, und kann z. B. um eine Größenordnung größer als dieselbe sein. Bei einem Ausführungsbeispiel tastet das Massenspektrometer mit einer Geschwindigkeit ab, die zehnmal höher als die Geschwindigkeit ist, mit der die Verbindungen eluieren. Dies überträgt sich auf zumindest 10 Abtastungen über eine durchschnittliche Chromatographiespitze.

Bezug nehmend auf 5 ist eine Form einer graphischen Darstellung der Spektraldaten, wie dieselben angezeigt werden können, gezeigt. Eine graphische Anzeige 200 aus 5 zeigt ein Gesamtionenchromatogramm (TIC). Das TIC stellt die Intensitäten aller Ionen dar, wie dieselben in Verbindung mit jeder bestimmten Abtastung zusammengefaßt sind. So stellt das TIC eine gesammelte Menge einer Ionenintensität bei jeder Abtastung dar.

Bezug nehmend auf 6 ist ein Beispiel einer graphischen Darstellung 250 dessen gezeigt, wie ein TIC 260 weiter durch eine Mehrzahl einzelner Ionenprofile 270 dargestellt sein kann. Ein bestimmter Punkt 271a in dem TIC 260 kann durch ein Summieren der einzelnen Ionenprofile 271b dargestellt werden, wie bei 270 entlang der Richtung, die durch einen Pfeil 272 angezeigt ist, dargestellt ist. 6 zeigt alternative Datenanzeigen von Chromatographiedaten, wie dieselben aus dem Massenspektrometer 18 ausgegeben werden können.

Es wird darauf verwiesen, daß in Verbindung mit einem Erfassen von Spektren bei einer bestimmten Frequenz die bestimmte Frequenz gemäß jedem Ausführungsbeispiel variieren kann. Bei den hierin beschriebenen Techniken z. B. können Spektren mehrere Male pro Sekunde gesammelt werden. Es wird darauf verwiesen, daß TICs durch Rauschkomponenten des Datensatzes bewirkt werden.

Bezug nehmend auf 7 ist ein Beispiel einer weiteren Form dessen gezeigt, wie eine Datenausgabe aus einem Massenspektrometer angezeigt werden kann. Die Datenanzeige 280 kann als eine Konturdarstellung bezeichnet werden, bei der die Abtastzahl auf der x-Achse ist. Der bestimmte m/z-Wert wird auf der y-Achse dargestellt, wobei die Intensität als ein Grauskalawert dargestellt ist. Ein vertikales Betrachten eines Stücks durch die Darstellung 280 aus 7 führt zu einem Spektrum für eine bestimmte Elutionszeit. Ein horizontales Stück der graphischen Darstellung 280 aus 7 stellt den Ionenstrom für einen bestimmten m/z-Wert über der Zeit dar, der üblicherweise als das extrahierte Ionenchromatogramm (XIC) bezeichnet wird.

Bezug nehmend auf 8 ist ein Beispiel der graphischen Darstellung 300 eines XIC gezeigt. Die Darstellung 300 stellt ein XIC für ein m/z-Verhältnis von 100 über der Zeit dar.

In Verbindung mit den XICs ist anzumerken, daß zwei oder mehr Komponenten einer ursprünglichen Mischung zu einem bestimmten Zeitpunkt ko-eluieren können. Die Elutionsprofile jeder der jeweiligen zwei Komponenten jedoch zeigen in den meisten Fällen Unterschiede über eine Serie von Zeitpunkten oder Abtastungen. Es ist ebenso anzumerken, daß Ionen, die aus den Vorgängen des Massenspektrometers resultieren, dazu neigen können, chromatographisch zu ko-variieren, indem ähnliche Elutionsprofile zu sehen sind.

Bezug nehmend auf 9 ist ein Beispiel einer graphischen Darstellung 350 gezeigt, die XICs für vier unterschiedliche überlagerte m/z-Werte darstellt. Alle vier m/z-Werte sind an einem Abtastpunkt T ko-eluierend, wie auf der Darstellung 350 identifiziert ist. Es wird jedoch angemerkt, daß nur die Ionen 3 und 4 ko-variierend sind. Ko-variierende Ionen können bei diesem Beispiel in einem Konturdiagramm, wie in 7 gezeigt ist, als eine Serie horizontaler Balken, die in einer Spalte angeordnet sind, sichtbar sein. Wenn die XICs der entsprechenden Ionen 3 und 4 geprüft werden, kann jedoch eine Ähnlichkeit der Elutionsprofile beobachtet werden. Diese Beobachtungen bezüglich Kovarianz können bei den hierin beschriebenen Verarbeitungsschritten verwendet werden.

Bezug nehmend auf 10 ist ein Flußdiagramm von Verarbeitungsschritten gezeigt, die in einem Ausführungsbeispiel der Ionenidentifizierungs- und Filterverarbeitung 24 enthalten sein können, die zuvor in Verbindung mit 1 beschrieben wurde. Bei einem Schritt 402 werden die Spektren als ein Ergebnis einer Massenspektrometerverarbeitung erzeugt, z. B. ein LC/MS-Datensatz einer Zeitserie von Spektren. Der Datensatz kann als drei Spalten von Daten dargestellt werden, die eine Abtastzahl, einen m/z-Wert und eine entsprechende Intensität umfassen. Dies kann so sein, wie in der beispielhaften Anzeige 280 aus 7 dargestellt ist. Der gleiche Satz von Eingangsdaten kann auch als eines oder mehrere XICs dargestellt sein, die hierin an anderer Stelle beschrieben sind, wobei jeder m/z-Wert über der Zeit überwacht wird. Jedes XIC ist die Abtastzahl oder Zeit auf der x-Achse, wobei die Intensität über der Zeit auf der y-Achse überwacht wird. Es gibt einen XIC für jeden m/z-Wert. Das Format der Daten, die in Verbindung mit den hierin beschriebenen Verarbeitungsschritten verwendet werden, ist eine zweidimensionale Matrix, die einen Zeilenindex auf der y-Achse des m/z-Verhältnis und einen Spaltenindex auf der Y-Achse einer Abtastzahl aufweist. Der Wert innerhalb einer Zelle oder eines Eintrags, identifiziert durch eine Zeile und eine Spalte, ist der zugeordnete Intensitätswert.

Bei einem Schritt 404 können die Daten mit null oder mehr Filtern gefiltert werden, um Rauschkomponenten zu entfernen und/oder den Datensatz in bestimmte m/z-Bereiche oder Zeiträume zu partitionieren. Es wird darauf verwiesen, daß, um das „Rauschen" in dem zu analysierenden Datensatz zu reduzieren, die Auswahl von Filtern und die bestimmte Kombination und Reihenfolge, die verwendet wird, abhängig von der Qualität der Daten variieren kann. Bei einem Ausführungsbeispiel z. B. können die folgenden Filtertechniken verwendet werden:

  • 1. Abschneiden der Daten unterhalb einer bestimmten Schwelle
  • 2. Medianwert-Filter
  • 3. 2-D-Gauss-Faltung-Filter
  • 4. Entfernen von Gleichstrom-Rauschen unter Verwendung von Gleichstrom-Filtertechniken

Diese und weitere Filtertechniken sind z. B. in W.K. Pratt mit dem Titel „Digital Image Processing" (Digitalbildverarbeitung) von John Wiley & Sons, 1991, New York, zu finden.

Unter Verwendung der vorangegangenen Typen von Filtertechniken bei einem exemplarischen Ausführungsbeispiel ist die Ausgabe der Filterverarbeitung aus Schritt 404 eine Datenmatrix mit der gleichen Anzahl von Spalten (Abtastungen oder Zeitpunkten) wie die ursprüngliche Matrix. Ein Ausführungsbeispiel kann als ein Ergebnis der Verarbeitung aus Schritt 404 im Vergleich zu der Anzahl von Zeilen in dem ursprünglichen Datensatz aufgrund der Entfernung der null Zeilen, die durch ein Filtern von Rauschen erzeugt werden, eine reduzierte Anzahl von Zeilen aufweisen. Die Größe der Datenreduzierung hängt von der Grenzschwelle in Schritt 1 oben sowie anderen Filterparametern ab, die in Verbindung mit der Verarbeitung der Schritte 2 bis 4 verwendet werden, die bei einem Ausführungsbeispiel verwendet werden kann. Bei einem Ausführungsbeispiel in Verbindung mit den Schritten 1 bis 4, wie oben herausgestellt, können die vorangegangenen Parameter mit zugeordneten Verarbeitungsschritten verwendet werden: Schritt 1) schneidet Werte ab, die kleiner als 5% des Maximums sind, Schritt 2) 5 × 5-Medianwert-Filtern und Schritt 3) Verwenden eines Gauss-Filters mit einer Breite, die in etwa die erwartete Breite der Chromatographiespitzen ist. In Verbindung mit dem oben angemerkten Filterschritt 4 ist keine Parameterauswahl nötig. Es wird darauf verwiesen, daß die vorangegangenen Techniken, sowie Richtlinien für deren Verwendung, bekannt sind.

Ein Ausführungsbeispiel kann bei einem Ausführungsbeispiel jede Kombination von Hardware und/oder Software zur Implementierung der vorangegangenen Filterverarbeitung verwenden. Bei einem Ausführungsbeispiel unter Verwendung von Software zur Implementierung der vorangegangenen Filterschritte und einer weiteren hierin beschriebenen Verarbeitung können eine oder mehrere Programmiersprachen, wie z. B. C, C++, Java, FOTRAN, und/oder eines oder mehrere Softwarepakete, wie z. B. MATLAB, verwendet werden. Die bestimmten Elemente können gemäß dem, was in jeder Implementierung verfügbar ist, variieren.

Als eine Alternative zu oder zusätzlich zu der Filterverarbeitung bei Schritt 404 kann ein Ausführungsbeispiel den Datensatz partitionieren, um die Anzahl von Zeilen in der Datenmatrix zu reduzieren. Ein Ausführungsbeispiel kann z. B. nur diejenigen Zeilen von Daten innerhalb eines bestimmten m/z-Bereichs auswählen. Datenspitzen können z. B. bestimmt werden und ein bestimmter m/z-Bereich kann für einen Bereich von Werten beim Aufspannen einer Datenspitze ausgewählt werden. Die Verwendung einer Partitionierung bei diesem Verarbeitungsschritt bezieht sich auf ein Verfahren zur Datenreduzierung. An einem bestimmten Punkt wird eine Partitionierung unter Umständen bei einem Ausführungsbeispiel aufgrund von Speichereinschränkungen aufgrund der Größe der resultierenden Korrelationsmatrix, die in an anderer Stelle beschriebenen Verarbeitungsschritten gebildet und verwendet wird, nötig. Die Größe der Korrelationsmatrix hängt von der Anzahl von Zeilen in der ursprünglichen Datenmatrix (Anzahl von Nicht-Null-Massenabtastwerten) ab. Es wird z. B. ein Ausführungsbeispiel betrachtet, das die hierin beschriebenen Verarbeitungsschritte in Verbindung mit dem Flußdiagramm 400 unter Verwendung von Flugzeit-(TOF-)Datensätzen durchführt, die mehr als 100.000 Massenabtastwerte für jedes Spektrum in dem Datensatz aufweisen. Wenn alle m/z-Zeilen des Datensatzes betrachtet werden, und zwar unter der Annahme, daß kein Abschneiden oder Filtern auftritt, weist die Korrelationsmatrix 1e10 Elemente auf, was mit 4 Bytes pro Element zu einer 39 GB-Matrix führt. Ein Ausführungsbeispiel kann die Partitionierungstechnik verwenden, um die Größe der Matrix zu reduzieren.

Wieder Bezug nehmend auf 7 kann der Graph 280 durch einen Datensatz in Matrixform dargestellt sein, der in dem dargelegten Datensatz z. B. etwa 250 m/z-Zeilen aufweist. Tatsächliche Datensätze neigen dazu, sehr viel größer zu sein, dies dient jedoch als ein gutes Beispiel. Bezug nehmend auf den Graphen 280 können sechs Hauptspitzen unterschieden werden. Eine Spitzenfindungsroutine kann verwendet werden, um die Hauptspitzen Bezug nehmend auf eine bestimmte Abtastzahl zu lokalisieren. Eine Spitzenfindungstechnik, die bei einem Ausführungsbeispiel verwendet werden kann, basiert auf der Berechnung von Ableitungen. Bei dem Spitzenmaximum z. B. ist die erste Ableitung 0 und die zweite Ableitung ist negativ. Die Spitzenfindungsroutine kann in der Zeit- und der m/z-Dimension durchgeführt werden, um die Spitzen zu finden. Ein Bereich von Abtastungen kann ausgewählt werden, ein +/––Bereichswert der Spitze, und nur Abtastungen für die Maxima können untersucht werden. Die mehreren Zeilen in jeder Spitze können z. B. durch ein Kombinieren der Zeilen durch ein Addieren derselben reduziert werden. Ein Ausführungsbeispiel kann auch den Medianwert von Proben nehmen. Ein Ausführungsbeispiel kann auch die maximale repräsentative Zeile für die Massenspitze auswählen. Ein weiteres Ausführungsbeispiel kann die Verwendung von Bildverarbeitungsalgorithmen umfassen, wie z. B. des Wasserscheidenalgorithmus, um eine Spitzenfindung gleichzeitig in der Zeit- und der m/z-Dimension durchzuführen. Der Wasserscheidenalgorithmus, sowie weitere Bildverarbeitungstechniken, sind in der Technik bekannt und z. B. in K.R. Castleman, „Digital Image Processing" (Digitalbildverarbeitung), Prentice-Hall Inc., New Jersey, 1996 beschrieben. Bei diesem Ausführungsbeispiel, das den Wasserscheidenalgorithmus verwendet, wird der Datensatz als ein Bild behandelt, wie z. B. in 13 gezeigt ist. Als erstes werden die lokalen Maxima unter Verwendung einer Erweiterte-Minima-Transformierung bestimmt und auf das Bild übertragen, wie z. B. in Pierre Soille, Morphological Image Analysis: Principles and Applications, (Morphologische Bildanalyse: Prinzipien und Anwendungen), Springer-Verlag, 1999, Seiten 170–171, beschrieben ist. Dies hilft eine Übersegmentierung während nachfolgender Verarbeitungsschritte zu reduzieren. Als nächstes wird eine Wasserscheidensegmentierung bezüglich des Bildes durchgeführt, die die Spitzengrenzen (in Zeit und Masse) erfaßt und Spitzen segmentiert, die nicht vollständig aufgelöst sind. Ein Verwenden des Vorangegangenen weist mehrere Vorteile auf. Die Spitzen, die aus mehreren Massenzeilen oder Chromatogrammen bestehen, können in ein Einspitzenchromatogramm kombiniert werden, indem alle Intensitäten innerhalb der Spitzengrenze auf eine Zeile-für-Zeile-Weise summiert werden. Die Spitzenchromatogramme können dann als Eingaben in den Gruppierungsalgorithmus dienen, anstatt daß jede Massenzeile in dem Datensatz verwendet wird. Dies führt zu einer wesentlichen Reduzierung der Anzahl von Zeilen, die in den Gruppierungsalgorithmus eingegeben werden, sowie einer kleineren Größe der resultierenden Korrelationsmatrix. Zusätzlich ist ein Spitzenteilen mit dieser Technik nicht mehr notwendig, da die Spitzenerfassung dies automatisch durchführt. Ferner kann eine Quantitation durch ein Summieren der Intensitäten innerhalb der Spitzengrenzen durchgeführt werden.

Ein Verwenden eines der vorangegangenen Elemente führt zu einem Zusammenfallen der mehreren Zeilen in eine Spitze. Es wird darauf verwiesen, daß unterschiedliche hier verwendete Techniken nachfolgende Verarbeitungsschritte bewirken können. Wenn z. B. Zeilen miteinander addiert werden, wird die bei Schritt 414 in 10 gezeigte Verarbeitung ebenso beeinflußt. Ohne derartige Spitzenfindungsroutinen werden mehrere Zeilen von Daten für eine einzelne Spitze in einer Datenmatrix als Eingabe in eine Korrelationsroutine verwendet, was aufgrund der hohen Korrelation von Zeilen innerhalb einer einzelnen Spitze redundant ist. Wieder Bezug nehmend auf den beispielhaften Datensatz mit 250 Zeilen kann dieser auf eine Matrix von 6 bis 10 Zeilen reduziert werden, entsprechend der Anzahl von Spitzen, was auch die Größe der Korrelationsmatrix reduziert.

Es wird darauf verwiesen, daß die Partitionierung gegenüber einem Filtern für einen großen Datensatz, der z. B. größer als 10.000 m/z-Abtastwerte ist, aufgrund der Computerressourcen und der Zeit, die zum Durchführen einer Verarbeitung der großen Datensätze benötigt wird, bevorzugt werden kann.

Bei einem Schritt 406 wird jede Zeile, Gruppe von Zeilen oder Partition unter Verwendung einer bestimmten Funktion mit jeder weiteren Zeile, Gruppe von Zeilen oder Partition korreliert, was eine Korrelationsmatrix erzeugt, die den Grad darstellt, zu dem die Zeilen aufeinander bezogen sind. Jede Zeile stellt Intensitäten über der Zeit für einen bestimmten m/z-Bereich dar. Die resultierende Korrelationsmatrix ist eine zweidimensionale Matrix, die symmetrisch um die Diagonale ist, derart, daß die Diagonaleneinträge 1 sind und der obere und der untere Dreiecksabschnitt identisch sind. Anders ausgedrückt ist jeder Eintrag, der die Tiefstellungen „i, j," aufweist, der gleiche Wert in dem Eintrag mit den Tiefstellungen „j, i". Die Korrelation für zwei Zeilen x und y kann folgendermaßen dargestellt werden:

wobei „mx" den Mittelwert der Zeile x darstellt, „my" den Mittelwert der Zeile y darstellt und der Index „i", der von 1 bis n variiert, den Index des Eintrags in der Zeile darstellt, wobei n die Gesamtzahl von Zeilen ist. Bei einem Schritt 408 wird die Korrelationsmatrix mit 0 oder mehr Filtern verarbeitet, um die Korrelationswerte weiter zu verfeinern. Bei einem Schritt 410 kann die Kreuzkorrelationsmatrix unter Verwendung einer bestimmten Funktion oder Funktionen gruppiert bzw. geclustert werden, um stark korrelierte m/z-Bereiche miteinander zu gruppieren oder Gruppen von m/z-Bereichen zu identifizieren. Eine bestimmte Cluster- oder Gruppierungstechnik ist an anderer Stelle hierin detaillierter beschrieben. Ein Ausführungsbeispiel kann auch andere Cluster- oder Gruppierungstechniken verwenden, wie z. B. ein hierarchisches Gruppieren, ein K-Mittel-Gruppieren und andere. Derartige Techniken sind z. B. in G.A.F. Seber, Multivariate Observations (Multivariate Beobachtungen), Wiley, New York, 1984 und H. Spath, Cluster Dissection and Analysis: Thoery (Gruppierungszergliederung und -analyse: Theorie), FORTRAN Programs, Beispiele, übersetzt durch J. Goldschmidt, Halsted Press, New York, 1985 beschrieben.

Bei einem Schritt 412 wird jedes Cluster oder jede Gruppe von m/z-Bereichen durch eine Funktion geleitet, um einen Satz relevanter Abtastungen auszuwählen, die interessierende Perioden darstellen. Bei einem Ausführungsbeispiel können die eine oder die mehreren Abtastungen durch ein anfängliches Bestimmen eines Maximalpunktes durch ein Summieren der Intensitäten der XICs an jedem Abtastpunkt innerhalb jeder Gruppe, z. B. durch ein Addieren der Zeilen des Datensatzes für alle Zeilen innerhalb jeder Gruppe, bestimmt werden. Die Abtastung, die dem maximalen Punkt oder der Spitzenintensität entspricht, kann als eine interessierende Abtastung bestimmt werden. Ein Ausführungsbeispiel kann außerdem mehr als eine interessierende Abtastung durch ein Bestimmen eines Abtastbereichs, z. B. unter Verwendung des Spitzen- oder Maximalwertes, bestimmen. Die ausgewählten interessierenden Abtastungen können diejenigen Abtastungen sein, die innerhalb eines +/––Bereichswerts der Spitze fallen, wobei der Bereichswert mit einem Ausführungsbeispiel variieren kann. Der Bereichswert kann z. B. 1/2 des Spitzenwerts sein.

Eine Technik zum Auswählen des Bereichs einer Chromatographiespitze besteht darin, den Bereich auszuwählen, der die volle Breite bei halbem Maximum (FWHM) ist, was bedeutet, daß der Bereich zwischen den beiden Punkten auf jeder Seite der Spitze ausgewählt wird, die auf halber Höhe der Spitze liegen. Weitere Ausführungsbeispiele können weitere Techniken zur Bereichsbestimmung verwenden.

Wie dies hierin beschrieben ist, variieren die eine oder die mehreren interessierenden Abtastungen mit dem Ausführungsbeispiel. Ein Ausführungsbeispiel kann einen einzelnen Punkt als eine interessierende Abtastung bestimmen, die z. B. das maximale durchschnittliche Ionensignal für die ausgewählten m/z-Werte oder den Zeitschwerpunkt der Gruppe darstellt. Ein Ausführungsbeispiel kann einen Bereich von Abtastungen, wie z. B. den vollständigen Satz von Abtastungen auswählen, die ein Signal für ausgewählte m/z-Werte aufweisen, und dergleichen. Mehr als eine Abtastung kann z. B. ausgewählt werden, wenn das Signal schwach ist und/oder ein übermäßiges Rauschen vorliegt, um das Signal-Rausch-Verhältnis zu erhöhen. Eine Technik summiert alle Spalten, die ein Signal für die Gruppe enthalten, um das Signal zu maximieren.

Die Steuerung fährt mit einem Schritt 413a fort, bei dem eine Bestimmung durchgeführt wird, ob eine Quantitation durchgeführt wird. Quantitation bezieht sich im allgemeinen auf den Verarbeitungsschritt eines Bestimmens einer Menge oder Quantität eines Moleküls anstatt auf ein Identifizieren eines bestimmten Typs oder Typen von Molekülen. Wenn eine Quantitation durchgeführt wird, fährt die Steuerung mit einem Schritt 413b fort, bei dem Zeilen (Chromatogramme) miteinander addiert werden. Eine relative Quantitation wird durch eine Integration einer Chromatographiespitze durchgeführt, um den Spitzenbereich zu erhalten, der proportional zu der Quantität der Komponente in der Mischung ist. Die vorangegangene Integration summiert die Intensitäten für einen bestimmten m/z-Bereich zwischen zwei Zeitpunkten, die die interessierende Spitze aufspannen.

Bei einem Schritt 414 können der oder die m/z-Werte für jedes Cluster oder jede Gruppe, wie dies in dem Eingangsdatensatz enthalten ist, verwendet werden, um ein abgetastetes Spektrum für jede der Abtastungen zu erzeugen, die in Schritt 412 ausgewählt werden, was nur die m/z-Werte der Gruppe darstellt. Anders ausgedrückt wird für jeden eines oder mehrerer interessierender Abtastwerte eine entsprechende Spalte von Intensitäten aus dem ursprünglichen Datensatz verwendet, um ein Spektrum für jede Gruppe zu erzeugen. Es wird darauf verwiesen, daß, wenn die Verarbeitung aus Schritt 414 durchgeführt wird, ein Ausführungsbeispiel den ursprünglichen Datensatz oder eine gefilterte Form des ursprünglichen Datensatzes verwenden kann, um die resultierenden Spektren zu erzeugen.

Die bei Schritt 402 erzeugten Eingangsdaten, die in der vorangegangenen Verarbeitung verwendet werden, können durch ein Laufenlassen des Massenspektrometers bei Normalenergiepegeln (U-Spektrum), Hoch-Fragmentierungs-Energiepegeln (F-Spektrum) oder in einem abwechselnden Abtastmodus, der abwechselnd U- und F-Spektren erzeugt, gesammelt werden. Wenn ein abwechselnder Abtastmodus verwendet wird, der Datensätze erzeugt, die abwechselnd U- und F-Spektren umfassen, kann die Chromatographiekorrelation der Stamm-Peptide (U-Spektren) und ihrer jeweiligen Fragmentionen (F-Spektren) verwendet werden, um Stämme ihren Fragmenten zuzuordnen. Diese Charakteristik von Zeit- oder Abtastkorrelation zwischen Stämmen und zugeordneten Fragmenten kann z. B. in Fällen verwendet werden, in denen mehrere Stämme gleichzeitig fragmentiert werden, jedoch ausreichende Unterschiede in ihren jeweiligen Elutionsprofilen zeigen. Die jeweiligen Unterschiede in dem Elutionsprofil machen es möglich, daß eine Unterscheidung zwischen den unterschiedlichen Stämmen an geeignete Fragmente angepaßt werden kann.

Wenn die Eingangsdaten unter Verwendung des abwechselnden Abtastmodus erzeugt werden, können zwei unterschiedliche Ansätze bei einer Verarbeitung der Eingangsdaten verwendet werden. Beide Ansätze sind in den folgenden Absätzen beschrieben. Bei einem ersten Ansatz können das U- und das F-Spektrum kombiniert werden. Bei einem zweiten alternativen Ansatz können das U- und das F-Spektrum separat verarbeitet werden.

Für den ersten Ansatz werden die U- und die entsprechenden F-Spektralpaare vor einem Durchführen von Schritt 406 miteinander addiert. Es wird darauf verwiesen, daß das F-Spektrum vor einem Durchführen der Summierung des F- und des entsprechenden U-Spektrums gefiltert werden kann. Diese Filterung kann z. B. aufgrund der geringeren Intensität von Fragmentierungsspektren durchgeführt werden. Bei einem Ausführungsbeispiel wird eine Kombination aus Basislinien-Subtraktion, Kalman-Glättung und Savitzky-Golay-Filterung durchgeführt. Nach der Durchführung der Summierung kann eine zusätzliche Filterung ebenso bezüglich der zusammengesetzten Spektren durchgeführt werden. Korrelation, Filtern, Gruppieren, Auswahl relevanter Abtastungen und eine weitere Verarbeitung, die den Schritten 406, 408, 410 und 412 zugeordnet ist, fährt dann, wie hierin an anderer Stelle beschrieben, fort, was zu einem Satz von Komponentenspektren (U und F kombiniert) führt. In den folgenden Absätzen wird dies als der A-Satz bezeichnet. Wenn die Schritt 414 zugeordnete Verarbeitung durchgeführt wird, werden zwei unterschiedliche Spektren erzeugt – eines aus dem ursprünglichen U-Spektrum bei einer ausgewählten Abtastung für eine Gruppe und ein zweites F-Spektrum, das bei der gleichen Abtastung abgetastet wird.

Bei dem ersten Ansatz können die Vorläufer-(Stamm-)Ionen durch ein anfängliches Herleiten der A-Satz-Spektren, die kombiniert U und F darstellen, und ein darauffolgendes Abtasten des ursprünglichen Nur-U-Datensatzes bei den Massen, die in dem Satz A vorhanden sind, und bei dem Abtastmaximum, das für den Satz A identifiziert ist, identifiziert werden. Die Stammionen sind dort, wo Intensitäten bei den abgetasteten Massen in den Nur-U-Spektren vorliegen.

Die kombinierten Spektren in dem A-Satz sollten unter der Annahme, daß keine Stämme exakt die gleichen Chromatographieprofile aufweisen, den m/z-Wert des Stamms mit Fragmenten von nur diesem Stamm enthalten. Der nächste Schritt besteht darin zu bestimmen, welcher m/z-Wert in diesem A-Spektrum der Stamm ist. Die in dem A-Spektrum identifizierten m/z-Werte werden dann verwendet, um die ursprünglichen U-Spektren bei dem für das Spektrum A identifizierten Abtastmaximum abzutasten. Intensitäten, die bei diesen abgetasteten Massen in dem U-Spektrum auftreten, zeigen die Stamm-Ionenmassen an. Die Abwesenheit eines Signals bei einem abgetasteten Wert von m/z zeigt ein Fragmention an. Durch ein Durchführen des Vorangegangenen werden die Stammmassen innerhalb des kombinierten U-F-Komponentenspektrums, des Spektrums A, identifiziert.

Zusätzlich zu dem ersten Summierungsansatz kann ein zweiter Zeitkorrelationsansatz eingesetzt werden. Die Korrelationsverarbeitung aus Schritt 406 kann z. B. separat bezüglich des U- und des F-Datensatzes durchgeführt werden. Das U- und das F-Spektrum können mit den oben beschriebenen Abtastwerten in einem abwechselnden Modus abgetastet werden. Es sollte darauf verwiesen werden, daß zur Verwendung dieses zweiten Ansatzes die F-Spektren ein ausreichendes Signal-Rausch-Verhältnis für eine zufriedenstellende Korrelation aufweisen sollten. Falls dies nicht der Fall ist, kann sich die Summierungstechnik unter Umständen besser eignen. Zusätzlich können, wie bei dem Summierungsverfahren, Filtertechniken bezüglich jedes des F- und/oder des U-Spektrums durchgeführt werden. Es wird darauf verwiesen, daß unterschiedliche Filtertechniken bei einem Ausführungsbeispiel aufgrund des typischen niedrigeren Signal-Rausch-Verhältnis bezüglich der F-Spektren verwendet werden könnten, was die F-Spektren fehlerempfindlicher macht. Wie bei dem Summierungsverfahren sollte eine 1-zu-1-Entsprechung zwischen den Spektren in sowohl dem U- als auch dem F-Satz, den Stämmen in den Sätzen von U und den Fragmenten in den Sätzen von F, zeitkorreliert, vorliegen.

Bezug nehmend auf 11 ist ein Flußdiagramm 600 von Verfahrensschritten eines Ausführungsbeispiels zum Durchführen einer Verarbeitung von Eingangsspektren, die unter Verwendung eines Massenspektrometers erzeugt werden, das in einem abwechselnden Abtastmodus arbeitet, gezeigt. Das Flußdiagramm 600 faßt die oben beschriebenen Verarbeitungsschritte zusammen.

Bei einem Schritt 602 wird eine Bestimmung durchgeführt, ob der Eingangsdatensatz abwechselnd U- und F-Spektren umfaßt. Falls dies nicht der Fall ist, fährt die Steuerung mit einem Schritt 604 fort, bei dem die in Verbindung mit dem Flußdiagramm 400 beschriebenen Verarbeitungsschritte durchgeführt werden können, um den Eingangsdatensatz zu verarbeiten. Andernfalls fährt die Steuerung mit einem Schritt 606 fort, bei dem eine Bestimmung hinsichtlich dessen durchgeführt wird, ob eine Filterung bezüglich der separaten U- und/oder F-Spektren durchgeführt wird. Falls dies der Fall ist, fährt die Steuerung mit einem Schritt 608 fort, bei dem die Filterung vor Schritt 610 durchgeführt wird. Bei Schritt 610 wird eine Bestimmung hinsichtlich dessen geführt, ob die Summierungstechnik, der erste oben beschriebene Ansatz, durchgeführt werden soll. Falls dies der Fall ist, fährt die Steuerung mit einem Schritt 616 fort, bei dem ein U- und ein benachbartes F-Spektrum miteinander addiert werden. Bei einem Schritt 618 kann eine Filterung wahlweise bezüglich der kombinierten U-F-Spektren durchgeführt werden. Bei einem Schritt 620 werden die Korrelation und weitere Verarbeitungsschritte, wie z. B. 406, 408, 410, 412 und 414, die in dem Flußdiagramm 400 beschrieben sind, durchgeführt, was resultierende kombinierte U-F-Spektren erzeugt, die als ein Satz A bezeichnet werden. Bei einem Schritt 622 werden die m/z-Werte, die in dem A-Spektrum identifiziert werden, dann verwendet, um die ursprünglichen U-Spektren bei dem Abtastmaximum abzutasten, das für das Spektrum in dem Satz A identifiziert wird. Bei einem Schritt 624 werden Stammion-m/z-Werte als diejenigen bestimmt, die einen Intensitätswert > 0 aufweisen. Die Abwesenheit eines Signals bei einem abgetasteten m/z-Wert, derart, daß die Intensität gleich 0 ist, zeigt ein Fragmention an.

Wenn bei Schritt 610 bestimmt wird, daß die Summierungstechnik nicht verwendet wird, wird der alternative zweite Ansatz, der Zeitkorrelationsansatz, verwendet. Bei einem Schritt 612 werden eine Korrelation und weitere Verarbeitungsschritte, wie z. B. 406, 408, 410, 412 und 414, die in dem Flußdiagramm 400 beschrieben sind, separat bezüglich des U- und des F-Spektrums durchgeführt. Bei Schritt 614 werden die Stämme an entsprechende Fragmente unter Verwendung der Korrelation von Zeitschwerpunkten für die verarbeitete U- und F-Gruppe angepaßt.

Es wird darauf verwiesen, daß das Massenspektrometer in dem abwechselnden Abtastmodus eine Abtastgeschwindigkeit verwenden kann, die sehr viel höher als die Geschwindigkeit ist, mit der Komponenten eluieren. Bei einem Ausführungsbeispiel z. B. ist die Abtastgeschwindigkeit um einen Faktor von 10 oder mehr höher als die Geschwindigkeit, mit der Komponenten aus dem Massenspektrometer eluieren. Ausgewählte Abtastgeschwindigkeiten sind hierin an anderer Stelle beschrieben.

Wenn der Eingangsdatensatz nur U-Spektren ohne Fragmente umfaßt, wird die Analyse durchgeführt, um jedes Peptid in der Mischung oder Molekül in der Probe zu prüfen. Jede Gruppe entspricht den geladenen Zuständen und Isotopen eines einzelnen Peptids oder Moleküls, die gleichzeitig koeluieren. Wenn der Eingangsdatensatz nur U-Spektren umfaßt, können die hierin beschriebenen Techniken verwendet werden um zu bestimmen, welche m/z-Verhältnisse von Spitzen von dem gleichen Peptid oder Molekül sind. Dies kann ein nützlicher Vorverarbeitungsschritt vor einem Durchführen von z. B. einer Ladungszuweisung, Isotopgruppierung, De-Novo-Sequenzierung, Datenbanksuche und dergleichen sein.

Wenn der Eingangsdatensatz nur F-Spektren umfaßt, entspricht jede Gruppe den Ladungszuständen, Isotopen und Fragmenten eines einzelnen Peptids oder Moleküls, die gleichzeitig ko-eluieren.

Bezug nehmend auf 12 ist ein Flußdiagramm 700 von Verfahrensschritten eines exemplarischen Ausführungsbeispiels eines Cluster- oder Gruppierungsprozesses gezeigt. Die Verfahrensschritte des Flußdiagramms 700 können als Teil der Verarbeitung von Schritt 410 durchgeführt werden. Die Eingabe bei einem Schritt 702 ist die Korrelationsmatrix C, erzeugt als ein Ergebnis der Verarbeitung aus Schritt 406. Bei Schritt 702 wird die Zeile „i" der Matrix C als die Zeile mit der größten Größe bestimmt. Die Größe eines Vektors kann auf unterschiedliche Weisen definiert sein. Bei einem Ausführungsbeispiel z. B. kann die Größe als eine p-Norm eines Vektors für 1 <= p <= unendlich, wobei p ein Ganzzahlwert ist, für einen Vektor x1 definiert sein, wie folgt:

Der Vektor x kann „n" Werte umfassen, die jeweils echte oder komplexe Elemente sind. In dem Fall, in dem p = unendlich gilt, trifft das Folgende zu:

Ein Ausführungsbeispiel kann auch weitere Typen von Normen beim Bestimmen einer Größe verwenden, wie z. B. weitere Normen, die Ableitungen beinhalten, wie z. B. die Sobelev-Norm. Weitere Maße der Größe, die in einem Ausführungsbeispiel enthalten sein können, umfassen: eine Anzahl von Elementen oberhalb einer Schwelle, Entropie, Konzentration, Energielogarithmus und dergleichen, wie z. B. in Wickhauser „Adapted Wavelet Analysis from Theory to Software" (Angepaßte Wavelet-Analyse von Theorie zu Software), 1994, A.K. Peters, Massachuetts und Atkinson „An Introduction to Numerical Analysis" (Eine Einführung in die numerische Analyse), 1989, John Wiley & Sons, USA beschrieben ist.

Bei einem Schritt 704 wird eine Bestimmung durchgeführt, ob die Größe kleiner als eine erste Schwelle ist, oder ob alle Zeilen verarbeitet wurden. Wenn eine Bedingung zutrifft, stoppt die Verarbeitung. Andernfalls fährt die Steuerung mit einem Schritt 706 fort, bei dem mit einer neuen Gruppe mit der ausgewählten Zeile „i", die in der neuen Gruppe enthalten ist, begonnen wird. Eine Abtastung „S", bei der die Zeile „i" maximal ist, wird ebenso bestimmt und als ein Kriterium zum Gruppieren nachfolgender Zeilen verwendet. Die erste Schwelle kann mit jedem Ausführungsbeispiel variieren und kann empirisch gemäß jedem bestimmten Datensatz und Massenspektrometer-Einstellungen und -Charakteristika bestimmt werden. Bei einem Ausführungsbeispiel z. B. kann die erste Schwelle 0,15 sein, die einen minimalen Korrelationswert spezifiziert. Wenn diese erste Schwelle erhöht wird, kann die Anzahl von Gruppen sinken. Bei einem Schritt 708 wird ein Zähler „j" auf den Wert „i + 1" initialisiert. Bei einem Schritt 710 wird eine Bestimmung durchgeführt, ob das gegenwärtige Element, Cij, größer als eine zweite Schwelle ist, sowie, ob die Spitze der Zeile „j" innerhalb einer bestimmten Anzahl von Abtastungen (Schwelle 3) der Abtastung „S" (Spitzenabtastung für die Zeile „i") ist. Bei einem Ausführungsbeispiel z. B. kann diese zweite Schwelle 0,75 und die dritte Schwelle gleich zwei Abtastungen sein. Wenn Cij größer als die Schwelle 2 ist und die Abtastdifferenz kleiner als die Schwelle 3, fährt die Steuerung mit einem Schritt 712 fort, bei dem die Zeile j zu der gegenwärtigen Gruppe hinzugefügt wird, wenn die Zeile j nicht bereits berücksichtigt wurde. Bei einem Schritt 714 wird die Zeile j aus einer weiteren Betrachtung ausgeschlossen und die Steuerung fährt mit einem Schritt 716 fort. Wenn bei Schritt 710 bestimmt wird, daß Cij nicht größer als die zweite Schwelle ist, fährt die Steuerung direkt mit Schritt 716 fort.

Es wird darauf verwiesen, daß die Auswahl der ersten Schwelle (Schwelle 1), wie bei Schritt 704 verwendet wird, und der zweiten Schwelle (Schwelle 2), wie bei Schritt 710 verwendet wird, ausgewählt sein kann, um die Qualität der Gruppierungen der Zeilen zu verbessern und die Anzahl ungruppierter Zeilen zu minimieren. Die Schwelle 1 kann gesenkt werden, um die Anzahl ungruppierter Zeilen zu minimieren, und die Schwelle 2 kann erhöht werden, um die Qualität der Gruppierung zu verbessern. Da eine Auswahl dieser beiden Schwellen voneinander abhängig ist, variiert der für eine ausgewählte Wert bei einem Ausführungsbeispiel mit dem anderen. Es wird angemerkt, daß die Auswahl der Schwelle 3 bei jedem Ausführungsbeispiel variieren kann und als datenabhängig gekennzeichnet sein kann. Die Auswahl der Schwelle 3 kann z. B. abhängig von der Abtastauflösung durchgeführt werden, d. h. wie viele Abtastungen über eine Chromatographiespitze erfaßt werden.

Bei Schritt 716 wird eine Bestimmung durchgeführt, ob alle Spalten in der Zeile „i" verarbeitet wurden. Falls dies nicht der Fall ist, fährt die Steuerung mit einem Schritt 718 fort, bei dem j um 1 erhöht wird, und die Steuerung fährt mit Schritt 710 fort, um das nächste Element in der gegenwärtigen Zeile zu prüfen. Wenn alle Spalten in der Zeile „i" verarbeitet wurden, fährt die Steuerung mit Schritt 702 fort, bei dem die nächste Zeile „i" bestimmt wird.

Es wird darauf verwiesen, daß die oben in Verbindung mit Schritt 704 beschriebene erste Schwelle die Anzahl von Zeilen der Korrelationsmatrix beeinflussen kann, die nicht in einer Gruppe enthalten sind. Die ungruppierten Zeilen können z. B. Rauschen oder einzelne Spitzen umfassen, so daß ein Erhöhen der Grenzschwelle 1 die Anzahl gruppierter Zeilen reduziert und ein Rauschen in dem Datensatz vor einer Korrelation entfernt. Unter Verwendung des beispielhaften Ausführungsbeispiels eines in Verbindung mit 12 beschriebenen Clusterns oder einer Gruppierung beeinflussen die erste und die zweite Schwelle in der Gruppierungs- oder Clusterverarbeitung die Anzahl ungruppierter Zeilen. Die Schwelle 1 und die Schwelle 2 variieren beide zwischen 0 und 1. Die erste Schwelle, Schwelle 1, ist die Schwelle zum Auswählen einer Zeile als gültige Daten aufweisend und die zweite Schwelle, Schwelle 2, ist die Schwelle zum Gruppieren einer Zeile mit einer weiteren. Die Schwelle 3 ist die maximale Trennung (in Abtastungen oder Sekunden), die zwischen der Chromatographiespitze der Zeile und der Chromatographiespitze der Samenzeile erlaubt ist.

Was nun beschrieben wird, ist ein vereinfachtes Beispiel, bei dem die hierin beschriebenen Verfahrensschritte unter Verwendung eines Anfangsdatensatzes in Matrixform durchgeführt werden. Bei dem folgenden Beispiel wird angenommen, daß keine Filterung vorliegt, die in Verbindung mit den Schritten 404 und 408 durchgeführt wird. Zusätzlich wird angemerkt, daß der hierin verwendete Datensatz kein typischer Datensatz ist, sondern eine kleine Abtastmatrix, die zu Darstellungszwecken einer Verwendung hierin beschriebener Techniken ausgewählt ist. Der Korrelationsschritt 406 und der Gruppierungs- oder Clusterschritt 410 werden nun unter Verwendung einer Datenmatrix B (8 × 8) durchgeführt. Jede Zeile stellt ein Massenchromatogramm dar und jede Spalte stellt eine Abtastung oder einen Zeitpunkt dar.

Eine Korrelationsmatrix (8 × 8), C, wird als ein Ergebnis der Verarbeitung von Schritt 406 erzeugt. Die resultierende Matrix C ist wie folgt:

Die Gruppierungs- oder Clusterschritte des Flußdiagramms 700 können durchgeführt werden, um bestimmte Zeilen der Korrelationsmatrix C miteinander zu gruppieren. Ein Gruppenindexvektor (Gruppe), der eine Anzahl von Einträgen gleich der Anzahl von Zeilen in der Korrelationsmatrix aufweist, kann verwendet werden um anzuzeigen, welche Zeilen in der Korrelationsmatrix zu welchen Gruppen gehören. Diese Anzeige kann durchgeführt werden, indem eine Gruppenzahl in jedem Eintrag vorhanden ist, und der n-te Eintrag des Gruppenindexvektors identifiziert die Gruppenzahl der n-ten Reihe der Korrelationsmatrix.

Fortfahrend mit dem vorangegangenen Beispiel ist der zugeordnete Gruppenvektor wie folgt:

Gruppe = 1 0 2 1 0 2 0 1

Um dies weiter darzustellen, kann die Korrelationsmatrix Cl gemäß den Bezeichnungen in dem zugeordneten Gruppenvektor neu geordnet werden, um die Natur des Gruppierungsalgorithmus zu zeigen:

Bezug nehmend auf die 13 bis 17 sind beispielhafte graphische Anzeigen eines Datensatzes an unterschiedlichen Punkten bei der Verarbeitung, wenn die Verfahrensschritte aus 10 durchgeführt werden, gezeigt. 13 zeigt einen Probe-Eingangsdatensatz 1000, der als ein Ergebnis der Verarbeitung aus Schritt 402 erzeugt werden kann. Nach einem Filtern bei Schritt 404 kann der ursprüngliche Datensatz wie in der beispielhaften Anzeige 1100 aus 14 dargestellt sein. Nach dem Korrelationsverarbeitungsschritt 406 kann die Korrelationsmatrix graphisch als 1200 in 15 dargestellt sein. Nach einem Identifizieren von Gruppen oder Clustern durch ein Durchführen der Verfahrensschritte des Flußdiagramms 700 aus 11 können die resultierenden Gruppierungen graphisch durch ein Neuordnen der Korrelationsmatrix wie bei 1300 aus 6 dargestellt werden. Die gefilterten Daten können gemäß dem Gruppenvektor gruppiert werden, der aus einem Durchführen der Schritte des Flußdiagramms 700 resultiert.

Die beispielhafte Anzeige 1400 aus 17 stellt die neu geordneten m/z-Zeilen dar, derart, daß m/z-Zeilen in der gleichen Gruppe benachbart zueinander sind. Nach einem Auswählen eines oder mehrerer relevanter Abtastungen für jede Gruppe können die entsprechenden Intensitäten für die ausgewählten Abtastungen aus dem gefilterten Datensatz erhalten werden, um ein resultierendes Spektrum zu erzeugen. Bei einem hierin beschriebenen Ausführungsbeispiel können die Abtastungen durch ein Finden der Abtastung oder der Zeit ausgewählt werden, bei der jede Gruppe den Korrelationswert maximiert, indem die Zeilen der Datenmatrix für jede Gruppe hinzugefügt werden und die Abtastung mit dem maximalen Intensitätswert ausgewählt wird.

Die vorangegangenen hierin beschriebenen Verarbeitungstechniken können, z. B. in Verbindung mit dem Flußdiagramm 400, unter Umständen in Fällen nicht verwendet werden, in denen zwei oder mehr Moleküle vorliegen, die gleichzeitig eluieren und auch das gleiche Elutionsprofil aufweisen. In diesem Fall sind die vorangegangenen Verarbeitungsschritte nicht in der Lage, die unterschiedlichen Peptide zu identifizieren und ordnungsgemäß Stamm (U-Spektren) mit Fragmenten (F-Spektren) zu paaren, wobei eine weitere Verarbeitungstechnik verwendet werden kann, wie z. B. in der US-Patentanmeldung Nr. 10/388,088, eingereicht am 13. März 2003 mit dem Titel „Methods and Devices for Identifying Biopolymers Using Mass Spectroscopy" beschrieben ist, die im folgenden als „die Offenbarung von Thompson und Fischer" bezeichnet wird. Die Verarbeitungsschritte von Thompson und Fischer können bezüglich der Ergebnisse durchgeführt werden, die durch die hierin beschriebene Verarbeitungsschritte erzeugt werden, um die Stamm-Fragment-Paarungen in Fällen aufzulösen, in denen zwei oder mehr Moleküle gleichzeitig eluieren. Die Offenbarung von Thomson und Fischer beschreibt ein Verfahren zum Sammeln von Strukturinformationen für Biopolymere in einer Probe durch ein Laufenlassen des Massenspektrometers in dem abwechselnden Abtastmodus, wie hierin an anderer Stelle beschrieben ist, mit abwechselnd U- und F-Spektren. Der abwechselnde Abtastmodus sorgt für ein Nehmen eines ersten Spektrums (U-Spektrum) bei Normalenergiepegeln, derart, daß keine Fragmentierung induziert wird, wobei dann eine nächste zweite Abtastung bei höheren Fragmentierungsenergiepegeln (F-Spektrum) genommen wird, bei denen Energie durch eine erhöhte Spannungsdifferenz zwischen Komponenten der Ionisierungsquelle, eine Frequenzstimulierung oder eine weitere Technik injiziert wird, die eine Sequenz abwechselnder Spektren erzeugt, die entfaltet oder zerlegt werden können, um die geeigneten Fragmentionen aus dem F-Spektrum dem geeigneten Stamm in dem U-Spektrum zuzuordnen. Wenn ein Eingangsdatensatz verwendet wird, der Abwechslungsabtastmodusdaten umfaßt, kann die hierin beschriebene Technik ein Vorverarbeitungsschritt sein, der vor dem Verfahren durchgeführt wird, das in der Offenbarung von Thomson und Fischer beschrieben ist, um den geeigneten Stamm den Fragmenten (Paarungen von U- und F-Spektren) zuzuordnen. Eine Ladungszuweisung, eine Isotopgruppierung, eine De-Novo-Sequenzierung, eine Datenbanksuche und dergleichen können nachfolgend durchgeführt werden.

Ein U-Spektrum umfaßt Spitzen, die einigen und vorzugsweise allen Polypeptiden in der Probe entsprechen, wenn diese Polypeptide unfragmentiert sind. Ein U-Spektrum kann durch Erfassen der Polypeptide in der Probe ohne ein Aussetzen derselben gegenüber einem Fragmentierungsmechanismus erhalten werden. Es wird angemerkt, daß ein U-Spektrum in einigen Ausführungsbeispielen Spitzen umfassen kann, die Fragmente dieser Polypeptide darstellen, z. B. Fragmente, die unbeabsichtigt als eine Folge des Mechanismus erzeugt wurden, der zur Ionisierung und/oder Erfassung der Polypeptide in dem Spektrometer verwendet wird.

Ein F-Spektrum umfaßt Spitzen, die einer Sammlung von Fragmenten einiger und vorzugsweise aller Polypeptide in der Probe entsprechen. Ein F-Spektrum kann durch ein Erfassen der Polypeptide in der Probe, nachdem dieselben gegenüber einem oder mehreren Fragmentierungsmechanismen ausgesetzt wurden, erhalten werden. Es wird darauf verwiesen, daß ein F-Spektrum bei einigen Ausführungsbeispielen Spitzen umfassen kann, die unfragmentierte Polypeptide darstellen, z. B. Polypeptide, die eine Aussetzung gegenüber dem Fragmentierungsmechanismus überstehen. Es ist zu erkennen, daß derartige Situationen am wahrscheinlichsten auftreten, wenn die Polypeptide relativ niedrigen Fragmentierungsenergien ausgesetzt werden.

Die hierin beschriebenen Verarbeitungstechniken können auch unter Verwendung von Eingangsdatensätzen mit Mehrmodenchromatogrammen durchgeführt werden, die als Ionen oder Sätze von Ionen mit dem gleichen m/z-Wert, jedoch unterschiedlichen chemischen Zusammensetzungen, gekennzeichnet sind. Graphisch weist eine Mehrmodenkurve mehrere Spitzen auf, wie z. B. dann, wenn die Kurve 3 aus 9 mehrere Spitzen aufweisen würde anstatt nur die einzelne Spitze, wie in der Anzeige 350 gezeigt ist. Ein zusätzlicher Schritt zu dem Flußdiagramm 10 kann verwendet werden, um Mehrmodenkurven, z. B. vor Schritt 406, zu erfassen, bei dem eine Korrelation durchgeführt wird. Falls die Mehrmodenkurven bestimmt werden, wird eine zusätzliche Verarbeitung bezüglich der Eingangsdatensätze durchgeführt. Insbesondere wird eine zusätzliche Verarbeitung vor dem Durchführen von Schritt 406 und als Teil eines Aufbauens der resultierenden Spektren bei Schritt 414 durchgeführt. Diese zusätzliche und modifizierte Verarbeitung ist in den folgenden Absätzen beschrieben.

Mehrmodenspitzen können durch ein Verwenden einer Spitzenfindungstechnik erfaßt werden, die bestimmt, daß eine bestimmte Zeile des ursprünglichen Eingangsdatensatzes mehrere Spitzen in einer einzelnen Kurve aufweist. Obwohl jede einer Vielzahl unterschiedlicher Techniken verwendet werden kann, erfaßt ein Ausführungsbeispiel Spitzen durch ein anfängliches Filtern einer Zeile, so daß eine Basislinie entfernt wird, die bewirkt, daß Spitzen durch Null-Werte getrennt sind. Ein Ende einer Spitze kann durch ein Finden der Abtastung bestimmt werden, bei der die erste Ableitung, die eine Steigung einer Linie anzeigt, negativ ist. Wenn Mehrmodenkurven in einer bestimmten Zeile des Ursprungsdatensatzes bestimmt werden, bevor der Korrelationsschritt 406 durchgeführt wird, können die beiden Kurven z. B. durch ein Teilen der Zeile ursprünglicher Daten in mehrere Zeilen, nämlich eine für jede zusätzliche Spitze, getrennt werden. Die Zeile wird nach jeder Spitze in dem Chromatogramm geteilt. Die verbleibenden Einträge in jeder Zeile können mit Nullen gefüllt werden. Alternativ kann ein Ausführungsbeispiel weitere Techniken verwenden, wie z. B. eine Interpolation und Kurvenanpassungstechniken, um die verbleibenden Einträge aufzufüllen. Es wird z. B. eine Zeile von Daten in der Ursprungsdatenmatrix, wie hierin beschrieben ist, wie folgt betrachtet:

wobei die Spitzenfindungstechnik bestimmt, daß mehrere Spitzen vorliegen, die Elementen 4 und 8 oben mit Werten von 10,0 bzw. 20,0 entsprechen. Ein beispielhaftes Ausführungsbeispiel kann in diesem Fall die vorangegangene Zeile von Daten in zwei Zeilen teilen, wobei eine erste Zeile Elemente 1 bis 6 umfaßt und eine zweite Zeile Elemente 6 bis n umfaßt. Die verbleibenden Elemente in der ersten und der zweiten Zeile können mit Nullen gefüllt sein oder anderweitig gemäß bestimmten Techniken bestimmt werden, wie z. B. Kurvenanpassung und Interpolation, um die Kurven zu korrigieren und fehlende Datenelemente bereitzustellen. Unterschiedliche Kurvenanpassungstechniken sind z. B. in dem Text von C. Daniel und F.S. Wood „Fitting Equations to Data" (Anpassen von Gleichungen an Daten), John Wiley and Sons, New York, 1980 bekannt und beschrieben.

Ein Ausführungsbeispiel kann eine Mehrmodenerfassungs- und Korrekturtechnik umfassen, die unter Verwendung von Hardware und/oder Software implementiert sein kann. Diese Zeilenteilung ermöglicht es, daß ein einzelnes Chromatogramm ein Teil mehrerer Gruppen sein kann.

Ein weiteres Ausführungsbeispiel kann die Verwendung von Bildverarbeitungsalgorithmen, wie z. B. des Wasserscheidenalgorithmus, umfassen, um eine Spitzenfindung in der Zeit- und m/z-Dimension gleichzeitig durchzuführen. Dieser Ansatz würde den Bedarf nach einer Durchführung der zuvor genannten Technik einer Spitzenteilung durch ein Durchführen der Spitzenfindung vermeiden. Zusätzlich würde er dazu dienen, den Datensatz in Spitzen zu partitionieren, wodurch die Größe der Korrelationsmatrix reduziert wird. Dieser Algorithmus sowie weitere Bildverarbeitungstechniken sind in K.R. Castleman „Digital Image Processing", Prentice-Hall Inc., New Jersey, 1996 beschrieben.

In Verbindung mit der Verarbeitung aus Schritt 414 zur Erzeugung eines resultierenden Spektrums wird wieder der ursprüngliche Datensatz verwendet. Insbesondere werden, wie hierin an anderer Stelle beschrieben ist, die geeigneten Spalten von Intensitäten für die ausgewählten Abtastungen aus dem ursprünglichen Datensatz erhalten. Mit Mehrmodendaten sollte angemerkt werden, daß ein m/z-Bereich in mehr als einer Gruppe erscheinen kann.

Ein Ausführungsbeispiel kann jeden unterschiedlicher Typen von Massenspektren verwenden, die z. B. durch ein Flugzeit-(TOF-)Massenspektrometer erzeugt werden können. Ein beispielhaftes Ausführungsbeispiel kann das Beinhalten eines Schritts nach Schritt 402 verwenden, bei dem Eingangsdatensätze in eine kompaktere Form umgewandelt werden, bevor sie mit den vorangegangenen Verarbeitungsschritten verwendet werden. Ein TOF-Datensatz kann z. B. umgewandelt werden, um mit den vorangegangenen Techniken verwendet zu werden. Der TOF-Eingangsdatensatz kann eine zweidimensionale Matrix sein, bei der die Y-Achse die Flugzeit anzeigt, die direkt mit den m/z-Werten korreliert ist, und die Elutionszeit auf der x-Achse gezeigt ist. Jede Spalte der TOF-Daten ist eine Abtastung der Massenspektraldaten. Diese Matrix kann in eine sparsamere Form umgewandelt werden, um eine Speicherung zu minimieren. Die bezüglich der Matrix verwendete Komprimierungstechnik kann gemäß der Funktionalität und bestimmten Komponenten, die bei jedem Ausführungsbeispiel enthalten sind, variieren. Ein beispielhaftes Ausführungsbeispiel verwendet eine MATLAB-Funktion zur Komprimierung der Matrix in ein sparsameres Matrixformat. Alle erforderlichen nachfolgenden Umwandlungen können durch MATLAB durchgeführt werden. Ein Ausführungsbeispiel kann wahlweise abhängig von Speichereinschränkungen und weiteren Charakteristika eines Ausführungsbeispiels weitere Formate verwenden.

Ein Ausführungsbeispiel kann Filtertechniken verwenden, um Rauschen zu reduzieren und Daten, die bekannten Verunreinigungen zugeordnet sind, zu beseitigen. Bestimmte Korrelationswerte einer bekannten Verunreinigung innerhalb eines bestimmten m/z-Bereichs können bei Schritt 408 beseitigt werden. Es wird z. B. der Fall betrachtet, daß eine bekannte Reinigungsmittel-Verunreinigung vorhanden sein kann. Das Vorliegen einer Verunreinigung kann durch ein manuelles Prüfen eines Konturdiagramms und ein visuelles Lokalisieren eines konstanten Horizontalbandes, das bei allen Elutionszeiten vorliegt, bestimmt werden. Eingangsdatensätze können geprüft werden, um automatisch auf bestimmte Verunreinigungen hin zu testen und entsprechend die Bänder von Daten zu entfernen. Es wird darauf verwiesen, daß ein exemplarisches Ausführungsbeispiel vorsehen kann, daß „Rauschen" gefiltert wird, das stark korreliert ist, wie z. B. eine bekannte Verunreinigung, und/oder schwach korreliert ist, wie z. B. eine Interferenz.

Es wird darauf verwiesen, daß die hierin beschriebenen Techniken zum Durchführen einer quantitativen Analyse anstelle einer Identifizierungsverarbeitung verwendet werden können, wie z. B. einem Identifizieren übereinstimmender Fund U-Spektren. Dies kann die zuvor beschriebenen Verarbeitungsschritte beeinflussen. Wenn eine quantitative Analyse unter Verwendung der vorangegangenen Techniken durchgeführt wird, können ausgewählte interessierende Punkte, wie bei Schritt 412, diejenigen umfassen, die häufig über jede Gruppe abgetastet werden, anstatt ein einzelnes Maximum zu bestimmen, wie hierin beschrieben ist. Wie hierin an anderer Stelle beschrieben ist, erzeugt die Verarbeitung von Schritt 414 ein einzelnes Spektrum für jedes Ion, wobei Verunreinigungen und andere ko-variierende Spektren entfernt werden. Zur quantitativen Analyse unter Verwendung der vorangegangenen Techniken wird ein Spektrum für jedes Cluster oder jede Gruppe erzeugt. Zur Quantitation werden die Spitzenbereiche für die Gruppenchromatogramme oder Zeilen integriert. Dies liefert einen Gruppenspitzenbereich, der für eine relative Quantitation mit anderen Gruppen in dem Datensatz verwendet werden kann. Zur Quantitation stellt jedes Cluster oder jede Gruppe unter Verwendung der vorangegangenen Techniken einen Bereich von m/z-Werten und eine Elutionszeit dar, die ein verwandtes Signal enthält.

Das Vorangegangene liefert Techniken, die sich die Tatsache zunutze machen, daß bestimmte Gruppierungen zu einer Ko-Varianz neigen. Stamm- und verwandte Ionenfragmente neigen dazu, zu ko-variieren und ähnliche Ko-Elutionsprofile aufzuweisen. Eingangsdaten, die nur U-Spektren umfassen, können, wenn sie durch die hierin beschriebenen Techniken verarbeitet werden, verwendet werden, um Ladungszustände und isotope einzelne Peptide zu gruppieren, da diese Ladungszustände und Isotope durch ein Ko-Eluieren zur gleichen Zeit ko-variieren. Eingangsdaten, die nur F-Spektren umfassen, können verwendet werden, um Ladungszustand, Isotope und Fragmente, die gleichzeitig ko-eluieren, zu gruppieren. Das Vorangegangene kann auch als ein Vorverarbeitungsschritt in Verbindung mit der Offenbarung von Thomson und Fischer und weiteren Verarbeitungstechniken verwendet werden, um U- und verwandte F-Spektren zu identifizieren, wenn zwei Stamm- oder U-Spektren innerhalb einer Gruppe das gleiche Elutionsprofil aufweisen und gleichzeitig ko-eluieren. Derartige weitere Techniken können z. B. Identifizierungsalgorithmen umfassen, wie z. B. SEQUEST, MASCOT, MSFIT und dergleichen. Diese Techniken sind in der Technik bekannt. SEQUEST ist z. B. in J. K. Eng; A. L. McCormack; J. R. Yates III J. Am. Soc. Mass Spectrom. 1994, 5, 976–989 beschrieben; MASCOT ist in D.N. Perkins; D.J.C. Pappin; D.M. Creasy; J.S. Cottrell Electrophoresis 1999, 20, 3551–3567 beschrieben und MSFIT ist in K.R. Clauser, P.R. Baker und A.L. Burlingame, Role of accurate mass measurement (+/– 10 ppm) in protein identification strategies employing MS or MS/MS and database searching (Rolle einer genauen Massemessung (+/– 10 ppm) bei Proteinidentifizierungsstrategien unter Verwendung von MS oder MS/MS und Datenbanksuche), Analytical Chemistry, Bd. 71, 14, 2871– (1999) beschrieben.

Die Verwendung der Offenbarung von Thomson und Fischer und/oder eine weitere Technik kann verwendet werden, um zwischen zwei unverwandten Komponenten (keine Isotope, Ladungszustände oder Fragmente) zu unterscheiden, die koeluieren und exakt ko-variieren, da die hierin beschriebenen Techniken nicht in der Lage sind, zwischen zwei derartigen unverwandten Verbindungen zu unterscheiden. Unterschiedliche Techniken können verwendet werden, um das Vorliegen einer derartigen Bedingung zu bestimmen, die einen Bedarf anzeigt, alternative Techniken aufzurufen, um diese Stämme ihren entsprechenden Fragmenten zuzuweisen. Ein Ausführungsbeispiel kann wie folgt extrahierte U-Spektren auf das Vorliegen mehrerer Stämme hin testen, zwischen denen die vorangegangenen Techniken nicht unterscheiden können. Eine Isotoprückbildung und Ladungsentfaltung können bezüglich des Spektrums durchgeführt werden, was zu einem neutralen Massenspektrum (nicht m/z) führt. Die mehreren Isotopenverteilungen für jeden Ladungszustand eines einzelnen Peptids oder einer Komponente werden in eine einzelne Massenspitze zusammengebracht. Siehe M.W. Senko, S.C. Beu, F.W. McLafferty, J. Mass Spectrom, Bd. 6, 52– (1995). So resultiert, wenn zwei Peptide oder Komponenten in einem extrahierten U-Spektrum vorhanden sind, diese Entfaltungsprozedur zu zwei Massenspitzen, die den Bedarf anzeigen, eine zusätzliche Verarbeitung aufzurufen, wie z. B: das Verfahren von Thomson und Fischer, um jeden Stamm an seine zugeordneten Fragmentionen anzupassen.

Das Vorangegangene liefert Techniken zum Analysieren der Chromatographieinformationen eines Datensatzes, wie z. B. eines LC/MS-Datensatzes, zur Trennung verwandter Ionen zur nachfolgenden Analyse in Spektren, die einzelne Verbindungen darstellen und die spezifischen Spektren identifizieren, die maximale Signalpegel liefern. Zusätzlich entfernt das Vorangegangene Rauschen aus dem Datensatz, da Rauschen nicht dazu neigt, mit den realen Datensignalen zu kovariieren. Konstante Signale, die aus Verunreinigungen resultieren, neigen ebenso nicht dazu, mit den realen Datensignalen zu ko-variieren, und können ebenfalls herausfallen. Da Rauschen unter Verwendung der vorangegangenen Techniken zusätzlich zu spezifischen angewendeten Filterungstechniken entfernt wird, z. B. bei der Verarbeitung aus Schritt 404, kann die Leistung einer nachfolgenden Verarbeitung, wie z. B. einer De-Novo-Sequenzierung, wesentlich verbessert werden. Das Vorangegangene kann auch zu einer Reduzierung der Größe und Komplexität eines Eingangsdatensatzes führen, der bei einer nachfolgenden Verarbeitung verwendet wird. Die vorangegangenen Techniken können bei der Proteinidentifizierung verwendet werden, können jedoch auch auf andere Klassen von Molekülen angewendet werden, die ähnliche Charakteristika teilen, wie z. B. Polynukleotide, Polysacharide und weitere kleine Moleküle.


Anspruch[de]
  1. Verfahren zum Identifizieren verwandter Ionen in einem Eingangsdatensatz (350), der durch ein Analysieren einer Probe (12) erzeugt wird, mit folgenden Schritten:

    Korrelieren (406) jeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind;

    Gruppieren (410) der Korrelationsmatrix, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe ko-variierende Chromatogramme darstellt;

    Auswählen (412) zumindest eines interessierenden Zeitraums für jede Gruppe; und

    Erzeugen (414) eines resultierenden Spektrums für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppe enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatz.
  2. Verfahren gemäß Anspruch 1, das ferner folgenden Schritt aufweist:

    Filtern des Eingangsdatensatz (350) vor einem Durchführen der Korrelation.
  3. Verfahren gemäß Anspruch 1 oder 2, bei dem der Eingangsdatensatz (350) nur eines eines unfragmentierten Spektrums, eines fragmentierten Spektrums und eines abwechselnd unfragmentierten und fragmentierten Spektrums umfaßt.
  4. Verfahren gemäß Anspruch 3, bei dem der Eingangsdatensatz nur abwechselnd unfragmentierte und fragmentierte Spektren umfaßt, wobei das Verfahren ferner folgende Schritte aufweist:

    Bilden (616) eines kombinierten Spektrums, das ein unfragmentiertes Spektrum und ein verwandtes fragmentiertes Spektrum umfaßt;

    Durchführen des Korrelierens, des Gruppierens, des Auswählens und des Erzeugens (620) unter Verwendung des kombinierten Spektrums;

    Bestimmen von m/z-Werten in dem kombinierten Spektrum;

    Abtasten (622) der unfragmentierten Spektren bei den m/z-Werten in dem kombinierten Spektrum bei einem Abtastmaximum, das für das kombinierte Spektrum identifiziert wird; und

    Bestimmen (624), daß ein abgetasteter m/z-Wert in den kombinierten Spektren einem Stamm zugeordnet ist, wenn eine Intensität bei dem abgetasteten m/z-Wert vorliegt, und Bestimmen, daß der abgetastete m/z-Wert in den kombinierten Spektren einem Fragment zugeordnet ist, wenn kein Signal bei dem abgetasteten m/z-Wert vorliegt.
  5. Verfahren gemäß Anspruch 3, bei dem der Eingangsdatensatz nur abwechselnd unfragmentierte und fragmentierte Spektren umfaßt, wobei das Verfahren ferner folgende Schritte aufweist:

    Durchführen (612) des Korrelierens, des Gruppierens, des Auswählens und des Erzeugens unter separater Verwendung jedes des unfragmentierten Spektrums und des fragmentierten Spektrums; und

    Überprüfen (614) jedes Stamms des unfragmentierten Spektrums auf Übereinstimmung mit verwandten Fragmenten in dem fragmentierten Spektrum durch ein Bestimmen, welche der verwandten Fragmente mit dem Stamm kovariieren.
  6. Verfahren gemäß einem der Ansprüche 1 bis 5, bei dem das Gruppieren ferner folgende Schritte aufweist:

    Bestimmen (702) einer ersten Zeile der Korrelationsmatrix, die ein Element umfaßt, das einen maximalen Korrelationswert aller Korrelationswerte in der Korrelationsmatrix aufweist, die als zu gruppierende Kandidaten betrachtet werden;

    Bestimmen (706) einer Zeitabtastung, die der ersten Zeile zugeordnet ist;

    für jedes Element der ersten Zeile, das einer eindeutigen Paarung einer Zeile „i" und einer Spalte „j" entspricht, Bestimmen (710), ob ein Korrelationswert größer als ein vorbestimmter Wert ist, und Bestimmen, ob eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist; und

    wenn das Element größer als der vorbestimmte Wert ist und wenn eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist, Hinzufügen (712) einer Zeile des Eingangsdatensatzes zu einer gegenwärtigen Gruppe, wobei die hinzugefügte Zeile eine Zeilenzahl aufweist, die gleich der eines Spaltenindex „j" ist, der dem Element zugeordnet ist, und Ausschließen (714) der hinzugefügten Zeile aus einer weiteren Betrachtung als einer der Kandidaten zur Gruppierung.
  7. Verfahren gemäß Anspruch 6, das ferner folgenden Schritt aufweist:

    Durchführen des Bestimmens einer ersten Zeile, wenn ein Korrelationswert größer als ein vorbestimmter Wert ist und wenn eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist, für jedes Element der ersten Zeile, das einen zugeordneten Spaltenindex aufweist, der größer als ein Index ist, der der ersten Zeile zugeordnet ist.
  8. Verfahren gemäß Anspruch 7, das ferner folgenden Schritt aufweist:

    Stoppen (704) einer Bildung von Gruppen durch das Gruppieren, wenn der maximale Korrelationswert kleiner als ein vorbestimmter Wert ist.
  9. Verfahren gemäß Anspruch 8, das ferner folgenden Schritt aufweist:

    Bilden (706) einer neuen Gruppe mit einer Auswahl einer nachfolgenden Zeile, die ein Element umfaßt, das einen maximalen Korrelationswert aller Korrelationswerte in der Korrelationsmatrix aufweist, die als zu gruppierende Kandidaten betrachtet werden.
  10. Verfahren gemäß einem der Ansprüche 3 bis 9, bei dem der Eingangsdatensatz (350) nur abwechselnd unfragmentierte und fragmentierte Spektren umfaßt, wobei der Eingangsdatensatz zumindest zwei Komponenten umfaßt, die gleichzeitig eluieren und ein gleiches Elutionsprofil aufweisen, wobei das Verfahren ferner folgende Schritte aufweist:

    Kombinieren benachbarter fragmentierter und unfragmentierter Spektren, was zu einem neuen kombinierten Datensatz führt, der die Hälfte der Anzahl von Spektren im Vergleich zu einer Gesamtzahl von Spektren der fragmentierten und unfragmentierten Spektren umfaßt;

    Erzeugen eines ersten resultierenden Spektrums und eines zweiten resultierenden Spektrums, wobei das erste resultierende Spektrum dem unfragmentierten Spektrum zu einem ausgewählten Zeitpunkt entspricht und das zweite resultierende Spektrum dem fragmentierten Spektrum zu dem ausgewählten Zeitpunkt entspricht; und

    Durchführen einer Verarbeitung, um zu identifizieren, welche der zumindest zwei Komponenten ein Stamm ist, der zumindest einem Fragment zugeordnet ist, das in dem fragmentierten Spektrum enthalten ist.
  11. Verfahren gemäß einem der Ansprüche 3 und 6 bis 9, bei dem der Eingangsdatensatz (350) nur ein unfragmentiertes Spektrum umfaßt, wobei die zumindest eine Gruppe, die durch das Gruppieren gebildet wird, Ladungszustände und Isotope einer einzelnen Komponente identifiziert, die gleichzeitig ko-eluieren.
  12. Verfahren gemäß einem der Ansprüche 3 und 6 bis 9, bei dem der Eingangsdatensatz (350) nur ein fragmentiertes Spektrum umfaßt, wobei die zumindest eine Gruppe, die durch das Gruppieren gebildet wird, Ladungszustände, Isotope und Fragmente einer einzelnen Komponente identifiziert, die gleichzeitig ko-eluieren.
  13. Verfahren gemäß einem der Ansprüche 1 bis 12, bei dem das Auswählen von interessierenden Zeiträumen folgende Schritte umfaßt:

    Zusammenzählen von Intensitäten extrahierter Chromatogramme für jede Gruppe an jedem Abtastpunkt; und

    Bestimmen einer maximalen Intensität für jede Gruppe bei einem bestimmten Abtastpunkt,

    wobei das Erzeugen eines resultierenden Spektrums folgenden Schritt umfaßt:

    Abtasten extrahierter Chromatogramme jeder Gruppe an dem bestimmten Abtastpunkt.
  14. Verfahren gemäß einem der Ansprüche 1 bis 13, bei dem der Eingangsdatensatz (350) unter Verwendung eines Massenspektrometers erzeugt wird, das die Probe analysiert.
  15. Verfahren gemäß einem der Ansprüche 1 bis 14, bei dem der Eingangsdatensatz zumindest eine Mehrmodenspitze eines extrahierten Ionenchromatogramms umfaßt, wobei eine Anzahl von Spitzen in der Mehrmodenspitze als „n" dargestellt wird, wobei das Verfahren ferner folgende Schritte aufweist:

    Bestimmen zumindest eines Teilungspunktes in der Mehrmodenspitze, um die Mehrmodenspitze in Abschnitte zu unterteilen;

    Zuteilen einer ersten Zeile des Eingangsdatensatzes, der der Mehrmodenspitze entspricht, in Zeilenabschnitte gemäß dem zumindest einen Teilungspunkt;

    Erzeugen von zusätzlichen „n – 1" Zeilen von Daten, die in dem Eingangsdatensatz enthalten sind, wobei jede zusätzliche Zeile einen unterschiedlichen der Zeilenabschnitte umfaßt;

    Entfernen aller Zeilenabschnitte, die in den zusätzlichen Zeilen enthalten sind, aus der ersten Zeile; und

    Füllen verbleibender Elemente jeder der zusätzlichen Zeilen und der ersten Zeile.
  16. Verfahren gemäß einem der Ansprüche 1 bis 15, das ferner folgenden Schritt aufweist:

    Filtern des Eingangsdatensatzes, was einen gefilterten Datensatz erzeugt, wobei die Form des Eingangsdatensatzes der gefilterte Datensatz ist.
  17. Verfahren gemäß einem der Ansprüche 10 bis 16, bei dem zumindest zwei Ionen zwei Stammionen sind, die gleichzeitig ko-eluieren, die das gleiche Elutionsprofil aufweisen und ko-variieren, wobei das Verfahren ferner folgenden Schritt aufweist:

    Durchführen weiterer Verarbeitungsschritte, um jedes der zwei Stammionen entsprechenden Fragmentionen zuzuordnen.
  18. Verfahren gemäß einem der Ansprüche 10 bis 17, bei dem die zumindest zwei Komponenten Stamm-Peptide sind, die gleichzeitig ko-eluieren und ähnliche Elutionsprofile zeigen, wobei das Verfahren ferner folgende Schritte aufweist:

    Bestimmen, daß eine zusätzliche Verarbeitung benötigt wird, um jedes der zumindest zwei Stamm-Peptide an zugeordnete Kind-Fragmente anzupassen; und

    Durchführen der zusätzlichen Verarbeitung.
  19. Verfahren gemäß einem der Ansprüche 10 bis 17, bei dem die zumindest zwei Komponenten Peptide sind.
  20. Verfahren zum Quantifizieren zumindest eines Ions in einem Eingangsdatensatz (350), der durch ein Analysieren einer Probe (12) erzeugt wird, mit folgenden Schritten:

    Korrelieren jeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind;

    Gruppieren der Korrelationsmatrix, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe chemisch verwandte Komponenten darstellt, die ein korreliertes Chromatographieverhalten zeigen;

    Auswählen zumindest eines interessierenden Zeitraums für jede Gruppe; und

    Erzeugen eines resultierenden Spektrums für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes.
  21. Computerprogrammprodukt zum Identifizieren verwandter Ionen in einem Eingangsdatensatz (350), der durch ein Analysieren einer Probe (12) erzeugt wird, mit folgenden Merkmalen:

    einem maschinenausführbaren Code, der jede Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind;

    einem maschinenausführbaren Code, der die Korrelationsmatrix gruppiert, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe ko-variierende Chromatogramme darstellt;

    einem maschinenausführbaren Code, der zumindest einen interessierenden Zeitraum für jede Gruppe auswählt; und

    einem maschinenausführbaren Code, der ein resultierendes Spektrum für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes erzeugt.
  22. Computerprogrammprodukt gemäß Anspruch 21, das ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der den Eingangsdatensatz (350) vor einem Durchführen der Korrelation filtert.
  23. Computerprogrammprodukt gemäß Anspruch 21 oder 22, bei dem der Eingangsdatensatz nur eines eines unfragmentierten Spektrums, eines fragmentierten Spektrums und eines abwechselnd unfragmentierten und fragmentierten Spektrums umfaßt.
  24. Computerprogrammprodukt gemäß Anspruch 23, bei dem der Eingangsdatensatz (350) nur abwechselnd unfragmentierten und fragmentierte Spektren umfaßt, wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist:

    einen maschinenausführbaren Code, der ein kombiniertes Spektrum bildet (616), das ein unfragmentiertes Spektrum und ein verwandtes fragmentiertes Spektrum umfaßt, wobei der maschinenausführbare Code, der korreliert, gruppiert, auswählt und erzeugt, das kombinierte Spektrum verwendet;

    einen maschinenausführbaren Code, der m/z-Werte in dem kombinierten Spektrum bestimmt;

    einen maschinenausführbaren Code, der die unfragmentierten Spektren bei den m/z-Werten in dem kombinierten Spektrum bei einem Abtastmaximum, das für das kombinierte Spektrum identifiziert ist, abtastet (622); und

    einen maschinenausführbaren Code, der bestimmt (624), daß ein abgetasteter m/z-Wert in den kombinierten Spektren einem Stamm zugeordnet ist, wenn eine Intensität bei dem abgetasteten m/z-Wert vorliegt, und bestimmt, daß der abgetastete m/z-Wert in den kombinierten Spektren einem Fragment zugeordnet ist, wenn kein Signal bei dem abgetasteten m/z-Wert vorliegt.
  25. Computerprogrammprodukt gemäß Anspruch 23, bei dem der Eingangsdatensatz nur abwechselnd unfragmentierte und fragmentierte Spektren umfaßt, wobei der maschinenausführbare Code, der korreliert, gruppiert, auswählt und erzeugt, separat jedes des unfragmentierten Spektrums und des fragmentierten Spektrums verwendet, wobei das Computerprogrammprodukt ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der jeden Stamm des unfragmentierten Spektrums auf Übereinstimmung mit verwandten Fragmenten in dem fragmentierten Spektrum durch ein Bestimmen, welche der verwandten Fragmente mit dem Stamm ko-variieren, überprüft.
  26. Computerprogrammprodukt gemäß einem der Ansprüche 21 bis 25, bei dem das Gruppieren ferner folgende Merkmale aufweist:

    einen maschinenausführbaren Code, der eine erste Zeile der Korrelationsmatrix bestimmt (702), die ein Element umfaßt, das einen maximalen Korrelationswert aller Korrelationswerte in der betrachteten Korrelationsmatrix aufweist, die als zu gruppierende Kandidaten betrachtet werden;

    einen maschinenausführbaren Code, der eine Zeitabtastung bestimmt (706), die der ersten Zeile zugeordnet ist;

    einen maschinenausführbaren Code, der für jedes Element der ersten Zeile, das einer eindeutigen Paarung einer Zeile „i" und einer Spalte „j" entspricht, bestimmt (710), ob ein Korrelationswert größer als ein vorbestimmter Wert ist, und bestimmt, ob eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist; und

    einen maschinenausführbaren Code, der, wenn das Element größer als der vorbestimmte Wert ist und wenn eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist, eine Zeile des Eingangsdatensatzes zu einer gegenwärtigen Gruppe hinzufügt, wobei die hinzugefügte Zeile eine Zeilenzahl aufweist, die gleich der eines Spaltenindex „j" ist, der dem Element zugeordnet ist, und die hinzugefügte Zeile aus einer weiteren Betrachtung als einer der Kandidaten zur Gruppierung ausschließt.
  27. Computerprogrammprodukt gemäß Anspruch 26, das ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der die erste Zeile bestimmt, wenn ein Korrelationswert größer als ein vorbestimmter Wert ist und wenn eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahl von Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnet ist, für jedes Element der ersten Zeile, das einen zugeordneten Spaltenindex aufweist, der größer als ein Index ist, der der ersten Zeile zugeordnet ist.
  28. Computerprogrammprodukt gemäß Anspruch 27, das ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der eine Bildung von Gruppen durch das Gruppieren stoppt (704), wenn der maximale Korrelationswert kleiner als ein vorbestimmter Wert ist.
  29. Computerprogrammprodukt gemäß Anspruch 28, das ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der eine neue Gruppe mit einer Auswahl einer nachfolgenden Zeile bildet (706), die ein Element umfaßt, das einen maximalen Korrelationswert aller Korrelationswerte in der Korrelationsmatrix aufweist, die als zu gruppierende Kandidaten betrachtet werden.
  30. Computerprogrammprodukt gemäß einem der Ansprüche 23 bis 29, bei dem der Eingangsdatensatz (350) nur abwechselnd unfragmentierte und fragmentierte Spektren umfaßt, wobei der Eingangsdatensatz zumindest zwei Komponenten umfaßt, die gleichzeitig eluieren und ein gleiches Elutionsprofil aufweisen, wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist:

    einen maschinenausführbaren Code, der benachbarte fragmentierte und unfragmentierte Spektren kombiniert, was zu einem neuen kombinierten Datensatz führt, der die Hälfte der Anzahl von Spektren im Vergleich zu einer Gesamtzahl von Spektren der fragmentierten und unfragmentierten Spektren umfaßt;

    einen maschinenausführbaren Code, der ein erstes resultierendes Spektrum und ein zweites resultierendes Spektrum erzeugt, wobei das erste resultierende Spektrum dem unfragmentierten Spektrum zu einem ausgewählten Zeitpunkt entspricht und das zweite resultierende Spektrum dem fragmentierten Spektrum zu dem ausgewählten Zeitpunkt entspricht; und

    einen maschinenausführbaren Code, der eine Verarbeitung durchführt, um zu identifizieren, welche der zumindest zwei Komponenten ein Stamm ist, der dem zumindest einen Fragment zugeordnet ist, das in dem fragmentierten Spektrum enthalten ist.
  31. Computerprogrammprodukt gemäß einem der Ansprüche 23 und 26 bis 29, bei dem der Eingangsdatensatz (350) nur ein unfragmentiertes Spektrum umfaßt, wobei die zumindest eine Gruppe, die durch das Gruppieren gebildet ist, Ladungszustände und Isotope einer einzelnen Komponente identifiziert, die gleichzeitig ko-eluieren.
  32. Computerprogrammprodukt gemäß einem der Ansprüche 23 und 26 bis 29, bei dem der Eingangsdatensatz (350) nur ein fragmentiertes Spektrum umfaßt, wobei die zumindest eine Gruppe, die durch das Gruppieren gebildet ist, Ladungszustände, Isotope und Fragmente einer einzelnen Komponente identifiziert, die gleichzeitig koeluieren.
  33. Computerprogrammprodukt gemäß einem der Ansprüche 21 bis 32, bei dem das Auswählen von interessierenden Zeiträumen folgende Merkmale umfaßt:

    einen maschinenausführbaren Code, der Intensitäten extrahierter Chromatogramme für jede Gruppe zu jedem Abtastpunkt zusammenzählt; und

    einen maschinenausführbaren Code, der eine maximale Intensität für jede Gruppe zu einem bestimmten Abtastpunkt bestimmt, wobei das Erzeugen eines resultierenden Spektrums folgendes Merkmal umfaßt:

    einen maschinenausführbaren Code, der extrahierte Chromatogramme jeder Gruppe zu dem bestimmten Abtastpunkt abtastet.
  34. Computerprogrammprodukt gemäß einem der Ansprüche 21 bis 33, bei dem der Eingangsdatensatz (350) unter Verwendung eines Massenspektrometers, das die Probe analysiert, erzeugt wird.
  35. Computerprogrammprodukt gemäß einem der Ansprüche 21 bis 34, bei dem der Eingangsdatensatz zumindest eine Mehrmodenspitze umfaßt, wobei der Eingangsdatensatz zumindest eine Mehrmodenspitze eines extrahierten Ionenchromatogramms umfaßt, wobei eine Anzahl von Spitzen in der Mehrmodenspitze als „n" dargestellt ist, wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist:

    einen maschinenausführbaren Code, der zumindest einen Teilungspunkt in der Mehrmodenspitze bestimmt, um die Mehrmodenspitze in Abschnitte zu unterteilen;

    einen maschinenausführbaren Code, der eine erste Zeile des Eingangsdatensatzes, der der Mehrmodenspitze entspricht, in Zeilenabschnitte gemäß dem zumindest einen Teilungspunkt zuteilt;

    einen maschinenausführbaren Code, der zusätzliche „n – 1" Zeilen von Daten erzeugt, die in dem Eingangsdatensatz enthalten sind, wobei jede zusätzliche Zeile einen unterschiedlichen der Zeilenabschnitte umfaßt;

    einen maschinenausführbaren Code, der alle Zeilenabschnitte, die in den zusätzlichen Zeilen enthalten sind, aus der ersten Zeile entfernt; und

    einen maschinenausführbaren Code, der verbleibende Elemente jeder der zusätzlichen Zeilen und der ersten Zeile füllt.
  36. Computerprogrammprodukt gemäß einem der Ansprüche 21 bis 35, das ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der den Eingangsdatensatz filtert, was einen gefilterten Datensatz erzeugt, wobei die Form des Eingangsdatensatz der gefilterte Datensatz ist.
  37. Computerprogrammprodukt gemäß einem der Ansprüche 30 bis 36, bei dem zumindest zwei Ionen zwei Stammionen sind, die gleichzeitig ko-eluieren, die ein gleiches Elutionsprofil aufweisen und ko-variieren, wobei das Computerprogrammprodukt ferner folgendes Merkmal aufweist:

    einen maschinenausführbaren Code, der weitere Verarbeitungsschritte durchführt, um jedes der zwei Stammionen entsprechenden Fragmentionen zuzuordnen.
  38. Computerprogrammprodukt gemäß einem der Ansprüche 30 bis 37, bei dem die zumindest zwei Komponenten Stamm-Peptide sind, die gleichzeitig ko-eluieren und ähnliche Elutionsprofile zeigen, wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist:

    einen maschinenausführbaren Code, der bestimmt, daß eine zusätzliche Verarbeitung benötigt wird, um jedes der zumindest zwei Stamm-Peptide an zugeordnete Kind-Fragmente anzupassen; und

    einen maschinenausführbaren Code, der die zusätzliche Verarbeitung durchführt.
  39. Computerprogrammprodukt gemäß einem der Ansprüche 29 bis 37, bei dem die zumindest zwei Komponenten Peptide sind.
  40. Computerprogrammprodukt zum Quantifizieren zumindest eines Ions in einem Eingangsdatensatz, der durch ein Analysieren einer Probe (12) erzeugt wird, mit folgenden Merkmalen:

    einem maschinenausführbaren Code, der jede Zeile von Daten in einem Eingangsdatensatz mit jeder weiteren Zeile von Daten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswert zugeordnet sind;

    einem maschinenausführbaren Code, der die Korrelationsmatrix gruppiert, was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrix als in der zumindest einen Gruppe befindlich identifiziert, wobei jede Gruppe chemisch verwandte Komponenten darstellt, die ein korreliertes Chromatographieverhalten zeigen;

    einem maschinenausführbaren Code, der zumindest einen interessierenden Zeitraum für jede Gruppe auswählt; und

    einem maschinenausführbaren Code, der ein resultierendes Spektrum für jede Gruppe durch ein Abtasten von Chromatogrammen, die in jeder der Gruppen enthalten sind, zu jedem des zumindest einen interessierenden Zeitraums der Verwendung einer Form des Eingangsdatensatzes erzeugt.
Es folgen 17 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com