PatentDe  


Dokumentenidentifikation DE04711759T1 09.03.2006
EP-Veröffentlichungsnummer 0001596363
Titel SPRACHSYNTHESEVERARBEITUNGSSYSTEM
Anmelder Kabushiki Kaisha Kenwood, Hachioji, Tokio/Tokyo, JP;
National Institute of Advanced Industrial Science and Technology, Tokio/Tokyo, JP
Erfinder SATO, Yasushi, Fukuoka, JP;
KOJIMA, Hiroaki, Tsukuba-shi, Ibaraki 3058568, JP;
TANAKA, Kazuyo, Tsukuba-shi, Ibaraki 3058568, JP
Vertreter LEINWEBER & ZIMMERMANN, 80331 München
Vertragsstaaten AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LI, LU, MC, NL, PT, RO, SE, SI
Sprache des Dokument EN
EP-Anmeldetag 17.02.2004
EP-Aktenzeichen 047117593
WO-Anmeldetag 17.02.2004
PCT-Aktenzeichen PCT/JP2004/001712
WO-Veröffentlichungsnummer 0004072952
WO-Veröffentlichungsdatum 26.08.2004
EP-Offenlegungsdatum 16.11.2005
Veröffentlichungstag der Übersetzung europäischer Ansprüche 09.03.2006
Veröffentlichungstag im Patentblatt 09.03.2006
IPC-Hauptklasse G10L 13/06(2006.01)A, F, I, ,  ,  ,   


Anspruch[de]
  1. Vorrichtung zur Tonhöhenwellenformsignalteilung umfassend:

    einen Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    eine Einrichtung zur Phaseneinstellung zur Unterteilung des Tonsignals in Abschnitte auf Grundlage des durch den Filter extrahierten Tonhöhensignals und zur Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    eine Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der von der Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    eine Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge; und

    eine Einrichtung zur Tonhöhenwellenformsignalteilung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  2. Vorrichtung zur Tonhöhenwellenformsignalteilung nach Anspruch 1, wobei die Einrichtung zur Tonhöhenwellenformsignalteilung festlegt, ob die Intensität des Unterschieds zwischen zwei benachbarten Abschnitten für eine Tonhöheneinheit des Tonhöhenwellenformsignals ein vorgegebenes Maß hat oder mehr, und wenn festgelegt wird, dass es das vorgegebene Maß ist oder mehr, die Einrichtung daraufhin die Grenze zwischen den beiden Abschnitten als eine Grenze benachbarter Phoneme oder als ein Tonende erfasst.
  3. Vorrichtung zur Tonhöhenwellenformsignalteilung nach Anspruch 2, wobei die Einrichtung zur Tonhöhenwellenformsignalteilung festlegt, ob die beiden Abschnitte einen Reibelaut repräsentieren, und zwar basierend auf der Intensität eines Teils des zu den beiden Abschnitten gehörenden Tonhöhensignals, und wenn festgelegt wird, dass sie einen Reibelaut repräsentieren, die Einrichtung daraufhin festlegt, dass die Grenze der beiden Abschnitte nicht eine Grenze benachbarter Phoneme oder eines Tonendes ist, ungeachtet dessen, ob die Intensität des Unterschieds zwischen den beiden Abschnitten das vorgegebene Maß hat oder mehr.
  4. Vorrichtung zur Tonhöhenwellenformsignalteilung nach Anspruch 2, wobei die Einrichtung zur Tonhöhenwellenformsignalteilung festlegt, ob ein Teil des zu den beiden Abschnitten gehörenden Tonhöhensignals ein vorgegebenes Maß hat oder weniger, und wenn bestimmt wird, dass es das Maß ist oder weniger, die Einrichtung daraufhin bestimmt, dass die Grenze der beiden Abschnitte nicht eine Grenze benachbarter Phoneme oder ein Tonende ist, und zwar ungeachtet dessen, ob die Intensität des Unterschieds zwischen den beiden Abschnitten das vorgegebene Maß hat oder mehr.
  5. Vorrichtung zur Tonhöhenwellenformsignalteilung umfassend:

    eine Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    eine Einrichtung zur Tonhöhenwellenformsignalteilung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  6. Vorrichtung zur Tonhöhenwellenformsignalteilung umfassend:

    eine Einrichtung zur Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons; und

    eine Einrichtung zur Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  7. Vorrichtung zur Tonsignalkompression umfassend:

    einen Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    eine Einrichtung zur Phaseneinstellung zwecks Unterteilung des Tonsignals in Abschnitte auf Grundlage des von dem Filter extrahierten Tonhöhensignals und zwecks Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    eine Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der von der Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    eine Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge;

    eine Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    eine Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  8. Vorrichtung zur Tonsignalkompression nach Anspruch 7, wobei die Einrichtung zur Tonhöhenwellenformsignalteilung festlegt, ob die Intensität des Unterschieds zwischen zwei benachbarten Abschnitten für eine Tonhöheneinheit des Tonhöhenwellenformsignals ein vorgegebenes Maß hat oder mehr, und wenn festgelegt wird, dass es das vorgegebene Maß ist oder mehr, die Einrichtung daraufhin die Grenze zwischen den beiden Abschnitten als eine Grenze benachbarter Phoneme oder eines Tonendes erfasst.
  9. Vorrichtung zur Tonsignalkompression nach Anspruch 8, wobei die Einrichtung zur Tonhöhenwellenformteilung festlegt, ob die beiden Abschnitte einen Reibelaut repräsentieren, und zwar auf Grundlage der Intensität eines Teils des zu den beiden Abschnitten gehörenden Tonhöhensignals, und wenn festgelegt wird, dass diese einen Reibelaut repräsentieren, die Einrichtung daraufhin bestimmt, dass die Grenze der beiden Abschnitte nicht eine Grenze benachbarter Phoneme oder eines Tonendes ist, ungeachtet dessen, of die Intensität des Unterschieds zwischen den beiden Abschnitten das vorgegebene Maß hat oder mehr.
  10. Vorrichtung zur Tonsignalkompression nach Anspruch 8, wobei die Einrichtung zur Tonhöhenwellenformteilung festlegt, ob ein zu den beiden Abschnitten gehörender Teil des Tonhöhensignals ein vorgegebenes Maß hat oder weniger, und falls festgelegt wird, dass es das Maß ist oder weniger, die Einrichtung daraufhin festlegt, dass die Grenze der beiden Abschnitte nicht eine Grenze benachbarter Phoneme oder ein Tonende ist, ungeachtet dessen, ob die Intensität des Unterschieds zwischen den beiden Abschnitten das vorgegebene Maß hat oder mehr.
  11. Vorrichtung zur Tonsignalkompression umfassend:

    eine Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    eine Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    eine Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  12. Vorrichtung zur Tonsignalkompression umfassend:

    eine Einrichtung zur Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton, enthalten sind, und/oder eines Endes des Tons;

    eine Einrichtung zur Phonemdatenerzeugung zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    eine Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  13. Vorrichtung zur Tonsignalkompression nach einem der Ansprüche 7 bis 12, wobei die Einrichtung zur Datenkompression Daten komprimiert, indem sie das Ergebnis nicht linearer Quantisierung der erzeugten Phonemdaten einer Entropiecodierung unterzieht.
  14. Vorrichtung zur Tonsignalkompression nach Anspruch 13, wobei die Einrichtung zur Datenkompression datenkomprimierte Phonemdaten gewinnt, ein Quantisierungsmerkmal der nicht linearen Quantisierung basierend auf der Menge der gewonnenen Phonemdaten festlegt, und die nicht lineare Quantisierung in Übereinstimmung mit dem festgelegten Quantisierungsmerkmal durchführt.
  15. Vorrichtung zur Tonsignalkompression nach einem der Ansprüche 7 bis 14, welche weiterhin eine Einrichtung umfasst, um die datenkomprimierten Phonemdaten extern via ein Netzwerk zu senden.
  16. Vorrichtung zur Tonsignalkompression nach einem der Ansprüche 7 bis 15, welche weiterhin eine Einrichtung zur Aufzeichnung der datenkomprimierten Phonemdaten auf ein computerlesbares Aufzeichnungsmedium umfasst.
  17. Datenbank zur Speicherung von Phonemdaten, wobei die Phonemdaten gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden.
  18. Datenbank zur Speicherung von Phonemdaten, wobei die Phonemdaten gewonnen werden, indem ein Tonhöhenwellenformsignal, welches eine Tonwellenform repräsentiert, an einer Grenze benachbarter Phoneme, welche in dem durch den Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an dem Ende des Tons geteilt wird.
  19. Datenbank nach Anspruch 17 oder 18, wobei die Phonemdaten einer Entropiecodierung unterzogen werden.
  20. Datenbank nach Anspruch 19, wobei die Phonemdaten der Entropiecodierung unterzogen werden, nachdem sie einer nicht linearen Quantisierung unterzogen wurden.
  21. Computerlesbares Aufzeichnungsmedium zur Speicherung von Phonemdaten, wobei die Phonemdaten gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden.
  22. Computerlesbares Aufzeichnungsmedium zur Speicherung von Phonemdaten, wobei die Phonemdaten dadurch gewonnen werden, dass ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird.
  23. Computerlesbares Aufzeichnungsmedium nach Anspruch 21 oder 22, wobei die Phonemdaten einer Entropiecodierung unterzogen werden.
  24. Computerlesbares Aufzeichnungsmedium nach Anspruch 23, wobei die Phonemdaten der Entropiecodierung unterzogen werden, nachdem sie nicht linearer Quantisierung unterzogen wurden.
  25. Vorrichtung zur Tonsignalwiederherstellung umfassend:

    eine Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    eine Wiederherstellungseinrichtung zur Decodierung der gewonnenen Phonemdaten.
  26. Vorrichtung zur Tonsignalwiederherstellung nach Anspruch 25, wobei

    die Phonemdaten einer Entropiecodierung unterzogen werden, und

    die Wiederherstellungseinrichtung die gewonnenen Phonemdaten decodiert und die Phase der decodierten Phonemdaten wieder zu jener Phase macht, die sie vor dem Prozess war.
  27. Vorrichtung zur Tonsignalwiederherstellung nach Anspruch 26, wobei

    die Phonemdaten der Entropiecodierung unterzogen werden, nachdem sie einer nicht linearen Quantisierung unterzogen wurden, und

    die Wiederherstellungseinrichtung die gewonnenen Phonemdaten decodiert und diese der nicht linearen Quantisierung unterzieht, und die Phase der Phonemdaten wiederherstellt, welche vor diesem Prozess decodiert wurden und einer nicht linearer Quantisierung unterzogen wurden.
  28. Vorrichtung zur Tonsignalwiederherstellung nach einem der Ansprüche 25 bis 27, wobei die Einrichtung zur Datengewinnung die Phonemdaten extern via ein Netzwerk gewinnt.
  29. Vorrichtung zur Tonsignalwiederherstellung nach einem der Ansprüche 25 bis 28, wobei die Einrichtung zur Datengewinnung Mittel umfasst, um die Phonemdaten durch Lesen der Phonemdaten aus einem computerlesbaren Aufzeichnungsmedium zur Aufzeichnung der Phonemdaten zu gewinnen.
  30. Vorrichtung zur Tonsynthese umfassend:

    eine Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    eine Wiederherstellungseinrichtung zur Decodierung der gewonnenen Phonemdaten;

    eine Einrichtung zur Phonemdatenspeicherung zwecks Speicherung der gewonnenen Phonemdaten oder der decodierten Phonemdaten;

    eine Einrichtung zur Satzeingabe zwecks Eingabe von einen Satz repräsentierenden Satzinformationen; und

    eine Syntheseeinrichtung zur Rückgewinnung, aus der Einrichtung zur Phonemdatenspeicherung, von Phonemdaten, welche Wellenformen von Phonemen repräsentieren, welche den Satz bilden, und zur Kombination der rückgewonnenen Phonemdatenteile, um Daten zu erzeugen, welchen den synthetisierten Ton repräsentieren.
  31. Vorrichtung zur Tonsynthese nach Anspruch 30, weiterhin umfassend:

    eine Einrichtung zur Tonteilspeicherung für Phonemdatenteile, welche Tonteile repräsentieren;

    eine Einrichtung zur Rhythmusvorhersage zwecks Vorhersage eines Rhythmus eines Tonteils, welches einen eingegebenen Satz bildet; und

    eine Auswahleinrichtung zur Auswahl, aus den Tondatenteilen, von Tondaten, welche eine Wellenform eines Tonteils, welches die gleiche Anzeige wie ein den Satz zusammensetzendes Tonteil hat, repräsentieren und einen Rhythmus haben, welcher dem Vorhersageergebnis am nächsten kommt,

    wobei die Syntheseeinrichtung umfasst

    eine Fehlteilsyntheseeinrichtung, um, aus der Einrichtung zur Phonemdatenspeicherung, für ein Tonteil, dessen Tondaten unter den Tonteilen, welche den Satz zusammensetzen, nicht von der Auswahleinrichtung auswählbar waren, Phonemdaten zurückzugewinnen, welche eine Wellenform von Phonemen repräsentieren, welche das Tonteil zusammensetzen, das nicht auswählbar war, und um die zurückgewonnenen Phonemdatenteile zu kombinieren, um Daten zu synthetisieren, welche das Tonteil repräsentieren, das nicht auswählbar war, und

    eine Einrichtung zur Erzeugung von Daten, welche synthetisierten Ton repräsentieren durch Kombinieren der durch die Auswahleinrichtung ausgewählten Tondaten und der durch die Fehlteilsyntheseeinrichtung synthetisierten Tondaten.
  32. Vorrichtung zur Tonsynthese nach Anspruch 31, wobei die Einrichtung zur Tonteilspeicherung tatsächliche gemessene Rhythmusdaten speichert, welche zeitliche Veränderung bei der Tonhöhe des durch Tondaten repräsentierten Tonteils repräsentieren, und zwar in Übereinstimmung mit den Tondaten, und die Auswahleinrichtung, aus den Tondatenteilen, Tondaten auswählt, welche eine Wellenform mit der gleichen Anzeige repräsentieren wie ein den Satz bildendes Tonteil, wobei die zeitliche Veränderung bei der Tonhöhe, welche durch die tatsächlichen gemessenen Rhythmusdaten in Übereinstimmung mit den Tondaten repräsentiert wird, dem Rhythmusvorhersageergebnis am nächsten kommt.
  33. Vorrichtung zur Tonsynthese nach Anspruch 31 oder 32, wobei die Speicherungseinrichtung Phonogrammdaten speichert, welche die Anzeige von Tondaten repräsentieren, und zwar in Übereinstimmung mit den Tondaten, und die Auswahleinrichtung Tondaten in Übereinstimmung mit Phonogrammdaten, welche die Anzeige repräsentieren, die zu dem eines den Satz bildenden Tonteilsteil passt, als Tondaten betrachtet, welche eine Wellenform eines Tonteils repräsentieren, welches die gleiche Anzeige wie das Tonteil hat.
  34. Vorrichtung zur Tonsynthese nach einem der Ansprüche 30 bis 33, wobei die Einrichtung zur Datengewinnung die Phonemdaten extern via ein Netzwerk gewinnt.
  35. Vorrichtung zur Tonsynthese nach einem der Ansprüche 30 bis 34, wobei die Einrichtung zur Datengewinnung Mittel umfasst zur Gewinnung der Phonemdaten durch Ablesen der Phonemdaten aus einem computerlesbaren Aufzeichnungsmedium zur Aufzeichnung der Phonemdaten.
  36. Verfahren zur Tonhöhenwellenformsignalteilung umfassend:

    Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert und Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Unterteilung des Tonsignals in Abschnitte auf Grundlage des extrahierten Tonhöhensignals und Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Festlegung einer Abtastlänge für jeden Abschnitt mit der eingestellten Phase auf Grundlage der Phase, und Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge; und

    Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  37. Verfahren zur Tonhöhenwellenformsignalteilung umfassend:

    Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  38. Verfahren zur Tonhöhenwellenformsignalteilung umfassend:

    Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons; und

    Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  39. Verfahren zur Tonsignalkompression umfassend:

    Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Unterteilung des Tonsignals in Abschnitte auf Grundlage des von dem Filter extrahierten Tonhöhensignals und Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Festlegung einer Abtastlänge für jeden Abschnitt mit der eingestellten Phase auf Grundlage der Phase, und Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung der Phase und des Werts der Abtastlänge;

    Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende zwecks Erzeugung von Phonemdaten; und

    Entropiecodierung der erzeugten Phonemdaten zwecks Durchführung von Datenkompression.
  40. Verfahren zur Tonsignalkompression umfassend:

    Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Signal enthalten sind, und/oder eines Endes des Tons, und Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende zwecks Erzeugung von Phonemdaten; und

    Entropiecodierung der erzeugten Phonemdaten zwecks Durchführung von Datenkompression.
  41. Verfahren zur Tonsignalkompression umfassend:

    Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons;

    Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende zwecks Erzeugung von Phonemdaten; und

    Entropiecodierung der erzeugten Phonemdaten zwecks Durchführung von Datenkompression.
  42. Verfahren zur Tonsignalwiederherstellung umfassend:

    Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    Decodierung der gewonnenen Phonemdaten.
  43. Verfahren zur Tonsynthese umfassend:

    Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze von benachbarten Phonemen, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Wiederherstellung der Phase der gewonnenen Phonemdaten zu der Phase vor dem Prozess;

    Speicherung der gewonnenen Phonemdaten oder der Phonemdaten mit der wiederhergestellten Phase;

    Eingabe von Satzinformationen, welche einen Satz repräsentieren; und

    Rückgewinnung von Phonemdaten, welche Wellenformen von Phonemen repräsentieren, welche den Satz aus den gespeicherten Phonemdaten bilden, und Kombination der rückgewonnenen Phonemdatenteile zwecks Erzeugung von Daten, welche synthetisierten Ton repräsentieren.
  44. Programm zur Veranlassung eines Computers zur Funktion als:

    Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Einrichtung zur Phaseneinstellung zwecks Unterteilung des Tonsignals in Abschnitte auf Grundlage des durch den Filter extrahierten Tonhöhensignals und zwecks Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der durch die Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge; und

    Einrichtung zur Tonhöhenwellenformteilung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  45. Programm zur Veranlassung eines Computers zur Funktion als:

    Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit geteilt wird, im wesentlichen ausgeglichen werden; und

    Einrichtung zur Tonhöhenwellenformsignalteilung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und dem erfassten Ende.
  46. Programm zur Veranlassung eines Computers zur Funktion als:

    Erfassungseinrichtung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons; und

    Einrichtung zur Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  47. Programm zur Veranlassung eines Computers zur Funktion als:

    Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Einrichtung zur Phaseneinstellung zwecks Unterteilung des Tonsignals in Abschnitte auf Grundlage des durch den Filter extrahierten Tonhöhensignals und zwecks Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der durch die Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge;

    Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  48. Programm zur Veranlassung eines Computers zur Funktion als:

    Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem von dem Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  49. Programm zur Veranlassung eines Computers zur Funktion als:

    Einrichtung zur Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons;

    Einrichtung zur Phonemdatenerzeugung zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  50. Programm zur Veranlassung eines Computers zur Funktion als:

    Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit geteilt wird, im wesentlichen ausgeglichen werden; und

    Wiederherstellungseinrichtung zur Decodierung der gewonnenen Phonemdaten.
  51. Programm zur Veranlassung eines Computers zur Funktion als:

    Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Wiederherstellungseinrichtung zur Decodierung der gewonnenen Phonemdaten;

    Einrichtung zur Phonemdatenspeicherung zwecks Speicherung der gewonnenen Phonemdaten oder der decodierten Phonemdaten;

    Einrichtung zur Satzeingabe zwecks Eingabe von Satzinformationen, welche einen Satz repräsentieren; und

    Syntheseeinrichtung zur Rückgewinnung, aus der Einrichtung zur Phonemdatenspeicherung, von Phonemdaten, welche Wellenformen von Phonemen repräsentieren, welche den Satz bilden, und zur Kombination der rückgewonnenen Phonemdatenteile, um Daten zu erzeugen, welche synthetisierten Ton repräsentieren.
  52. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Einrichtung zur Phaseneinstellung zwecks Unterteilung des Tonsignals in Abschnitte auf Grundlage des von dem Filter extrahierten Tonhöhensignals und zwecks Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der von der Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge, um ein Abtastsignal zu erzeugen;

    Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge; und

    Einrichtung zur Tonhöhenwellenformsignalteilung zwecks Erfassung einer Grenze angrenzender Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  53. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    Einrichtung zur Tonhöhenwellenformteilung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  54. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons; und

    Einrichtung zur Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende.
  55. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Filter zur Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zur Filterung des Tonsignals zwecks Extraktion eines Tonhöhensignals;

    Einrichtung zur Phaseneinstellung zwecks Unterteilung des Tonsignals in Abschnitte auf Grundlage des durch den Filter extrahierten Tonhöhensignals und zwecks Einstellung der Phase für jeden Abschnitt auf Grundlage der Wechselbeziehung zwischen dem Abschnitt und dem Tonhöhensignal;

    Abtastungseinrichtung zur Festlegung einer Abtastlänge für jeden Abschnitt mit der von der Einrichtung zur Phaseneinstellung eingestellten Phase, und zwar basierend auf der Phase, und zur Durchführung von Abtastung mit der Abtastlänge zwecks Erzeugung eines Abtastsignals;

    Einrichtung zur Tonsignalverarbeitung zwecks Verarbeitung des Abtastsignals zu einem Tonhöhenwellenformsignal auf Grundlage des Ergebnisses der Einstellung durch die Einrichtung zur Phaseneinstellung und des Werts der Abtastlänge;

    Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentieren Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  56. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Tonsignalverarbeitung zwecks Gewinnung eines Tonsignals, welches eine Tonwellenform repräsentiert, und zwecks Verarbeitung des Tonsignals zu einem Tonhöhenwellenformsignal, indem die Phasen von Abschnitten, in denen das Tonsignal in die Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Einrichtung zur Phonemdatenerzeugung zwecks Erfassung einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons, und zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  57. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Erfassung, für ein eine Tonwellenform repräsentierendes Tonhöhenwellenformsignal, einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder eines Endes des Tons;

    Einrichtung zur Phonemdatenerzeugung zwecks Teilung des Tonhöhenwellenformsignals an der erfassten Grenze und/oder an dem erfassten Ende, um Phonemdaten zu erzeugen; und

    Einrichtung zur Datenkompression, um die erzeugten Phonemdaten zwecks Durchführung von Datenkompression einer Entropiecodierung zu unterziehen.
  58. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden; und

    Wiederherstellungseinrichtung zur Decodierung der gewonnenen Phonemdaten.
  59. Computerlesbares Aufzeichnungsmedium, auf welchem ein Programm aufgezeichnet ist, damit ein Computer veranlasst wird, zu funktionieren als:

    Einrichtung zur Datengewinnung zwecks Gewinnung von Phonemdaten, welche gewonnen werden, indem ein Tonhöhenwellenformsignal an einer Grenze benachbarter Phoneme, welche in dem durch das Tonhöhenwellenformsignal repräsentierten Ton enthalten sind, und/oder an einem Ende des Tons geteilt wird, wobei das Tonhöhenwellenformsignal dadurch gewonnen wird, dass die Phasen von Abschnitten, in denen das eine Tonwellenform repräsentierende Tonsignal in Abschnitte für eine Tonhöheneinheit des Tons geteilt wird, im wesentlichen ausgeglichen werden;

    Wiederherstellungseinrichtung, um die Phase der gewonnenen Phonemdaten wieder zu der Phase zu machen, die sie vor dem Prozess war;

    Einrichtung zur Phonemdatenspeicherung zwecks Speicherung der gewonnenen Phonemdaten oder der Phonemdaten mit der wiederhergestellten Phase;

    Einrichtung zur Satzeingabe zwecks Eingabe von einen Satz repräsentierenden Informationen; und

    Syntheseeinrichtung zur Rückgewinnung, aus der Einrichtung zur Phonemdatenspeicherung, von Phonemdaten, welche Wellenformen von Phonemen repräsentieren, welche den Satz bilden, und zur Kombination der rückgewonnenen Phonemdatenteile zwecks Erzeugung von Daten, welche synthetisierten Ton repräsentieren.
Es folgt kein Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com