Zusammenfassung
In diesem Bericht soll ein Verfahren zur expliziten Segmentierung von Sprachsignalen vorgestellt werden, wobei die zu bestimmenden Segmente lediglich zur Daten-reduktion und ohne phonetisches a priori-Wissen anhand der zur Verfügung stehenden Trainingsdaten bestimmt werden. Dieses Verfahren wird in erster Näherung aus einem informationstheoretischen Modell der expliziten Segmentierung abgeleitet. Das Modell gibt dabei Hinweise auf die Grenzen der Leistungsfähigkeit einer phonetisch orientierten Segmentierung. In ersten Experimenten wurden für die datenorientierte Segmentierung bei Erkennungstests mit gesprochenen Ziffernketten Fehlerraten von 1.5% bis 4% erreicht.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
Literatur
Klatt, D.H., “Review of the AR PA Speech Understanding Project”, J. Acoust. Soc. Am., Vol. 62, No. 6, 1345–1368, (December 1977).
Mergel, D., Ney, H., “phonetically guided Clustering for Isolated Word Recogni- tion”, IEEE Int. Conf. on Acoustics, Speech and Signal Processing, Tampa,. 854–857, March 1985.
Colla, A.M., Sciarra, D., “Automatic Diphone Bootstrapping for Speaker-Adaptive Continuous Speech Recognition”, IEEE Int. Conf. on Acoustics, Speech and Signal Processing, San Diego 35. 2, April 1984.
Woschni, E.G., “Informationstechnik”, Heidelberg, Dr. Alfred Huethig Verlag, 1974.
Ney, H., Geppert, R., Mergel, D., Noll, A., Piotrowski, H., Schwartau, P., Tomaschewski, H., “Statistical Modelling and Dynamic Programming in Speech Recognition”, Sprache und Datenverarbeitung, Heft 1 /2, 17–33, (1984).
Ney, H., “The Use of a One-Stage Dynamic Programming Algorithm for Connected Digit Recognition”, IEEE Trans, on Acoustics, Speech and Signal Processing, Vol. ASSP-32, No. 2, 263–271, (1984).
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1985 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Noll, A. (1985). Explizite Segmentierung Kontinuierlicher Sprache. In: Niemann, H. (eds) Mustererkennung 1985. Informatik Fachberichte, vol 107. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-70638-7_46
Download citation
DOI: https://doi.org/10.1007/978-3-642-70638-7_46
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-15696-3
Online ISBN: 978-3-642-70638-7
eBook Packages: Springer Book Archive