Copyright © 1994 Published by Elsevier Science B.V.
The masking of narrowband noise by broadband harmonic complex sounds and implications for the processing of speech sounds
Received 19 May 1993;
References and further reading may be available for this article. To view references and further reading you must purchase this article.
Abstract
The evaluation of processed and synthesized speech is closely related to the auditory perception of complex sounds. An understanding of the perception of complex sounds is therefore helpful to improve the quality of processed sounds. The perceptual study of speech sounds in this paper is mainly concerned with auditory masking. Unlike most such studies, the targets in our experiment are narrowband noise signals and the maskers are wideband harmonic complex sounds. We show that the detection of targets at low frequencies is mainly determined by the spectral properties of the maskers. At high frequencies, the detection of targets is predominantly determined by the temporal behaviour of maskers. The relative contributions of spectral and temporal analysis strongly depend on the fundamental frequency of the masker. Better temporal resolution is associated with a higher masker level.
Zusammenfassung
Die Bewertung von EDV-verarbeiteter und synthetischer Sprache steht in enger Beziehung zu der auditiven Wahrnehmung von komplexen Tönen. Daher ist ein Verständnis der Wahrnehmung von komplexen Tönen nützlich, um die Qualität der EDV-verarbeiteten Töne zu verbessern. Die Wahrnehmungsuntersuchung der Sprachtöne wird in diesem Artikel hauptsächlich unter dem Gesichtspunkt auditiver Maskierung behandelt. Im Gegensatz zu den meisten anderen analogen Arbeiten haben wir in unserem Experiment Schmalband-Geräuschsignale und harmonische Breitbandsignale als Maskierung verwendet. Dadurch kann belegt werden, daβ die Erkennung von Testtönen bei niedrigen Frequenzen hauptsächlich von den spektralen Eigenschaften der Maskierung abhaängt. Bei hohen Frequenzen hängt die Erkennung von Testtönen hauptsächlich vom zeitlichen Verhalten der Maskierung ab. Die relativen Beitrage der spektralen und zeitlichen Analyse hängen stark von der Grundfrequenz der Maskierung ab. Eine höhere zeitliche Auflösung entspricht einem höheren Maskierungsniveau.
Résumé
L'évaluation de la qualité de la parole codée et synthétisée est étroitement liée à la perception auditive des sons complexes. Une compréhension de la perception des sons complexes est donc nécessaire pour améliorer la qualité des sons après traitement. L'étude perceptuelle des sons de parole est abordée dans ce papier sous l'aspect du masquage auditif. Contrairement à la plupart des autres travaux analogues, nous avons pris comme cibles des signaux de bruit à bande étroite et comme masqueurs des sons harmoniques complexes à large bande. Nous montrons que la détection des cibles à basses fréquences est surtout fonction des propriétés spectrales des masqueurs. Pour les hautes fréquences, la détection des cibles est préférentiellement déterminée par le comportement temporel des masqueurs. Les contributions relatives des analyses spectrale et temporelle dépendent fortement de la fréquence fondamentale du masqueur. Une meilleure résolution temporelle correspond à un plus haut niveau de masquage.
Author Keywords: Auditory masking; Speech processing







E-mail Article
Add to my Quick Links

Cited By in Scopus (3)




