ScienceDirect® Home Skip Main Navigation Links
You have guest access to ScienceDirect. Find out more.
 
Home
Browse
My Settings
Alerts
Help
 Quick Search
 Search tips (Opens new window)
    Clear all fields    
advertisementadvertisement
Speech Communication
Volume 14, Issue 2, April 1994, Pages 103-118
 
Font Size: Decrease Font Size  Increase Font Size
 Abstract - selected
Purchase PDF (1046 K)

 
 
 
Related Articles in ScienceDirect
View More Related Articles
 
View Record in Scopus
 
doi:10.1016/0167-6393(94)90002-7    How to Cite or Link Using DOI (Opens New Window)
Copyright © 1994 Published by Elsevier Science B.V.

The masking of narrowband noise by broadband harmonic complex sounds and implications for the processing of speech sounds

Changxue Ma and Douglas O'Shaughnessy

INRS-Telecommunications, 16 Place du Commerce, Ile de Soeurs, Quebec, H3E 1H6, Canada

Received 19 May 1993; 
revised 26 September 1993. 
Available online 13 June 2003.

Purchase the full-text article



References and further reading may be available for this article. To view references and further reading you must purchase this article.

Abstract

The evaluation of processed and synthesized speech is closely related to the auditory perception of complex sounds. An understanding of the perception of complex sounds is therefore helpful to improve the quality of processed sounds. The perceptual study of speech sounds in this paper is mainly concerned with auditory masking. Unlike most such studies, the targets in our experiment are narrowband noise signals and the maskers are wideband harmonic complex sounds. We show that the detection of targets at low frequencies is mainly determined by the spectral properties of the maskers. At high frequencies, the detection of targets is predominantly determined by the temporal behaviour of maskers. The relative contributions of spectral and temporal analysis strongly depend on the fundamental frequency of the masker. Better temporal resolution is associated with a higher masker level.

Zusammenfassung

Die Bewertung von EDV-verarbeiteter und synthetischer Sprache steht in enger Beziehung zu der auditiven Wahrnehmung von komplexen Tönen. Daher ist ein Verständnis der Wahrnehmung von komplexen Tönen nützlich, um die Qualität der EDV-verarbeiteten Töne zu verbessern. Die Wahrnehmungsuntersuchung der Sprachtöne wird in diesem Artikel hauptsächlich unter dem Gesichtspunkt auditiver Maskierung behandelt. Im Gegensatz zu den meisten anderen analogen Arbeiten haben wir in unserem Experiment Schmalband-Geräuschsignale und harmonische Breitbandsignale als Maskierung verwendet. Dadurch kann belegt werden, daβ die Erkennung von Testtönen bei niedrigen Frequenzen hauptsächlich von den spektralen Eigenschaften der Maskierung abhaängt. Bei hohen Frequenzen hängt die Erkennung von Testtönen hauptsächlich vom zeitlichen Verhalten der Maskierung ab. Die relativen Beitrage der spektralen und zeitlichen Analyse hängen stark von der Grundfrequenz der Maskierung ab. Eine höhere zeitliche Auflösung entspricht einem höheren Maskierungsniveau.

Résumé

L'évaluation de la qualité de la parole codée et synthétisée est étroitement liée à la perception auditive des sons complexes. Une compréhension de la perception des sons complexes est donc nécessaire pour améliorer la qualité des sons après traitement. L'étude perceptuelle des sons de parole est abordée dans ce papier sous l'aspect du masquage auditif. Contrairement à la plupart des autres travaux analogues, nous avons pris comme cibles des signaux de bruit à bande étroite et comme masqueurs des sons harmoniques complexes à large bande. Nous montrons que la détection des cibles à basses fréquences est surtout fonction des propriétés spectrales des masqueurs. Pour les hautes fréquences, la détection des cibles est préférentiellement déterminée par le comportement temporel des masqueurs. Les contributions relatives des analyses spectrale et temporelle dépendent fortement de la fréquence fondamentale du masqueur. Une meilleure résolution temporelle correspond à un plus haut niveau de masquage.

Author Keywords: Auditory masking; Speech processing

Article Outline

• References

Speech Communication
Volume 14, Issue 2, April 1994, Pages 103-118
 
Home
Browse
My Settings
Alerts
Help
Elsevier.com (Opens new window)
About ScienceDirect  |  Contact Us  |  Information for Advertisers  |  Terms & Conditions  |  Privacy Policy
Copyright © 2008 Elsevier B.V. All rights reserved. ScienceDirect® is a registered trademark of Elsevier B.V.