ScienceDirect® Home Skip Main Navigation Links
You have guest access to ScienceDirect. Find out more.
 
Home
Browse
My Settings
Alerts
Help
 Quick Search
 Search tips (Opens new window)
    Clear all fields    
Signal Processing
Volume 80, Issue 10, October 2000, Pages 2241-2247
 
Font Size: Decrease Font Size  Increase Font Size
 Abstract - selected
Article
Purchase PDF (122 K)

Article Toolbox
  E-mail Article   
  Add to my Quick Links   
Bookmark and share in 2collab (opens in new window)
Request permission to reuse this article
  Cited By in Scopus (0)
 
 
 
Related Articles in ScienceDirect
View More Related Articles
 
View Record in Scopus
 
doi:10.1016/S0165-1684(00)00108-0    
How to Cite or Link Using DOI (Opens New Window)

Copyright © 2000 Elsevier Science B.V. All rights reserved.

Integration of tonal knowledge into phonetic HMMs for recognition of speech in tone languages

Purchase the full-text article



References and further reading may be available for this article. To view references and further reading you must purchase this article.

Tanee DemeechaiCorresponding Author Contact Information, E-mail The Corresponding Author and Kimmo MäkeläinenE-mail The Corresponding Author

Asian Institute of Technology, Telecommunications Program, P.O. Box 4, Klongluang, Pathumthani 12120, Thailand


Received 24 June 1999;
revised 27 March 2000.
Available online 21 August 2000.

Abstract

A method to integrate tonal knowledge into phonetic hidden Markov models (HMMs) for use in recognition of speech in tone languages is proposed. Tone segment is introduced, and each phonetic HMM models both the phoneme and the associated tone segment. The observation probability density function (pdf ) of each HMM state is the product of a phonetic feature pdf and a tonal feature pdf. Trainability of the HMMs is maintained by sharing of tonal feature pdf's among different HMMs that model the same tone segment and by sharing of phonetic feature pdf's among HMMs of same phoneme. A simple method that effectively avoids performance degradation due to harmonic pitch errors is also introduced. Results from speaker-independent connected syllable recognition experiments show that the proposed method effectively integrates tonal knowledge into phonetic HMMs.

Zusammenfassung

Es wird eine Methode vorgeschlagen, die Kenntnis der Lautmelodie in phonetische Hidden-Markov-Modelle (HMMs) so zu integrieren, daß sie für die Spracherkennung in Melodiesprachen verwendet werden können. Ein Melodiesegment wird eingeführt, und jedes phonetische HMM modelliert sowohl das Phonem als auch das zugehörige Melodiesegment. Die beobachtete Wahrscheinlichkeitsdichtefunktion (pdf ) jedes HMM-Zustands ist das Produkt einer phonetischen Merkmals-pdf und einer Melodiemerkmals-pdf. Die Trainierbarkeit der HMMs bleibt dadurch erhalten, daß über verschiedene HMMs, die dasselbe Melodiesegment modellieren, eine gemeinsame Melodiemerkmals-pdf verwendet wird und über HMMs des gleichen Phonems die gemeinsame phonetische Merkmals-pdf verwendet wird. Es wird eine einfache Methode eingeführt, die effektiv eine Verschlechterung der Leistungsfähigkeit durch harmonische Grundtonfehler vermeidet. Ergebnisse aus Erkennungsexperimenten mit sprecherunabhängigen zusammenhängenden Silben zeigen, daß die vorgeschlagene Methode die Melodiekenntnisse effizient in phonetische HMMs einführt.

Résumé

Nous proposons une méthode pour intégrer la connaissance tonale dans des modèles de Markov cachés (HMM) phonétiques pour un usage en reconnaissance de la parole pour des langages tonals. Nous introduisons le segment de tons et chaque HMM phonétique, à la fois le phonème et le segment de ton associé. La fonction densité de probabilité (pdf ) des observations est le produit de la pdf phonétique et de la pdf tonale. La capacité d'entraîner les HMM est maintenue par le partage les pdf des attributs tonals sur différents HMM qui modélisent le même segment tonal et par le partage des pdf d'attributs phonétiques du même phonème. Nous introduisons aussi une méthode simple qui évide de façon efficace la dégradation de performance due aux erreurs de tons harmoniques. Des résultats d'expériences de reconnaissance de syllabes connectées indépendantes du locuteur montrent que la méthode proposée intègre de façon efficace l'information tonale dans les HMM phonétiques.

Author Keywords: Speech recognition; Tone; Tone language; HMM

Article Outline

1. Introduction
2. Integration of tonal knowledge
2.1. Tone segment
2.2. HMM modeling
3. Experimental results
3.1. Speech data
3.2. Feature analysis
3.3. HMM structure
3.4. Pitch normalization
3.5. Some training issues
3.6. Mitigation of harmonic pitch errors
3.7. A conventional recognition method for comparison
3.8. Recognition results
4. Conclusions
References

Corresponding Author Contact Information Corresponding author. Tel.: +66-2-524-6575, fax: +66-2-524-5730; email: tca68358@ait.ac.th


Signal Processing
Volume 80, Issue 10, October 2000, Pages 2241-2247
 
Home
Browse
My Settings
Alerts
Help
Elsevier.com (Opens new window)
About ScienceDirect  |  Contact Us  |  Information for Advertisers  |  Terms & Conditions  |  Privacy Policy
Copyright © 2009 Elsevier B.V. All rights reserved. ScienceDirect® is a registered trademark of Elsevier B.V.