Journal: Informační Bulletin České statistické společnosti
Full-text papers are available at http://www.statspol.cz/bulletiny/
Volume 22, Number 1, pages 1319, 2011.
ISSN 1210-8022 (Print), ISSN 1804-8617 (Online).
Published by ČStS and CSTUG. DOI:10.5300/IB/2011-1/13
Robust Multivariate Statistics in Genetic Applications
Abstract: The paper describes possible applications of robust statistical methods in genetic research. Standard approaches for the analysis of images measured by the microarrays technology turn out to be too sensitive with respect to outliers in the data. Therefore in a genetic study at the Centre of Biomedical Informatics we apply robust statistical methods to image analysis and classification analysis of gene expression measurements. Further we describe the MWCD estimator of multivariate location and scatter, which is used to obtain a robust classification analysis method based on implicit weighting of individual observations.
Keywords: robust statistics, multivariate statistics, genetic research, MWCD method, Next-Gen Sequencing.
Robustní mnohorozměrná statistika v genetických aplikacích
Abstrakt: Článek popisuje možnosti použití robustních statistických metod v genetickém výzkumu. V obecné situaci jsme zjistili, že standardní postupy pro zpracování obrazové informace měřené technologií microarrays jsou příliš citlivé vůči přítomnosti odlehlých pozorování. V konkrétní studii, která probíhá v Centru biomedicínské informatiky, proto aplikujeme metody robustní statistiky na analýzu obrazu a na klasifikační analýzu pro zpracování naměřených genových expresí. Dále zde popíšeme odhad metodou MWCD pro střední hodnotu a varianční matici mnohorozměrných dat, s jehož pomocí získáme robustní metodu pro klasifikační analýzu založenou na implicitním vážení jednotlivých pozorování.
Klíčová slova: robustní metody, vícerozměrná statistika, genetický výzkum, metoda MWCD, sekvenace.
Author
Jan Kalina
Centrum biomedicínské informatiky
Ústav informatiky AV ČR
Pod Vodárenskou věží 2
CZ-182 07 Prague 8
The Czech Republic

References
  1. Aretusi G., Fontanella L., Ippoliti L., Merla A.: Space-time texture analysis in thermal infrared imaging for classification of Raynaud's Phenomenon. In Mantovan P., Secchi P. (Eds.): Complex data modeling and computationally intensive statistical methods (Contributions to Statistics). Springer, Milano, 1–12, 2010. ISBN 978-88-470-1385-8. doi:10.1007/978-88-470-1386-5_1
  2. C. Croux: Algorithms for Projection–Pursuit robust principal component analysis. In Chemometrics and Intelligent Laboratory Systems, vol. 87, no. 2, pp. 218–225, 2007. ISSN 0169-7439. doi:10.1016/j.chemolab.2007.01.004
  3. Mark J Dunning: Statistical issues in the analysis of Illumina data. In BMC Bioinformatics, vol. 9, no. 1, fp. 85, 2008. ISSN 1471-2105. doi:10.1186/1471-2105-9-85
  4. Mia Hubert: High-Breakdown Robust Multivariate Methods. In Statistical Science, vol. 23, no. 1, pp. 92–119, 2008. ISSN 0883-4237. doi:10.1214/088342307000000087
  5. Kalina J.: Robust econometrics: diagnostic tools and multivariate methods. Zasláno do Prague Economic Papers, 2010.
  6. Peter J. Rousseeuw: A Fast Algorithm for the Minimum Covariance Determinant Estimator. In Technometrics, vol. 41, no. 3, fp. 212, 1999. ISSN 0040-1706. doi:10.2307/1270566
  7. H. Tanaka: Omics-based Medicine and Systems Pathology. In Methods of Information in Medicine, vol. 49, no. 2, pp. 173–185, 2010. ISSN 0026-1270. doi:10.3414/ME9307
  8. Víšek J. Á.: Regression with high breakdown point. In Antoch, J., Dohnal, G. (Eds.): ROBUST 2000, Sborník prací 11. letní školy JČMF. JČMF a Česká statistická společnost, Praha, 324–356, 2001.
Cited-by CrossRef


Webpage prepared by the editors of the journal.