Zusammenfassung
Die unterschiedlichen Möglichkeiten, Interaktion zwischen zwei oder mehreren Expositionen in epidemiologischen Studien zu definieren, sowie die Unterscheidung von additiver und multiplikativer Wechselwirkung, führen immer wieder zu Missverständnissen über die Grundlagen solcher Definitionen. Statistische Regressionsmodelle für die Analyse von Ereignishäufigkeiten implizieren eine Definition von fehlender Interaktion, welche nicht immer eine für die vorliegenden Daten passende oder für die Fragestellung gewünschte ist. Die Autoren zeigen auf, dass unterschiedliche epidemiologische Kausalmodelle zu Interaktionsdefinitionen führen, die oftmals mit jenen der statistischen Modelle nicht übereinstimmen. Es zeigt sich, dass bei der Definition von Interaktion die Unterscheidung von Raten, Risiken und Odds zu berücksichtigen ist, sobald die Risiken nicht sehr klein sind. Anhand einer Datenanalyse wird illustriert, dass die üblicherweise vorausgesetzte multiplikative Interaktionsstruktur bei additiven Daten zu einem erheblichen Bias der Schätzwerte führt, sofern nicht alle signifikanten und nicht-signifikanten Interaktionsterme höherer Ordnung modelliert werden. Mittels nummerischer Verfahren berechnen die Autoren den bei der logistischen Regressionsanalyse entstehenden asymptotischen Bias (“Interaktions-Bias”) für den Fall von zwei und drei dichotomen Expositionsvariablen.
Summary
Different ways to define interaction between exposition factors in epidemiological studies as well as the choice between additive and multiplicative no interaction leads frequently to confusion during data analysis. In their standard form methods of event data analysis such as Poisson or logistic regression assume a multiplicative parameterization of no interaction. However, evidence from empirical investigations as well as causal models of disease etiology, e.g. the simple independent action model of Finney or the sufficient-component-causes model of Rothman, suggest additive or other kinds of non-multiplicative concepts of no interaction. For additive structured data we illustrate the asymptotic bias (“interaction-bias”) of main effect estimates which are based on inappropriate data analysis using multiplicative models and omitting significant or non-significant interaction terms. We show that both the epidemiological study design as well as the underlying causal model are determinants of the interaction structure of the data and should be considered in the model selection process. The definition of interaction should distinguish between risk, rate and odds if risks are not very small. Using generalized linear models with parametrical link functions we are able to analyze non-multiplicative interaction structures.
Résumé
Les diverses possibilités de définir dans des études épidémiologiques l'interaction survenant entre deux ou plusieurs expositions ainsi que de faire la différence entre l'interaction additive et multiplicative prêtent à confusion en ce qui concerne le fondement de telles définitions. Les modèles de régression statistiques employés dans l'analyse de fréquences d'événement impliquent une définition, sans qu'il y ait interaction définition qui n'est pas toujours appropriée dans le contexte des données en question ni désirée dans le cadre du thème posé. A l'aide d'une analyse de données, les auteurs visent à illustrer que la structure d'interaction multiplicative habituellement présumée pour des données additives mène à un biais considérable dans les valeurs estimées, à défaut d'un modèle intégrant tous les termes d'interaction significatifs et nonsignificatifs. Les auteurs emploient des procédures numériques pour illustrer le biais asymptotique («biais d'interaction») qui survient dans l'emploi d'analyses de régression logistique, à l'exemple de deux et de trois variables d'exposition dichotomes. Les auteurs démontrent que de différents modèles épidémiologiques causals provoquent des définitions d'interaction qui contredisent souvent ceux des modèles statistiques Il est donc évident que la définition d'interactions exige de tenir compte des différences entre les ratios, les risques et les odds une fois que les risques dépassent une certaine limite.
Literaturverzeichnis
Finney DJ. Quantal responses to mixtures. In: Probit Analysis. 3rd ed. Cambridge: Cambridge University Press, 1971:231–283.
Breslow NE, Day NE. Statistical Methods in Cancer Research: Vol. II — The Design and Analysis of Cohort Studies. Lyon: International Agency for Research on Cancer, 1987.
Rothman KJ. Causes. Am J Epidemiol 1976;104:587–592.
Moolgavkar SH, Venzon DJ. General relative risk regression models for epidemiologic studies. Am J Epidemiol 1987;126:949–961.
Guerrero VM, Johnson RA. Use of the Box-Cox transformation with binary response models. Biometrika 1982;69:309–314.
Stronegger W-J, Berghold A. Re: „Biologic Synergism and Parallelism”. Am J Epidemiol 1998;147:89.
Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research: Principles and quantitative methods. New York: Van Nostrand Reinhold, 1982.
Martuzzi M, Elliott P. Estimating the incidence rate ratio in crosssectional studies using a simple alternative to logistic regression. Ann Epidemiol 1998;8:52–55.
Rothman KJ. The estimation of synergy or antagonism. Am J Epidemiol 1976;103:506–511.
Walter SD, Holford TR. Additive, multiplicative, and other models for disease risks. Am J Epidemiol 1978;108:341–346.
Weinberg CR. Applicability of the simple independent action model to epidemiologic studies involving two factors and a dichotomous outcome. Am J Epidemiol 1986;123:162–173.
Rothman KJ, Greenland S, Walker AM. Concepts of interaction. Am J Epidemiol 1980;112:467–470.
Armitage P, Doll R. The age distribution of cancer and a multi-stage theory of carcinogenesis. Br J Cancer 1954;8:1–12.
Siemiatycki J, Thomas DC. Biological models and statistical interactions: An example from multistage carcinogenesis. Int J Epidemiol 1981;10:383–387.
Kaldor JM, L'Abbé KA. Interaction between human cacinogens. In: Complex Mixtures and Cancer Risk: IARC Scientific Publications No. 104. Lyon: International Agency for Research on Cancer, 1990:35–43.
Lund E. Comparison of additive and multiplicative models for reproductive risk factors and postmenopausal breast cancer. Stat Med 1995;14:267–274.
Koopman JS. Causal models and sources of interaction. Am J Epidemiol 1977;106:439–444.
Koopman JS. Interaction between discrete causes. Am J Epidemiol 1981;113:716–724.
Czado C, Santner TJ. The effect of link misspecification on binary regression inference. J Stat Plan Inference 1992;33:213–231.
Stronegger W-j, Seeber GUH. Modelling of Non-multiplicative Interactions for Epidemiologic Causal Models Using Families of Link Functions. In: Minder C.E., Friedl H., eds. Good statistical practice. Wien: Österreichische Statistische Gesellschaft, 1997: 280–284. (Seeber G.U.H., ed. Schriftenreihe der Österreichischen Statistischen Gesellschaft; Bd. 5)
Clayton D, Hills M. Statistical Models in Epidemiology. Oxford: Oxford University Press, 1993:271–281.
Francis B, Green M, Payne C, et al. The GLIM System. Release 4 Manual. Oxford: Claredon Press, Reprint, 1994.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Stronegger, WJ., Berghold, A. & Seeber, G.U.H. Epidemiologische und statistische Interaktions-modelle und Folgen für die Regressionsanalyse. Soz Präventivmed 43, 312–321 (1998). https://doi.org/10.1007/BF01299719
Issue Date:
DOI: https://doi.org/10.1007/BF01299719