Published September 5, 2023 | Version v1
Journal article Open

[Numerical expression of the clinical course of the disease. Data management]

  • 1. Centro Médico ABC, Subdirección de Enseñanza e Investigación. Ciudad de México, México
  • 2. Instituto Mexicano del Seguro Social, Coordinación de Investigación en Salud, Centro de Adiestramiento en Investigación Clínica. Ciudad de México, México
  • 3. Instituto Nacional de Psiquiatría Dr. Ramón de la Fuente. Subdirección de Investigaciones Clínicas, Departamento de Epidemiología Clínica. Ciudad de México, México

Description

Abstract 

Data management "behind the scenes" refers to collection, cleaning, imputation, and demarcation; and despite of being indispensable processes, they are usually neglected and thus, generate erroneous information. During the collection are errors: omission of covariates, deviation from the objective, and insufficient quality. The omission of covariates distorts the result attributed to the main manoeuvre. Deviation from the primary objective commonly occurs when the outcome is rare, delayed, or subjective and promotes substitution by non-equivalent surrogate variables. Moreover, insufficient quality occurs due to inadequate instruments, omission of the measurement procedure, or measurements out of context, such as attribution at the wrong time or equivalent. 

Furthermore, cleaning implies identifying erroneous, extreme, and missing values, which may or may not be imputed, depending on the percentage. The values of the manoeuvre or the outcome are never imputed, nor are patients eliminated due to a lack of values. Finally, the demarcation of each variable seeks to give it a clinical meaning about the outcome, for which a hierarchical sequence of criteria is followed: 1) previous clinical study, 2) expert agreement, 3) clinical judgment of the investigator/investigators, and 4) statistics. Acting without quality controls in data management frequently causes involuntary lies and confuses instead of clarifying.

Abstract (Spanish)

El manejo de datos "tras bambalinas" se refiere a los procesos de recopilación, limpieza, imputación y demarcación; los cuales, aun siendo indispensables, usualmente suelen ser descuidados, por lo que generan información errónea. Durante la recopilación son errores: omisión de covariables, desvío del objetivo, y calidad insuficiente. La omisión de covariables distorsiona el resultado atribuido a la maniobra principal. El desvío del objetivo primario es común cuando el desenlace es raro, tardado o subjetivo y promueve la sustitución por variables subrogadas no equivalentes. Además, la calidad insuficiente, sucede por instrumentos inadecuados, omisión del procedimiento de medición, o medición fuera de contexto -como atribución a destiempo o equivalente-. Por otro lado, la limpieza implica identificar valores erróneos, extremos y faltantes, que podrán ser o no imputados, dependiendo del porcentaje se imputará comúnmente por la medida de resumen. Nunca se imputan los valores de la maniobra ni del desenlace, ni se eliminan pacientes por falta de valores. Finalmente, la demarcación de cada variable busca un significado clínico en referencia al desenlace, para ello se sigue una secuencia jerárquica de criterios: 1) estudio clínico previo, 2) acuerdo de expertos, 3) juicio clínico del investigador/investigadores y 4) estadística. Actuar sin controles de calidad en el manejo de datos provoca frecuentemente mentiras involuntarias y confunde en lugar de esclarecer.    

Files

5242-39104-1-PB.pdf

Files (734.3 kB)

Name Size Download all
md5:78a1a6419b4755cbd40da6d32db7f495
734.3 kB Preview Download

Additional details

Additional titles

Translated title (Spanish)
Expresión numérica del curso clínico de la enfermedad. Manejo de datos

Dates

Available
2023-10
Accepted
2023-02