Glosario de términos

Este glosario tiene dos partes: una lista de términos de la A a la Z y una explicación de las tablas de resumen de los resultados contenidas en los resúmenes SUPPORT. La lista de términos de la A a la Z se encuentra basada en el glosario contenido en el manual de la Colaboración Cochrane para revisiones sistemáticas de intervenciones (Cochrane Collaboration Handbook for Systematic Reviews of Interventions), traducido por la Colaboración Cochrane Iberoamericana y ha sido utilizado con permiso. El glosario de la Colaboración Cochrane es actualizado cada cierto tiempo, de manera que esta versión puede no corresponder exactamente a la utilizada por la Colaboración Cochrane. La versión completa del glosario Cochrane se encuentra en Glosario Cochrane traducido.

Explicación de la tabla de Resumen de Resultados (Summary of Findings table)

Este documento, disponible en pdf, explica cada una de las secciones de la tabla de Resumen de resultados (Summary of Findings table).

 

Lista de términos de la A a la Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

 

A

 Acontecimiento adverso (Adverse event).
Un desenlace adverso que ocurre durante o después del uso de un medicamento u otra intervención, pero que no es necesariamente causado por ésta.

 Aleatorio (Random).
Dirigido por el azar. Ver también aleatorización (randomisation).

 Aleatorización (Randomisation).
Es el proceso de asignar aleatoriamente a los participantes a una de las ramas de un ensayo controlado. La aleatorización tiene dos componentes: la generación de una secuencia aleatoria y su implementación. La manera ideal de hacerlo es que los sujetos que entran en un estudio no conozcan la secuencia (ocultación de asignación). (También llamada aleatorización).

 Aleatorización estratificada (Stratified randomisation).
Un método que se utiliza para asegurar que igual número de participantes con una característica que se piensa afecta el pronóstico o la respuesta a la intervención se asignará a cada grupo de comparación. Por ejemplo, en un ensayo de mujeres con cáncer de mama, puede ser importante tener números iguales de mujeres pre-menopáusicas y postmenopáusicas en cada grupo de comparación. La aleatorización estratificada podría utilizarse para asignar a números iguales de mujeres pre y postmenopáusicas a cada grupo de tratamiento. La aleatorización estratificada se lleva a cabo haciendo aleatorización separada (a menudo usando bloques permutados aleatoriamente) para cada estrato. Ver también minimización. 

 Aleatorización por bloques (Block randomisation).
Ver bloques permutados aleatorios (random permuted blocks).

 Análisis ajustado (Adjusted analysis).
Un análisis que controla (ajusta) al inicio del estudio las diferencias en las características importantes de los pacientes. Ver también factor de confusión, análisis de regresión (confounder, regression analysis).

 Análisis de coste-beneficio (Cost-benefit analysis).
Un análisis económico que convierte los efectos en los mismos términos monetarios que los costes, y los compara. 

 Análisis de coste-efectividad (Cost-effectiveness analysis).
Un análisis económico que mira los efectos en términos de salud general específica al problema, y describe los costes de un logro sanitario adicional (p.ej., coste de cada ictus adicional prevenido).

 Análisis de coste-utilidad (Cost-utility analysis).
Un análisis económico que describe los efectos como mejora general de salud y describe lo que cuesta un logro adicional de utilidad (p.ej., coste por cada año de vida adicional ajustado por calidad de vida. 

 Análisis de regresión (Regression analysis).
Un técnica de modelado estadístico que se usa para calcular o predecir la influencia de una o más variables independientes sobre una variable dependiente, p.ej., el efecto de la edad, el sexo y el nivel educacional en la prevalencia de una enfermedad. La regresión logística y la metaregresión son tipos de análisis de regresión.

 Análisis de sensibilidad (Sensitivity analysis).
Un análisis que se utiliza para determinar cuan sensibles son los resultados de un estudio o revisión sistemática a los cambios en la manera en que se hizo. Los análisis de sensibilidad se utilizan para evaluar lo robustos que son los resultados ante decisiones o supuestos acerca de los datos y los métodos que se usaron.

 Análisis de subgrupo (Sub-group analysis).
Un análisis en que el efecto de la intervención se evalúa en un subconjunto definido de participantes en un ensayo, o en subconjuntos complementarios, cómo categorías por sexo o edad. Los tamaños de los ensayos generalmente son demasiado pequeños cómo para que los análisis de subgrupo tengan una potencia estadística adecuada. La comparación entre subgrupos debería hacerse con una prueba de interacción en vez de una comparación de valores p. Los análisis de subgrupo también están sujetos al problema de comparaciones múltiples. Ver también comparaciones múltiples. 

 Análisis de supervivencia (Survival analysis).
El análisis de datos que miden el tiempo hasta que ocurre un suceso, p.ej., la muerte, el siguiente episodio de la enfermedad. Ver también tiempo al suceso.

 Análisis económico (evaluación económica) (Economic analysis [economic evaluation]).
Comparación de la relación entre los costes y los desenlaces de diferentes intervenciones sanitarias. Ver análisis de coste-beneficio, análisis de coste-efectividad, y análisis de coste-utilidad.

 Análisis multivariante (Multivariate analysis).
Medir el impacto de más de una variable cuando se analiza una serie de datos, p.ej., analizar el impacto de la edad, el sexo y el tipo de trabajo en un desenlace específico. Se hace durante el análisis de regresión.

 Análisis por intención de tratar (Intention to treat analysis).
Una estrategia para analizar los datos de un ensayo aleatorizado y controlado. Todos los participantes se incluyen en la rama a la que fueron asignados, hayan o no recibido (o completado) la intervención que se administró en esa rama. El análisis de intención de tratar evita el sesgo causado por la pérdida de participantes, que puede alterar la equivalencia inicial establecida por la aleatorización y que puede reflejar una falta de adherencia al protocolo. El término se utiliza a menudo de forma incorrecta en publicaciones de ensayos cuando se han excluido algunos participantes.

 Aplicabilidad (Applicability).
Ver validez externa (external validity).

 Asignación cuasi-aleatoria (Quasi-random allocation).
Métodos de asignar sujetos a un ensayo que no son aleatorios, pero que intentaron producir grupos similares cuando se usaron para asignar a participantes. Los métodos cuasi aleatorios incluyen: asignación según la fecha de nacimiento del sujeto, por el día de la semana o mes del año, por el número de historia clínica del sujeto, o la asignación de cada sujeto alterno. En la práctica estos métodos de asignación son relativamente fáciles de manipular, lo cual introduce el sesgo de selección. Ver también asignación aleatoria (random allocation), aleatorización (randomisation).

 Asociación (Association).
Una relación entre dos características, de modo que al cambiar una de ellas la otra cambia de forma predecible. Por ejemplo, la estadística demuestra que existe una asociación entre el tabaquismo y el cancer de pulmón. En una asociación positiva una cantidad aumenta a medida que aumenta la otra (cómo en tabaquismo y cancer de pulmón). En una asociación negativa, el aumento de una cantidad corresponde a un descenso en la otra. Una asociación no significa necesariamente un efecto causal. (También llamada correlación).

 Asociación negativa (Negative association).
Ver asociación (association).

 Asociación positiva (Positive association).
Ver asociación (association).

 

B

 Base de Datos Cochrane de Revisiones Sistemáticas (CDSR) (Cochrane Database of Systematic Reviews).
Una de las bases de datos en The Cochrane Library. Junta todas las Revisiones Cochrane y Protocolos de Revisiones Cochrane actualmente disponibles. Se actualiza trimestralmente, y se puede acceder a ella por Internet y CD-Rom. Ver Cochrane Library.

 

 

C

 Calidad (Quality).
Una leve noción de la fuerza metodológica de un estudio, que normalmente indica el grado de prevención de sesgo. 

Calidad metodológica (Methodological quality).
Ver validez interna, prevención de sesgo (internal validity, bias prevention).

 Características basales (Baseline characteristics).
Valores de las variables demográficas, clínicas y otras que se obtienen para cada participante al comienzo de cada ensayo, antes de aplicar la intervención.

CDSR.
Ver Base de Datos Cochrane de Revisiones Sistemáticas (Cochrane Database of Systematic Reviews).

 Cegamiento (Blinding)
[En un ensayo controlado:] El proceso de prevenir que los que están relacionados con un ensayo se enteren del grupo al que pertenece un participante. El riesgo de sesgo se minimiza cuando el menor número posible de personas sabe quién recibe la intervención experimental y quién la intervención control. Participantes, cuidadores, evaluadores del desenlace y analistas son todos candidatos al cegamiento. No siempre es posible cegar a ciertos grupos, por ejemplo a cirujanos en ensayos quirúrgicos. Los términos ciego simple, doble ciego y triple ciego son de uso común, pero no se usan de forma consistente y por tanto son ambiguos a menos de que se describan las personas que han sido cegadas. (También llamado enmascaramiento).

Cegamiento de la aleatorización (Randomisation blinding).
Ver ocultación de la asignación (concealment of allocation).

Cegamiento simple (Single blind). (También llamado ocultación simple.)
Ver cegamiento.

 CINAHL (Índice Acumulativo de Documentación sobre Enfermería y Temas Sanitarios Relacionados) (Cumulative Index to Nursing and Allied Health Literature).
Base de datos electrónica que cubre la mayoría de revistas de enfermería y profesiones sanitarias similares.

CLIB.
Ver The Cochrane Library.

 Clínicamente significativo (Clinically significant).
Un resultado (p.ej., el efecto de un tratamiento) que es lo suficientemente grande para ser de importancia práctica para pacientes y proveedores de cuidados sanitarios. Esto no es igual a estadísticamente significativo. La evaluación de la significación clínica toma en cuenta factores tales como el tamaño del efecto de un tratamiento, la gravedad de la condición que se está tratando, los efectos secundarios del tratamiento y el coste. Por ejemplo, si el efecto estimado de un tratamiento para el acné fue pequeño pero estadísticamente significativo, pero el tratamiento era muy caro y causaba nauseas en muchos de los pacientes tratados, este no sería un resultado clínicamente significativo. Demostrar que un medicamento baja el latido cardiaco en un promedio de 1 latido por minuto tampoco sería clínicamente significativo.  

 Cochrane Library (CLIB) (Biblioteca Cochrane).
Una colección de bases de datos, publicadas en CD-ROM y en Internet y actualizadas trimestralmente, que contiene la Base de Datos Cochrane de Revisiones Sistemáticas, el Registro Central Cochrane de Ensayos Controlados, la Base de Datos de Resúmenes de Revisiones de Efectos, el Registro de Metodología Cochrane, la Base de Datos HTA, NHSEED e información sobre la Colaboración Cochrane. 

 Cociente de riesgo instantáneo (Hazard ratio).
Una medida del efecto producida por un análisis de supervivencia. Esto representa el aumento del riesgo de un grupo para presentar el desenlace de interés. Por ejemplo, si el cociente de peligro instantáneo de muerte por un tratamiento es 0,5, entonces podemos decir que los pacientes tratados tenderán a morir en una tasa que es la mitad de la de los no tratados. 

 Cointervención (Co-intervention).
La aplicación de procesos diagnósticos o terapéuticos adicionales a personas que reciben un programa de tratamiento específico. En un ensayo controlado pueden recibir cointervenciones los miembros de uno o ambos de los grupos experimental y control. 

 Colaboración Cochrane (Cochrane Collaboration, The).
Una organización internacional cuyo objetivo es ayudar a las personas a tomar decisiones bien informadas sobre la atención sanitaria, preparando, manteniendo y asegurando el acceso a revisiones sistemáticas sobre los efectos de las intervenciones en salud.

 Comorbilidad (Co-morbidity).
La presencia de una o más enfermedades, además de las que son de principal interés. En un estudio en que se investiga el tratamiento para una enfermedad, algunos de los individuos pueden tener otras enfermedades que podrían afectar su desenlace. (La comorbilidad puede ser un factor de confusión).

 Comparación no sesgada (Unconfounded comparison).
Una comparación entre dos grupos de tratamiento que dará una estimación no sesgada del efecto del tratamiento debido al diseño del estudio. Para que una comparación no esté sesgada hay que tratar de forma idéntica a los dos grupos de tratamiento, exceptuando el tratamiento aleatorizado. Por ejemplo, para estimar el efecto de la heparina en un ictus agudo, un ensayo de sólo heparina frente a un placebo daría una comparación no sesgada. Sin embargo, un ensayo sobre sólo heparina frente a sólo aspirina dará una comparación sesgada del efecto de la heparina. 

 Comparación sesgada (Confounded comparison).
Una comparación entre dos grupos de tratamiento que producirá una estimación sesgada del efecto del tratamiento debido al diseño del estudio. Para que una comparación no esté sesgada, se debe tratar a los dos grupos de forma idéntica, aparte del tratamiento aleatorizado. Por ejemplo, para la estimación del efecto de la heparina en el ictus agudo, un ensayo de sólo heparina frente a un placebo daría una comparación no sesgada. Sin embargo, un ensayo de sólo heparina frente a sólo aspirina daría una comparación sesgada del efecto de la heparina. (Ver también comparación no sesgada).

 Comparaciones multiples (Multiple comparisons).
Hacer análisis múltiples de los mismos datos. Las comparaciones estadísticas múltiples aumentan la probabilidad de cometer un Error tipo I, p.ej., atribuir una diferencia a una intervención cuando probablemente se deba al azar.

 Contaminación (Contamination) (en un ensayo controlado:)  
La aplicación inadvertida de la intervención que se evalúa a personas del grupo control; o la falta inadvertida de aplicar la intervención a personas asignadas al grupo intervención. El temor a la contaminación es unode los motivos para hacer un ensayo aleatorizado por conglomerados.

 Contexto (Context).
Las condiciones y circunstancias que son relevantes en la aplicación de una intervención, por ejemplo el ámbito (en el hospital, en el domicilio, en el aire); el tiempo (día laborable, festivo, de noche); tipo de práctica (primaria, secundaria, cuidados terciarios, consulta privada, consulta del seguro, beneficencia); rutinaria o de urgencia.

 Control (Control).

  1. (En un estudio controlado:) Un participante en la rama que sirve de comparación para una o más intervenciones experimentales. Los controles pueden recibir un placebo, ningún tratamiento, tratamiento estándar, o una intervención activa, cómo sería un medicamento estándar. 
  2. (En un estudio de casos y controles:) Una persona que no tiene la enfermedad o desenlace de interés. 
  3. (En estadística:) Tener en cuenta, o ajustar según las influencias u observaciones externas.Control histórico (Historical control). Una persona control o grupo de controles cuyos datos se recogieron antes que los del grupo que se estudia en la actualidad. Hay un riesgo grande de sesgo en estudios que usan controles históricos, debido a las diferencias sistemáticas entre los grupos de comparación por cambios a lo largo del tiempo en riesgos, pronóstico, atención sanitaria, etc.

 Correlación (Correlation). 

  1. Ver asociación (association). (Correlación positiva es lo mismo que asociación positiva, y correlación negativa es lo mismo que asociación negativa.)
  2. (En estadística:) Asociación lineal entre dos variables que se mide por medio de un coeficiente de correlación. Un coeficiente de correlación puede tener un rango de -1 (correlación negativa perfecta) a +1 (correlación positiva perfecta). En este caso perfecta significa que todos los puntos están en línea recta. Un coeficiente de correlación de 0 significa que no existe relación lineal entre las variables.

Criterio de valoración (Endpoint). 
Ver desenlace (outcome).

 Criterios indirectos de valoración (Surrogate endpoints Outcome).
Medidas de desenlace que no son de importancia práctica directa pero que se piensa que reflejan desenlaces importantes; por ejemplo, la tensión arterial no es de importancia directa para los pacientes, pero a menudo se usa como desenlace en los ensayos clínicos porque es un factor de riesgo para los ictus e infartos. Los valores surrogados a menudo son marcadores fisiológicos o bioquímicos que se pueden medir con relativa facilidad y rapidez, y que se toman cómo predictores de desenlaces clínicos importantes. A menudo se usan cuando la observación de desenlaces clínicos requiere un seguimiento largo. (También llamados desenlaces intermedios, desenlaces indirectos).

 

D

 Datos agregados (Aggregate data).
Datos resumidos por grupo, por ejemplo, datos resumidos del desenlace de los grupos tratamiento y control en un ensayo controlado.

 Datos dicotómicos (Dichotomous data).
Son datos que pueden tomar uno de dos valores posibles, p.ej., muerto/vivo, fumador/no-fumador, presente/ no presente. (También se llaman datos binarios). A veces los datos contínuos o los datos ordinales se simplifican convirtiéndolos en datos dicotómicos (p.ej., la edad en años podría convertirse en < 75 años o en ≥ 75 años).

 Datos individuales de pacientes (En un metanálisis:) (Individual patient data [In metaanalysis:])
La disponibilidad de datos crudos sobre cada participante de cada estudio incluido, y no de datos agregados (resumen de datos de los grupos de comparación en cada estudio). Las revisiones que utilizan datos individuales de pacientes requieren la colaboración de los investigadores que llevaron a cabo los estudios originales, quienes tienen que facilitar los datos necesarios. 

 Datos ordinales (Ordinal data).
Datos que se clasifican en más de dos categorías que tienen un orden lógico, por ejemplo, no fumadores, ex fumadores, fumadores ligeros y grandes fumadores. Los datos ordinales con frecuencia se reducen a dos categorías para simplificar el análisis y la presentación, lo que puede resultar en una pérdida considerable de información. 

 Declaración de conflicto de interés (o declaración de intereses en conflicto) (Conflict of interest declaration [or Competing interests declaration]).
Una declaración hecha por un contribuidor a un informe o revisión sobre intereses personales, económicos u otros, que podrían influirle.

 Desenlace (Outcome).
Un componente del estado clínico y funcional de un/a participante después de una intervención y que se usa para evaluar la efectividad de una intervención. Ver también desenlace primario, desenlace secundario.

 Desenlace primario (Primary outcome).
El desenlace más importante.

 Desenlace secundario (Secondary outcome).
Un desenlace utilizado para evaluar efectos adicionales de la intervención que a priori se identificó cómo menos importante que los desenlaces primarios.

 Desenlaces indirectos (Surrogate outcomes).
Ver criterios indirectos de valoración (surrogate endpoints).

 Desgaste (Attrition).
La pérdida de participantes durante un estudio. (También llamada pérdida en el seguimiento.) A los participantes que se pierden en un estudio a menudo se les llama abandonos.

 Desviación estándar (Standard deviation).
Una medida de la extensión o dispersión de un conjunto de observaciones, que se calcula cómo el promedio de la diferencia con el valor medio de la muestra.

Diferencia absoluta de riesgo (Absolute risk difference).
Ver diferencia de riesgo (risk difference).

 Diferencia de medias (En un metanálisis:) (Mean difference [In meta-analysis:])
Un método que se utiliza para combinar las medidas en las escalas contínuas (como el peso), cuando se conocen la media, desviación estándar y tamaño de la muestra en cada grupo. El valor que se le da a la diferencia de medias de cada estudio (p.ej., cuánta influencia ejerce cada estudio en los resultados generales del metanálisis) se determina por la precisión de su estimación de efecto y, en el software estadístico de RevMan y la Base de Datos Cochrane de Revisiones Sistemáticas, es igual al inverso de la varianza. Este método asume que todos los ensayos han medido el desenlace con la misma escala. Ver también diferencia estandarizada de medias (standardised mean difference). (También llamada diferencia ponderada de medias.)

 Diferencia de riesgos (Risk difference).
La diferencia en el tamaño del riesgo entre dos grupos. Por ejemplo, si un grupo tiene un riesgo del 15% de contraer una enfermedad específica y el otro tiene un riesgo del 10%, la diferencia de riesgos es de cinco puntos porcentuales. (También llamada diferencia absoluta de riesgo, reducción absoluta del riesgo). 

 Diferencia estandarizada de medias (Standardised mean difference).
La diferencia entre dos medias calculadas, dividida por el cálculo de la desviación estándar. Se usa para combinar los resultados de estudios que usan distintas formas de medir el mismo concepto, p.ej., la salud mental. Al expresar los efectos cómo un valor estandarizado se pueden combinar los resultados, puesto que no tienen unidades. A las diferencias estandarizadas de medias a veces se les llama un índice d. (También llamada SMD).

Diferencia ponderada de medias (Weighted mean difference).
Ver diferencia de medias (mean difference).

 Diseño apareado (Paired design).
Un estudio en que los participantes o grupos de participantes son apareados (p.ej., basándose en factores pronósticos). Un miembro de cada par se asigna al grupo experimental (de intervención) y el otro al grupo control. 

Diseño de grupo independiente (Independent group design).
Ver ensayo de grupos paralelos (parallel group trial).

 Diseño factorial (Factorial design).
Un diseño de ensayo que se utiliza para evaluar la contribución individual de los tratamientos que se dan en combinación, como también cualquier efecto interactivo que puedan tener. La mayoría de los ensayos solamente consideran un factor, en donde se compara una intervención con una o más alternativas, o con un placebo. En un ensayo en que se usa un diseño factorial de 2x2, los participantes se asignan a una de cuatro posibles combinaciones. Por ejemplo, en un ensayo clínico controlado aleatorizado de diseño factorial 2x2 sobre sustitución de nicotina y asesoramiento profesional, los participantes se asignarían sólo a sustitución de nicotina, sólo a asesoramiento profesional, a ambos, o a ninguno. De esta manera es posible valorar el efecto independiente de cada intervención en el dejar de fumar y el efecto combinado (interacción) entre las dos intervenciones. Este tipo de estudio se suele hacer en circunstancias donde no es probable que exista interacción. 

 Diseño secuencial abierto (Open sequential design).
Un ensayo secuencial en que la decisión de parar el ensayo depende del tamaño del efecto, y no hay un número máximo de participantes en el estudio. 

 Distribución (Distribution).
La colección de valores de una variable en la población o la muestra, a veces llamada una distribución empírica. Ver también distribución de probabilidades.

 Distribución de probabilidad (Probability distribution).
La función que muestra las probabilidades de que una variable sea igual a cada una de los posibles valores de una secuencia. Por ejemplo, distribución binomial, distribución normal y distribución de Poisson. Ver también distribución. 

Doble ciego (Double blind).
Ver cegamiento (blinding).

 Dosis dependiente (Dose dependent).
Respuesta a un medicamento que puede estar relacionada con la cantidad administrada (p.ej., la dosis). A veces se hacen los ensayos para probar el efecto de distintas dosis del mismo medicamento. Esto puede ser para ver tanto los beneficios como los daños. Duplicar/reproducir (Replicate/reproduce). Hacer lo mismo a otras personas para alcanzar los mismos desenlaces que se obtuvieron en un estudio. También, repetir las circunstancias de un estudio para verificar si los resultados y desenlaces son similares en otra muestra o población.

 

E

Efectividad (Effectiveness).
El grado en que una intervención específica, aplicada en circunstancias normales, hace lo que tiene que hacer. Los ensayos clínicos que evalúan la efectividad a veces se llaman ensayos pragmáticos. Ver también intención de tratar (intention-to-treat). 

Efecto adverso (Adverse effect).
Un acontecimiento adverso en el cual hay una posibilidad razonable de la existencia de una relación causal entre el medicamento/intervención y el acontecimiento. El término “efecto adverso” se refiere a todas las intervenciones, mientras que “reacción adversa a medicamento” (RAM) se usa sólo con medicamentos. En el caso de los medicamentos, un efecto adverso tiende a ser visto desde el punto de vista del medicamento y una reacción adversa es vista desde el punto de vista del paciente. 

Efecto causal (Causal effect).
Una asociación entre dos características para la cual se puede demostrar que es debida a causa y efecto, p.ej., que un cambio en una de ellas causa un cambio en la otra. La causalidad se puede demostrar con estudios experimentales, como los ensayos controlados (p.ej., que una intervención experimental causa una reducción de la mortalidad). Sin embargo, a menudo no se puede establecer la causalidad a través de un estudio observacional. 

Efecto del tratamiento (Treatment effect).
Ver estimación del efecto (estimate of effect).

Efecto secundario (Side effect).
Cualquier efecto no intencionado de una intervención. Los efectos secundarios normalmente están asociados a productos farmacéuticos, en cuyo caso estan relacionados con las propiedades farmacéuticas del medicamento en dosis que se usan con objetivo terapéutico en humanos. 

Eficacia (Efficacy).
El grado en que una intervención produce un resultado beneficioso en circunstancias idóneas. Los ensayos clínicos que evalúan eficacia a veces se llaman ensayos explicativos y se restringen a participantes que cooperan totalmente.

Emparejamiento (En un estudio de casos y controles:) (Matching [In a case-control study:])
 Elegir uno o más controles con atributos similares a cada caso. Los investigadores emparejan a casos y controles de acuerdo con variables específicas que se consideran importantes, como la edad y el sexo. 

Empírico (Empirical).
Los resultados empíricos se basan en la observación y no solamente en el razonamiento. 

Encuesta (Survey).
Ver estudio transversal (cross-sectional study).

Enmascaramiento (Masking).
Ver cegamiento (blinding).

Enmascaramiento de la asignación (Allocation concealment).
Ver ocultación de la asignación (concealment of allocation).

Ensayo aleatorizado n = 1 (N of 1 randomised trial).
Un ensayo aleatorizado hecho con una persona para determinar el tratamiento ideal para esa persona. A la persona se le administran repetidas intervenciones experimentales y de control (o de dos o más tratamientos experimentales), en un orden de tratamiento que está aleatorizado. 

Ensayo aleatorizado por conglomerados (Cluster randomised trial).
Un ensayo en que conglomerados (o grupos) de individuos (p.ej., clínicas, familias, zonas geográficas), en vez de personas individuales, se aleatorizan a diferentes ramas de esos estudios. Se debería tener cuidado de no caer en errores de unidad de análisis. 

Ensayo clínico (Clinical trial).
Un experimento para comparar los efectos de dos o más intervenciones sanitarias. Ensayo clínico es un término general que se usa para una variedad de diseños de ensayos sanitarios, incluyendo los ensayos no controlados, ensayos controlados, y ensayos controlados aleatorizados. (También llamado estudio de intervención).

Ensayo clínico abierto (Open clinical trial).
Hay al menos tres posibles significados de este término.

  1. Un ensayo clínico en que el investigador y el participante conocen qué intervención se está aplicando a qué participante (p.ej., sin cegamiento). La asignación aleatoria puede usarse o no en estos ensayos. A veces llamados “de diseño abierto”. 
  2. Un ensayo clínico en que el investigador decide qué intervención se va a usar (asignación no aleatoria). A veces se le llama un diseño de etiqueta abierta (pero algunos ensayos a los que se llama de “etiqueta abierta” son aleatorios). 
  3. Un ensayo clínico que utiliza un diseño secuencial abierto.

 

Ensayo clínico aleatorizado (Randomised clinical trial).
Ver ensayo aleatorizado y controlado (randomised controlled trial). 

Ensayo controlado (Controlled trial).
Un ensayo clínico que tiene un grupo control. Estos ensayos no son necesariamente aleatorizados. Ensayo controlado y aleatorizado (Randomised controlled trial). Un experimento en que dos o más intervenciones, que posiblemente incluyen una intervención control o no intervención, se comparan al ser asignadas de manera aleatoria a los sujetos. En la mayoría de los ensayos se asigna una sola intervención a cada sujeto, pero a veces la asignación se hace a grupos definidos de sujetos (por ejemplo, en un hogar) o se asignan las intervenciones a un mismo sujeto (por ejemplo, en un orden diferente o a diferentes partes del cuerpo). 

Ensayo cruzado (Cross-over trial).
Un tipo de ensayo clínico que compara dos o más intervenciones en las que los participantes, cuando completan el ciclo de un tratamiento, cambian a otro. Por ejemplo, para una comparación de tratamientos A y B, la mitad de los participantes se asigna aleatoriamente para recibir los tratamientos en el orden A, B y la otra mitad en el orden B, A. Es especialmente apropiado para el estudio de opciones de tratamiento para problemas de salud relativamente estables. El tiempo en que se recibe la primera intervención se conoce como el primer período, y la segunda intervención se recibe durante el segundo período. Ver también arrastre y efecto del período. 

Ensayo de equivalencia (Equivalence trial).
Un ensayo diseñado para determinar si la respuesta a dos o más tratamientos difiere en una cantidad que no tiene importancia clínica. Esto se suele demostrar probando que la verdadera diferencia en el tratamiento podría estar entre el nivel de equivalencia inferior y superior de las diferencias que son clínicamente aceptables. Ver también ensayo de no-inferioridad (noninferiority trial). 

Ensayo de grupos paralelos (Parallel group trial).
Un ensayo que compara dos grupos de personas a la vez, uno de los cuales recibe la intervención de interés y el otro de los cuales es el grupo control. Algunos ensayos paralelos tienen más de dos grupos de comparación y otros comparan diferentes intervenciones sin incluir un grupo control sin intervención. (También llamado diseño de grupo independiente).

Ensayo de múltiples brazos (Multi-arm trial).
Un ensayo con más de dos brazos.

Ensayo de no-inferioridad (Non-inferiority trial).
Un ensayo diseñado para determinar si el efecto de un tratamiento nuevo no es peor que un tratamiento estándar en más de una cantidad pre-especificada. Es una versión unilateral de un ensayo de equivalencia. 

Ensayo explicativo (Explanatory trial).
Un ensayo que intenta probar una estrategia de tratamiento en una situación ideal en que los pacientes reciben la terapia completa según se ha prescrito, y el uso de otros tratamientos puede controlarse o restringirse. Ver también ensayo pragmático (pragmatic trial). 

Ensayo multicéntrico (Multicentre trial).
Un ensayo llevado a cabo en varias zonas geográficas. A veces los ensayos se desarrollan entre varias instituciones, en lugar de una sola institución, especialmente cuando se necesita un gran número de participantes. 

Ensayo no controlado (Uncontrolled trial).
Un ensayo clínico que no tiene grupo control. 

Ensayo pragmático (Pragmatic trial).
Un ensayo que intenta probar una estrategia de tratamiento en una situación real, en que muchos pueden no recibir todo el tratamiento, y pueden usar también otros tratamientos. Éste tipo de ensayo es lo opuesto a un ensayo de exploración, que se hace en condiciones ideales e intenta determinar si una terapia puede causar un cambio (p.ej., probando su eficacia). 

Ensayo secuencial (Sequential trial).
Un ensayo aleatorizado en que se analizan los datos después de que se obtienen los resultados de cada participante, y el ensayo continúa hasta que se encuentra un claro beneficio a favor de uno de los grupos de comparación, o hasta que se observa que no van a haber diferencias. La ventaja principal de los ensayos secuenciales es que normalmente son más cortos que los ensayos de tamaño fijo cuando hay una clara diferencia en la efectividad de las intervenciones que se comparan. Su uso está restringido a condiciones o enfermedades en que el desenlace de interés se conoce relativamente rápido. En un ensayo secuencial de grupo se hace un número limitado de análisis provisionales de los datos en momentos prespecificados, durante el reclutamiento y el seguimiento, aproximadamente entre 3 y 6 veces en total.

Ensayos de Fase I, II, III, IV (Phase l, ll, lll, IV trials).
Una serie de niveles de ensayos que se requieren de los medicamentos antes (y después) de que se usen de forma habitual en la práctica clínica. Los ensayos de Fase I evaluan los efectos tóxicos en humanos (poca gente participa en ellos, y normalmente sin controles). Los ensayos de Fase II evaluan el beneficio terapéutico (normalmente incluyen a varios cientos de personas, generalmente con controles, pero no siempre). Los ensayos de Fase III comparan el nuevo tratamiento con el tratamiento estándar (o placebo), (normalmente un ensayo aleatorizado y controlado completo). En este punto ya se puede aprobar un medicamento para ser usado en la población. La Fase IV monitoriza un tratamiento nuevo en la población, a menudo para evaluar su seguridad y efectividad a largo plazo. 

Equidad (Equipoise).
Un estado de incertidumbre en el que una persona piensa que cualquiera de dos opciones de tratamiento puede ser la mejor. 

Error aleatorio (Random error).  
Error debido al azar. Los intervalos de confianza y valores P permiten la existencia del error aleatorio, pero no de errores sistemáticos (sesgo).

Error de unidad de análisis (Unit of analysis error).
Un error que ocurre en el análisis estadístico cuando el análisis no tiene en cuenta la unidad de asignación. En algunos estudios la unidad de asignación no es una persona sino un grupo de personas, o las diferentes partes de una persona., cómo los ojos o dientes. A veces se analizan los datos de estos estudios como si las personas hubiesen sido asignadas de manera individual. Si se usan los individuos cómo la unidad de análisis cuando se han asignado grupos de personas, pueden resultar intervalos de confianza demasiado estrechos. En un metanálisis puede resultar en que los estudios reciban más ponderación que la adecuada. 

Error estándar (Standard error).
La desviación estándar de la distribución muestral de una estadística. Las medidas que se toman de una muestra de la población varían de una muestra a otra. El error estándar es una medida de la variación de la estadística muestral sobre todas las otras posibles muestras del mismo tamaño. El error estándar se reduce a medida que aumenta el tamaño muestral. (También llamado SE).

Estadísticamente significativo (Statistically significant).
Un resultado que es probable que no ocurriera por azar. El umbral para este juicio es que los resultados, o resultados más extremos, ocurrirían por casualidad con una probabilidad de menos de 0,05 si fuese cierta la hipótesis nula. Las pruebas estadísticas producen un valor P que se utiliza para evaluar ésto. 

Estimación del efecto (Estimate of effect).
La relación observada entre una intervención y un desenlace, expresada, por ejemplo, cómo el número que hay que tratar para conseguir beneficio, odds ratio, diferencia de riesgos, razón de riesgos, diferencia estandarizada de medias, o diferencia de medias. (También llamada efecto del tratamiento.)

Estimación puntual (Point estimate).
Los resultados (p.ej., media, diferencia ponderada de medias, odds ratio, razón de riesgos o diferencia de riesgos) obtenidos de una muestra (un estudio o metanálisis) que se utlizan cómo la mejor estimación de lo que ocurre en la población diana de la cual se obtuvo la muestra. 

Estrategia de búsqueda (Search strategy).

  1. Los métodos utilizados por un revisor para localizar los estudios relevantes, incluyendo hacer búsquedas manuales en las revistas relevantes, buscar en las bases de datos electrónicas, contactar con laboratorios, hacer otras formas de contacto personal y revisar las bibliografias 
  2. La combinación de términos que se utilizan para identificar estudios en una base de datos electrónica cómo MEDLINE.

Estratificación (Stratification).
El proceso por el cual se separan los grupos en subgrupos mutuamente excluyentes de la población que comparten una característica: p.ej., grupo de edad, sexo, o nivel socioeconómico. Es posible comparar estos estratos diferentes para ver si los efectos de un tratamiento son diferentes entre los subgrupos. Ver también: análisis de subgrupo.

Estudio controlado de antes y después (Controlled before and after study).
Un diseño de estudio no-aleatorizado en que se identifica una población control de características y funcionamiento similares al grupo intervención. Se recogen los datos antes y después de la intervención tanto en el grupo control cómo en el de intervención. 

Estudio de casos y controles (Case-control study).
Estudio que compara a personas con una enfermedad o desenlace específico (casos) con personas de la misma población que no tienen esa enfermedad o desenlace (controles), y que busca encontrar asociaciones entre el desenlace y una exposición previa a factores de riesgo específicos. Este diseño es especialmente útil cuando el desenlace es poco usual y se puede medir con seguridad la exposición previa. Los estudios de casos y controles generalmente son retrospectivos, pero no siempre. 

Estudio de cohortes (Cohort study).
Un estudio observacional en el cual un grupo definido de personas (la cohorte) es seguido en el tiempo y en el que los desenlaces se comparan entre los subgrupos de la cohorte que estuvieron expuestos o no expuestos (o expuestos a diferentes niveles) a una intervención o a otro factor de interés. Un estudio de cohortes prospectivo reune a los participantes y les hace un seguimiento en el tiempo. Un estudio de cohortes retrospectivo (o histórico) identifica a los sujetos a partir de registros históricos y les sigue en el tiempo desde aquel momento hasta el presente. Puesto que los sujetos no son asignados por el investigador a diferentes intervenciones u otras exposiciones, se debe utilizar un ajuste estadístico para minimizar la influencia de otros factores (de confusión). 

Estudio de intervención (Intervention study).
Ver Ensayo clínico (Clinical trial).

Estudio de prevalencia (Prevalence study).
Un tipo de estudio transversal que mide la prevalencia de una característica. 

Estudio de un caso (Case study).
Un estudio que informa sobre observaciones de un solo individuo. (También llamado anécdota, historia de un caso, o informe de un caso). 

Estudio descriptivo (Descriptive study).
Un estudio que describe las características de una muestra de individuos. A diferencia de un estudio experimental, los investigadores no intervienen de forma activa para probar una hipótesis, sino que solamente describen el estado de salud o características de una muestra de una población específica.

Estudio experimental (Experimental study).
Un estudio en que los investigadores intervienen de forma activa para probar una hipótesis. En un ensayo controlado, que es una clase de experimento, los individuos que reciben el tratamiento se dice que están en el grupo experimental o rama experimental del ensayo. 

Estudio negativo (Negative study).
Un término que se usa con frecuencia para referirse a un estudio con resultados que, o no indican un efecto beneficioso del tratamiento, o no han alcanzado significación estadística. El término puede causar confusión porque puede referirse a la significación estadística o a la dirección del efecto. Los estudios con frecuencia tienen desenlaces múltiples, los criterios para clasificar estudios como “negativos” no son siempre claros y, en el caso de estudios sobre riesgo o efectos indeseables, los estudios “negativos” son los que no muestran un efecto perjudicial. 

Estudio no aleatorizado (Non-randomised study).
Cualquier estudio cuantitativo que calcula la efectividad de una intervención (daño o beneficio) y que no utiliza la aleatorización para asignar unidades a grupos de comparación (incluyendo estudios en que la “asignación” se hace cuando se toman decisiones habituales sobre el tratamiento o las preferencias de los sujetos, p.ej.,estudios a los que normalmente se les llama “observacionales”). Para evitar la ambigüedad se debe justificar el término haciendo una descripción del tipo de pregunta de interés. Por ejemplo, un “estudio de intervención no aleatorizado” es típicamente un estudio comparativo de una intervención experimental frente a una intervención control (o a ninguna intervención), que no es un ensayo controlado aleatorizado. Hay muchas clases de estudios de intervención no aleatorizados, incluyendo los estudios de cohorte, estudios caso control, estudios controlados antes-y-después, estudios de series temporales interrumpidas y ensayos controlados que no utilizan estrategias de aleatorización adecuadas (a veces llamados estudios cuasialeatorizados).

Estudio no experimental (Non-experimental study).
Ver estudio observacional (observational study).

Estudio observacional (Observational study).
Un estudio en que los investigadores no intervienen, sino que simplemente observan el curso de los acontecimientos. Los cambios o diferencias en una característica (p.ej., si los sujetos recibieron o no la intervención de interés) se estudian en relación con estos cambios o diferencias en otras características (p.ej., si murieron o no), sin ninguna acción del investigador. Hay un mayor riesgo de un sesgo de selección que en los estudios experimentales. Ver también estudio controlado aleatorizado. (También se le llama estudio no experimental.) 

Estudio original (Original study).
Ver estudio primario (primary study).

Estudio positivo (Positive study).
Un estudio con resultados que indican un efecto beneficioso de la intervención que se estudia. El término puede generar confusión porque puede referirse a significación estadística y la dirección del efecto; los estudios a menudo tienen desenlaces múltiples: los criterios para clasificar los estudios cómo negativos o positivos no siempre son claros; y, en el caso de estudios sobre riesgo o efectos indeseados, los estudios “positivos” son los que muestran un efecto dañino.

Estudio primario (Primary study).
“Investigación original” en la que se recogen datos. El término estudio primario a veces se utiliza para distinguirlo de un estudio secundario (un reanálisis de datos anteriormente recogidos), metanálisis y otras formas de combinar estudios (cómo análisis económico y análisis de decisión). (También llamado estudio original).

Estudio prospectivo (Prospective study).
En evaluaciones de los efectos de intervenciones sanitarias, es un estudio en que se identifica a las personas de acuerdo con su actual estado de riesgo o exposición y se siguen en el tiempo para observar el desenlace. Los estudios aleatorizados y controlados son siempre estudios prospectivos. Los estudios de cohorte son normalmente prospectivos o retrospectivos, mientras que los estudios caso control son normalmente retrospectivos. En Epidemiología a veces se usa incorrectamente “estudio prospectivo” cómo sinónimo de estudio de cohorte. Ver también estudio retrospectivo. 

Estudio retrospectivo (Retrospective study).
Un estudio en que a los participantes les han sucedido los desenlaces antes del comienzo del estudio. Los estudios de casos y controles normalmente son retrospectivos, los estudios de cohorte a veces lo son, y los ensayos aleatorizados y controlados nunca lo son. Ver también estudio prospectivo (prospective study).

Estudio secundario (Secondary study).
Un estudio de estudios: una revisión de estudios individuales (cada uno de los cuales es llamado un estudio primario). Una revisión istemática es un estudio secundario. 

Estudio transversal (Cross-sectional study).
Un estudio que mide la distribución de alguna(s) característica(s) en una población en un punto específico en el tiempo. (También se le llama encuesta).

 

F

Factor de confusión (Confounder). Un factor que

 

D

Descriptive study
A  study that describes characteristics of a sample of individuals. Unlike an experimental study, the investigators do not actively intervene to test a hypothesis, but merely describe the health status or characteristics of a sample from a defined population.

 Detection bias (synonym: ascertainment bias)
Systematic difference between comparison groups in how outcomes are ascertained, diagnosed or verified.  (Also called ascertainment bias.)

 Distribution
The collection of values of a variable in the population or the sample, sometimes called an empirical distribution. See also probability distribution.

 Dichotomous data (synonym: binary data)
Data that can take one of two possible values, such as dead/alive, smoker/non-smoker, present/not present. (Also called binary data.) Sometimes continuous data or ordinal data are simplified into dichotomous data (e.g. age in years could become <75 years or ≥75 years).

Dose dependent
A response to a drug which may be related to the amount received (i.e. the dose). Sometimes trials are done to test the effect of different dosages of the same drug. This may be true for both benefits and harms.

Dose response relationship
The relationship between the quantity of treatment given and its effect on outcome.  In meta-analysis, dose-response relationships can be investigated using meta-regression.

Double blind
See blinding.

Dropouts
See attrition.

 

E

Economic analysis (synonym: economic evaluation)
Comparison of the relationship between costs and outcomes of alternative healthcare interventions. See cost-benefit analysis, cost-effectiveness analysis, and cost-utility analysis.

Effect size

  1. A generic term for the estimate of effect of treatment for a study.
  2. A dimensionless measure of effect that is typically used for continuous data when different scales (e.g. for measuring pain) are used to measure an outcome and is usually defined as the difference in means between the intervention and control groups divided by the standard deviation of the control or both groups.  See also standardised mean difference.

 Effectiveness
The extent to which a specific intervention, when used under ordinary circumstances, does what it is intended to do. Clinical trials that assess effectiveness are sometimes called pragmatic or management trials. See also intention-to-treat.

 Efficacy
The extent to which an intervention produces a beneficial result under ideal conditions. Clinical trials that assess efficacy are sometimes called explanatory trials and are restricted to participants who fully co-operate.

EMBASE (Excerpta Medica database)
A European-based electronic database of pharmacological and biomedical literature covering 3,500 journals from 110 countries. Years of coverage - 1974 to present.

Empirical
Empirical results are based on experience (or observation) rather than on reasoning alone.

Endpoint
See outcome.

Epidemiology
The study of the health of populations and communities, not just particular individuals.

Equipoise
A state of uncertainty where a person believes it is equally likely that either of two treatment options is better.

 Equivalence trial
A trial designed to determine whether the response to two or more treatments differs by an amount that is clinically unimportant. This is usually demonstrated by showing that the true treatment difference is likely to lie between a lower and an upper equivalence level of clinically acceptable differences.  See also non-inferiority trial.

 Estimate of effect (synonym: treatment effect)
The observed relationship between an intervention and an outcome expressed as, for example, a number needed to treat to benefit, odds ratio, risk difference, risk ratio, standardised mean difference, or weighted mean difference.  (Also called treatment effect.)

Event rate
See risk.

 Experimental intervention
An intervention under evaluation. In a controlled trial, an experimental intervention arm is compared with one or more control arms, and possibly with additional experimental intervention arms.

 Experimental study
the investigators actively intervene to test a hypothesis.  In a controlled trial, one type of experiment, the people receiving the treatment being tested are said to be in the experimental group or arm of the trial.

 Explanatory trial
A trial that aims to test a treatment policy in an ideal situation where patients receive the full course of therapy as prescribed, and use of other treatments may be controlled or restricted.  See also pragmatic trial.

 External validity (synonyms: external validity, generalisability, relevance, transferability)
The extent to which results provide a correct basis for generalisations to other circumstances. For instance, a meta-analysis of trials of elderly patients may not be generalisable to children. (Also called generalisability or applicability.)

 

F

 Factorial design
A trial design used to assess the individual contribution of treatments given in combination, as well as any interactive effect they may have. Most trials only consider a single factor, where an intervention is compared with one or more alternatives, or a placebo. In a trial using a 2x2 factorial design, participants are allocated to one of four possible combinations. For example in a 2x2 factorial RCT of nicotine replacement and counselling, participants would be allocated to: nicotine replacement alone, counselling alone, both, or neither. In this way it is possible to test the independent effect of each intervention on smoking cessation and the combined effect of (interaction between) the two interventions. This type of study is usually carried out in circumstances where no interaction is likely.

Fixed effect model
[In meta-analysis:] A model that calculates a pooled effect estimate using the assumption that all observed variation between studies is caused by the play of chance. Studies are assumed to be measuring the same overall effect. An alternative model is the random-effects model.

Follow-up
The observation over a period of time of study/trial participants to measure outcomes under investigation.

 

G

Generalisability (synonyms: applicability, external validity, relevance, transferability)
See external validity.

 

H

Hazard rate
The probability of an event occurring given that it hasn’t occurred up to the current point in time.

Hazard ratio
A measure of effect produced by a survival analysis. This represents the increased risk with which one group is likely to experience the outcome of interest.  For example, if the hazard ratio for death for a treatment is 0.5, then we can say that treated patients are likely to die at half the rate of untreated patients.

 Heterogeneity

  1. Used in a general sense to describe the variation in, or diversity of, participants, interventions, and measurement of outcomes across a set of studies, or the variation in internal validity of those studies.
  2. Used specifically, as statistical heterogeneity, to describe the degree of variation in the effect estimates from a set of studies. Also used to indicate the presence of variability among studies beyond the amount expected due solely to the play of chance.

Heterogeneous
Used to describe a set of studies or participants with sizeable heterogeneity.  The opposite of homogeneous.

Historical control
A control person or group for whom data were collected earlier than for the group being studied. There is a large risk of bias in studies that use historical controls due to systematic differences between the comparison groups, due to changes over time in risks, prognosis, health care, etc.

 Homogeneous

  1. Used in a general sense to mean that the participants, interventions, and measurement of outcomes are similar across a set of studies.
  2. Used specifically to describe the effect estimates from a set of studies where they do not vary more than would be expected by chance.

See also heterogeneity.

Hypothesis
An unproved theory that can be tested through research.  To properly test a hypothesis, it should be pre-specified and clearly articulated, and the study to test it should be designed appropriately. See also null hypothesis.

 

I

Incidence
The number of new occurrences of something in a population over a particular period of time, e.g. the number of cases of a disease in a country over one year.

Index Medicus
Catalogue of the United States National Library of Medicine (NLM), and a periodical index to the medical literature. Available in printed form, or electronically as MEDLINE.

Individual patient data
[In meta-analysis:] The availability of raw data for each study participant in each included study, as opposed to aggregate data (summary data for the comparison groups in each study). Reviews using individual patient data require collaboration of the investigators who conducted the original studies, who must provide the necessary data.

 Intention-to-treat
A strategy for analysing data from a randomised controlled trial. All participants are included in the arm to which they were allocated, whether or not they received (or completed) the intervention given to that arm. Intention-to-treat analysis prevents bias caused by the loss of participants, which may disrupt the baseline equivalence established by randomisation and which may reflect non-adherence to the protocol. The term is often misused in trial publications when some participants were excluded.

 Interaction
The situation in which the effect of one independent variable on the outcome is affected by the value of a second independent variable. In a trial, a test of interaction examines whether the treatment effect varies across sub-groups of participants. See also factorial trial, sub-group analysis.

Intermediary outcomes
See surrogate endpoints.

 Internal validity
The extent to which the design and conduct of a study are likely to have prevented bias. Variation in quality can explain variation in the results of studies included in a systematic review. More rigorously designed (better quality) trials are more likely to yield results that are closer to the truth. (Also called methodological quality but better thought of as relating to bias prevention.) See also external validity, validitybias prevention.

Inter-rater reliability
The degree of stability exhibited when a measurement is repeated under identical conditions by different raters. Reliability refers to the degree to which the results obtained by a measurement procedure can be replicated. Lack of inter-rater reliability may arise from divergences between observers or instability of the attribute being measured. See also Intra-rater reliability.

 Interrupted time series
A research design that collects observations at multiple time points before and after an intervention (interruption). The design attempts to detect whether the intervention has had an effect significantly greater than the underlying trend.

 Intervention
The process of intervening on people, groups, entities or objects in an experimental study. In controlled trials, the word is sometimes used to describe the regimens in all comparison groups, including placebo and no-treatment arms. See also treatment, experimental intervention and control.

 Intervention group
A group of participants in a study receiving a particular health care interventionParallel group trials include at least two intervention groups.

 Intervention study
See Clinical trial.

 Intra-rater reliability
The degree of stability exhibited when a measurement is repeated under identical conditions by the same rater. Reliability refers to the degree to which the results obtained by a measurement procedure can be replicated. Lack of intra-rater reliability may arise from divergences between instruments of measurement, or instability of the attribute being measured.

 

L

LILACS (Latin American and Caribbean Health Sciences Literature)
An electronic database based on a regional database of medical and science literature. It is compiled by the Latin American and Caribbean Center for Health Science Information, a unit of the Pan American Health Organisation.

 Logistic regression
A form of regression analysis that models an individual's odds of disease or some other outcome as a function of a risk factor or intervention. It is widely used for dichotomous outcomes, in particular to carry out adjusted analysis. See also meta-regression.

Log-odds ratio
The (natural) log of the odds ratio. It is used in statistical calculations and in graphical displays of odds ratios in systematic reviews.

Loss to follow up
See attrition.

 

M

Masking
See blinding.

Matching
[In a case-control study:] Choosing one or more controls with particular matching attributes for each case. Researchers match cases and controls according to
particular variables that are thought to be important, such as age and sex. 

 Mean
The average value, calculated by adding all the observations and dividing by the number of observations.  Also called arithmetic mean.

 Mean difference
[In meta-analysis:] A method used to combine measures on continuous scales (such as weight), where the mean, standard deviation and sample size in each group are known. The weight given to the difference in means from each study (e.g. how much influence each study has on the overall results of the meta-analysis) is determined by the precision of its estimate of effect and, in the statistical software in RevMan and the Cochrane Database of Systematic Reviews, is equal to the inverse of the variance. This method assumes that all of the trials have measured the outcome on the same scale.  See also standardised mean difference.  (Also called WMD, weighted mean difference.)

 MEDLINE (MEDlars onLINE)
An electronic database produced by the United States National Library of Medicine. It indexes millions of articles in selected (about 3,700) journals. It is available through most medical libraries, and can be accessed on CD-ROM, the Internet and by other means. Years of coverage - 1966 to present.

 Meta-analysis
The use of statistical techniques in a systematic review to integrate the results of included studies. Sometimes misused as a synonym for systematic reviews, where the review includes a meta-analysis.

 Meta-regression
[In meta-analysis:] A technique used to explore the relationship between study characteristics (e.g. concealment of allocation, baseline risk, timing of the intervention) and study results (the magnitude of effect observed in each study) in a systematic review. See also logistic regression.

Methodological quality 
See internal validity, bias prevention.

 Minimisation
A method of allocation used to provide comparison groups that are closely similar for several variables. The next participant is assessed with regard to several characteristics, and assigned to the treatment group that has so far had fewer such people assigned to it. It can be done with a component of randomisation,
where the chance of allocation to the group with fewer similar participants is less than one.  Minimisation is best performed centrally with the aid of a computer program to ensure concealment of allocation

Morbidity
Illness or harm.  See also co-morbidity.

Mortality
Death.

Multi-arm trial
A trial with more than two arms.

Multicentre trial
A trial conducted at several geographical sites. Trials are sometimes conducted among several collaborating institutions, rather than at a single institution -  particularly when very large numbers of participants  are needed.

 Multiple comparison
The performance of multiple analyses on the same data. Multiple statistical comparisons increase the probability of making a Type I error, i.e. attributing a difference to an intervention when chance is a reasonable explanation. See also Sub-group analysis.

 Multiplicative model
A statistical model in which the combined effect of several factors is the product of the effects produced by each in the absence of the others. For example, if one factor multiplies risk by a% and a second factor by b%, the combined effect of the two factors is a multiplication by (a x b)%.

Multivariate analsis
Measuring the impact of more than one variable at a time while analysing a set of data, e.g. looking at the impact of age, sex, and occupation on a particular  outcome. Performed using regression analysis.

 

N

N of 1 randomised trial
A randomised trial in an individual to determine the optimum treatment for that individual. The individual is given repeated administrations of experimental and control interventions (or of two or more experimental treatments), with the treatments being randomised.

Negative association
See association.

Negative study
A term often used to refer to a study with results that either do not indicate a beneficial effect of treatment or that have not reached statistical significance.  The term can generate confusion because it can refer to either statistical significance or the direction of effect. Studies often have multiple outcomes, the criteria for classifying studies as ‘negative’ are not always clear and, in the case of studies of risk or undesirable effects, ‘negative’ studies are ones that do not show a harmful effect.

NNH
See number needed to treat to harm.

NNT
See number needed to treat to benefit.

NNTb
See number needed to treat to benefit.

NNTh
See number needed to treat to harm.

Non-experimental study
See observational study.

 Non-inferiority trial
A trial designed to determine whether the effect of a new treatment is not worse than a standard treatment by more than a pre-specified amount. A one-sided version of an equivalence trial.

Non-randomised study
Any quantitative study estimating the effectiveness of an intervention (harm or benefit) that does not use randomisation to allocate units to comparison groups (including studies where ‘allocation’ occurs in the course of usual treatment decisions or peoples’ choices, i.e. studies usually called ‘observational’). To avoid ambiguity, the term should be substantiated using a description of the type of question being addressed. For example, a 'non-randomised intervention study' is typically a comparative study of an experimental intervention against some control intervention (or no intervention) that is not a randomised controlled trial. There are many possible types of non-randomised intervention study, including cohort studies, case-control studies, controlled before-and-after studies, interrupted-time-series studies and controlled trials that do not use appropriate randomisation strategies (sometimes called quasi-randomised studies).

 Null hypothesis
The statistical hypothesis that one variable (e.g. which treatment a study participant was allocated to receive) has no association with another variable or set of variables (e.g. whether or not a study participant died), or that two or more population distributions do not differ from one another.  In simplest terms, the null hypothesis states that the factor of interest (e.g. treatment) has no impact on outcome (e.g. risk of death).

Number needed to harm
See number needed to treat to harm.

Number needed to treat
See number needed to treat to benefit.

 Number needed to treat to benefit
An estimate of how many people need to receive a treatment before one person would experience a beneficial outcome. For example, if you need to give a stroke prevention drug to 20 people before one stroke is prevented, then the number needed to treat to benefit for that stroke prevention drug is 20. The NNTb is estimated as the reciprocal of the absolute risk difference.  (Also called NNT, NNTB, number needed to treat.)

 Number needed to treat to harm
A number needed to treat to benefit associated with a harmful effect. It is an estimate of how many people need to receive a treatment before one more person would experience a harmful outcome or one fewer person would experience a beneficial outcome. (Also called NNH, NNTH, number needed to harm.) See also number needed to treat to benefit. 

 

O

 Observational study
A study in which the investigators do not seek to intervene, and simply observe the course of events. Changes or differences in one characteristic (e.g. whether or not people received the intervention of interest) are studied in relation to changes or differences in other characteristic(s) (e.g. whether or not they died), without action by the investigator.  There is a greater risk of selection bias than in experimental studies. See also randomised controlled trial. (Also called non-experimental study.)

 Odds
A way of expressing the chance of an event, calculated by dividing the number of individuals in a sample who experienced the event by the number for whom it did  not occur. For example, if in a sample of 100, 20 people died and 80 people survived the odds of death are 20/80 = 1⁄4, 0.25 or 1:4.

 Odds ratio (OR)
The ratio of the odds of an event in one group to the odds of an event in another group. In studies of treatment effect, the odds in the treatment group are usually divided by the odds in the control group. An odds ratio of one indicates no difference between comparison groups. For undesirable outcomes an OR that is less than one indicates that the intervention was effective in reducing the risk of that outcome.  When the risk is small, odds ratios are very similar to risk ratios. (Also called OR.)

Open clinical trial
There are at least three possible meanings for this term:

  1. A clinical trial in which the investigator and participant are aware which intervention is being used for which participant (i.e. not blinded). Random allocation may or may not be used in such trials. Sometimes called an ‘open label’ design.
  2. A clinical trial in which the investigator decides which intervention is to be used (non-random allocation). This is sometimes called an open label design (but some trials which are said to be ‘open label’, are randomised).
  3. A clinical trial that uses an open sequential design.

 Open sequential design
A sequential trial where the decision to stop the trial rests on the size of effect in those studies, and there is no finite maximum number of participants in the study.

OR
See odds ratios.

Ordinal data
Data that are classified into more than two categories where there is a natural order to the categories; for example, non-smokers, ex-smokers, light smokers and heavy smokers. Ordinal data are often reduced to two categories to simplify analysis and presentation, which may result in a considerable loss of information.

 Outcomes
A component of a participant's clinical and functional status after an intervention has been applied, that is used to assess the effectiveness of an intervention. See also primary outcome, secondary outcome.

Overview, systematic
See systematic review.

 

P

Paired design
A trial in which participants or groups of participants are matched (e.g. based on prognostic factors) and one member of each pair is allocated to the experimental (intervention) group and the other to the control group.

 Parallel group trial
A trial that compares two groups of people concurrently, one of which receives the intervention of interest and one of which is a control group. Some parallel trials have more than two comparison groups and some compare different interventions without including a non-intervention control group. (Also called independent group design.)

 Participant
An individual who is studied in a trial, often but not necessarily a patient.

 Performance bias
ystematic differences between intervention groups in care provided apart from the intervention being evaluated. For example, if participants know they are in the control group, they may be more likely to use other forms of care. If care providers are aware of the group a particular participant is in, they might act differently.  Blinding of study participants (both the recipients and providers of care) is used to protect against performance bias.

Phase I, II, III and IV trials
A series of levels of trials required of drugs before (and after) they are routinely used in clinical practice: Phase I trials assess toxic effects on humans (not many people participate in them, and usually without controls); Phase ll trials assess therapeutic benefit (usually involving a few hundred people, usually with controls, but not always); Phase III trials compare the new treatment against standard (or placebo) treatment (usually a full randomised controlled trial). At this point, a drug can be approved for community use. Phase IV monitors a new treatment in the community, often to evaluate long-term safety and effectiveness.

 Placebo
An inactive substance or procedure administered to a participant, usually to compare its effects with those of a real drug or other intervention, but sometimes for the psychological benefit to the participant through a belief that s/he is receiving treatment. Placebos are used in clinical trials to blind people to their treatment allocation. Placebos should be indistinguishable from the active intervention to ensure adequate blinding.

Point estimate
The results (e.g. mean, weighted mean difference, odds ratio, risk ratio or risk difference) obtained in a sample (a study or a meta-analysis) which are used as the best estimate of what is true for the relevant population from which the sample is taken.

 Population
The group of people being studied, usually by taking samples from that population. Populations may be defined by any characteristics e.g. geography, age group, certain diseases.

Positive association
See association.

Positive study
A term used to refer to a trial with results indicating a beneficial effect of the intervention being studied. The term can generate confusion because it can refer to both statistical significance and the direction of effect, studies often have multiple outcomes, the criteria for classifying studies as negative or positive are not always clear and, in the case of studies of risk or undesirable effects, "positive" studies are ones that show a harmful effect.

 Power
[In statistics:] The probability of rejecting the null hypothesis when a specific alternative hypothesis is true. The power of a hypothesis test is one minus the probability of Type II error.  In clinical trials, power is the probability that a trial will detect, as statistically significant, an intervention effect of a specified size. If a clinical trial had a power of 0.80 (or 80%), and assuming that the pre-specified treatment effect truly existed, then if the trial was repeated 100 times, it would find a statistically significant treatment effect in 80 of them.  Ideally we want a test to have high power, close to maximum of one (or 100%). For a given size of effect, studies with more participants have greater power. Studies with a given number of participants have more power to detect large effects than small effect.  (Also called statistical power.)

 Pragmatic trial
A trial that aims to test a treatment policy in a 'real life' situation, when many people may not receive all of the treatment, and may use other treatments as well.  This is as opposed to an explanatory trial, which is done under ideal conditions and is trying to determine whether a therapy has the ability to make a difference at all (i.e. testing its efficacy).

 Prevalence
The proportion of a population having a particular condition or characteristic: e.g. the percentage of people in a city with a particular disease, or who smoke.

Prevalence trial
A type of cross-sectional study that measures the prevalence of a characteristic.

 Primary outcome
The outcome of greatest importance.

 Primary study
‘Original research’ in which data are collected. The term primary study is sometimes used to distinguish it from a secondary study (re-analysis of previously collected data), meta-analysis, and other ways of combining studies (such as economic analysis and decision analysis). (Also called original study.)

 Probability distribution
The function that gives the probabilities that a variable equals each of a sequence of possible values. Examples include the binomial distribution, normal distribution and Poisson distribution. See also Distribution.

 Prospective study
In evaluations of the effects of healthcare interventions, a study in which people are identified according to current risk status or exposure, and followed forwards through time to observe outcome. Randomised controlled trials are always prospective studies. Cohort studies are commonly either prospective or retrospective, whereas case-control studies are usually retrospective. In Epidemiology, 'prospective study’ is sometimes misused as a synonym for cohort study. See also retrospective study.

Protocol
The plan or set of steps to be followed in a study. A Protocol for a systematic review should describe the rationale for the review, the objectives, and the methods that will be used to locate, select, and critically appraise studies, and to collect and analyse data from the included studies.

Publication bias
See reporting bias.

PubMed
A free access Internet version of MEDLINE also including records from before 1966 (old MEDLINE), some very recent records and some other life science journals.

 P-value
The probability (ranging from zero to one) that the results observed in a study (or results more extreme) could have occurred by chance if in reality the null hypothesis was true. In a meta-analysis, the P-value for the overall effect assesses the overall statistical significance of the difference between the intervention groups, whilst the P-value for the heterogeneity statistic assesses the statistical significance of differences between the effects observed in each study.

 

Q

Quality
A vague notion of the methodological strength of a study, sometimes indicating the extent of bias prevention.

Quality of evidence
A judgement about the extent to which we can be confident that an estimate of effect is correct. These judgements are made using the GRADE system, and are made for each important outcome. The judgements are based on the type of study design (randomised trials versus observational studies), five factors that can lower confidence in an estimate of effect (risk of bias, inconsistency of the results across studies, indirectness, imprecision of the overall estimate across studies, and publication bias), and three factors that can increase confidence (a large effect, a dose response relationship, and plausible confounding that would increase confidence in an estimate).

 Quasi-random allocation
Methods of allocating people to a trial that are not random, but were intended to produce similar groups when used to allocate participants. Quasi-random methods include: allocation by the person's date of birth, by the day of the week or month of the year, by a person's medical record number, or just allocating every alternate person. In practice, these methods of allocation are relatively easy to manipulate, introducing selection bias. See also random allocation, randomisation.

 

R

 Random allocation
A method that uses the play of chance to assign participantes to comparison groups in a trial, e.g. by using a random numbers table or a computer-generated random sequence.  Random allocation implies that each individual or unit being entered into a trial has the same chance of receiving each of the possible interventions. It also implies that the probability that an individual will receive a particular intervention is independent of the probability that any other individual will receive the same intervention. See also quasi-random allocation, randomisation.

 Random effects model
[In meta-analysis:] A statistical model in which both within-study sampling error (variance) and between-studies variation are included in the assessment of the uncertainty (confidence interval) of the results of a meta-analysis. See also fixed-effect model. When there is heterogeneity among the results of the included studies beyond chance, random-effects models will give wider confidence intervals than fixed-effect models.

Random error
Error due to the play of chance. Confidence intervals and P-values allow for the existence of random error, but not systematic errors (bias).

 Random permuted blocks
A method of randomisation that ensures that, at any point in a trial, roughly equal numbers of participants have been allocated to all the comparison groups. Permuted blocks are often used in combination with stratified randomisation. (Also called block randomisation.)

Random sample
A group of people selected for a study that is representative of the population of interest. This means that everyone in the population has an equal chance of being approached to participate in the survey, and the process is meant to ensure that a sample is as representative of the population as possible. It has less bias than a convenience sample: that is, a group that the researchers have more convenient access to. Randomised trials are rarely carried out on random samples.

Randomisation blinding

See concealment of allocation.

 Randomised controlled trial (RCT) (Synomym: randomised clinical trial)
An experiment in which two or more interventions, possibly including a control intervention or no intervention, are compared by being randomly allocated to participants. In most trials one intervention is assigned to each individual but sometimes assignment is to defined groups of individuals (for example, in a household) or interventions are assigned within individuals (for example, in different orders or to different parts of the body).

 Rate
The speed or frequency of occurrence of an event, usually expressed with respect to time. For instance, a mortality rate might be the number of deaths per year, per 100,000 people.

RCT
See randomised controlled trial.

 Regression analysis
A statistical modelling technique used to estimate or predict the influence of one or more independent variables on a dependent variable, e.g. the effect of age, sex, and educational level on the prevalence of a disease. Logistic regression and meta-regression are types of regression analysis. 

Relative Risk (RR) 
See risk ratio.

Relative risk reduction
The proportional reduction in risk in one treatment group compared to another.  It is one minus the risk ratio. If the risk ratio is 0.25, then the relative risk reduction is 1-0.25=0.75, or 75%.

Reliability
Refers to the degree to which results obtained by a measurement procedure can be replicated. Lack of reliability can arise from divergences between observers or measurement instruments, or instability in the attribute being measured.

 Reporting bias
A bias caused by only a subset of all the relevant data being available. The publication of research can depend on the nature and direction of the study results.  Studies in which an intervention is not found to be effective are sometimes not published. Because of this, systematic reviews that fail to include unpublished studies may overestimate the true effect of an intervention. In addition, a published report might present a biased set of results (e.g. only outcomes or sub-groups where a statistically significant difference was found. (Also called publication bias.)

 Retrospective trial
A study in which the outcomes have occurred to the participants before the study commenced. Case-control studies are usually retrospective, cohort studies sometimes are, randomised controlled trials never are.  See also prospective study.

 Review

  1. A systematic review.
  2. A review article in the medical literature which summarises a number of different studies and may draw conclusions about a particular intervention.Review articles are often not systematic.Review articles are also sometimes called overviews.
  3. To referee a paper.

 Risk
The proportion of participants experiencing the event of interest. Thus, if out of 100 participants the event (e.g. a stroke) is observed in 32, the risk is 0.32. The control group risk is the risk amongst the control group. The risk is sometimes referred to as the event rate, and the control group risk as the control event rate.  However, these latter terms confuse risk with rate. Statistical texts in particular are happy to discuss risk of beneficial effects as well as adverse events.

 Risk difference (RD) 
The difference in size of risk between two groups. For example, if one group has a 15% risk of contracting a particular disease, and the other has a 10% risk of getting the disease, the risk difference is five percentage points. (Also called absolute risk difference, absolute risk reduction.)

 Risk factor
An aspect of a person's condition, lifestyle or environment that increases the probability of occurrence of a disease. For example, cigarette smoking is a risk factor for lung cancer.

 Risk ratio
The ratio of risk in two groups. In intervention studies, it is the ratio of the risk in the intervention group to the risk in the control group. A risk ratio of one indicates no difference between comparison groups. For undesirable outcomes, a risk ratio that is less than one indicates that the intervention was effective in reducing the risk of that outcome. (Also called relative risk, RR.)

RR
See risk ratio.

Run-in period
A period before randomisation when participants are monitored but receive no treatment (or they sometimes all receive one of the study treatments, possibly in a blind fashion). The data from this stage of a trial are only occasionally of value but can serve a valuable role in screening out ineligible or non-compliant participants, in ensuring that participants are in a stable condition, and in providing baseline observations. A run-in period is sometimes called a washout period if treatments that participants were using before entering the trial are discontinued.

 

S

Safety
[of an intervention:] Refers to serious adverse effects, such as those that threaten life, require or prolong hospitalization, result in permanent disability, or cause birth defects. Indirect adverse effects, such as traffic accidents, violence, and damaging consequences of mood change, can also be serious.

Search strategy

  1. The methods used by a reviewer to identify trials. This includes handsearching relevant journals, searching electronic databases, contacting drug companies, other forms of personal contact and checking reference lists.
  2. The combination of terms used to identify studies in an electronic database such as MEDLINE.

Secondary outcome
An outcome used to evaluate additional effects of the intervention deemed a priori as being less important than the primary outcomes.

 Secondary study
A study of studies: a review of individual studies (each of which is called a primary study). A systematic review is a secondary study.

 Selection bias

  1. Systematic differences between comparison groups in prognosis or responsiveness to treatment. Random allocation with adequate concealment of allocation protects against selection bias. Other means of selecting who receives the intervention are more prone to bias because decisions may be related to prognosis or responsiveness to treatment.
  2. A systematic error in reviews due to how studies are selected for inclusion. Reporting bias is an example of this.
  3. A systematic difference in characteristics between those who are selected for study and those who are not. This affects external validity but not internal validity.

Sensitivity analysis
An analysis used to determine how sensitive the results of a trial or systematic review are to changes in how it was done. Sensitivity analyses are used to assess how robust the results are to uncertain decisions or assumptions about the data and the methods that were used.

Sequential trial
A randomised trial in which the data are analysed after each participant’s results become available, and the trial continues until a clear benefit is seen in favour of one of the comparison groups, or it is unlikely that any difference will emerge. The main advantage of sequential trials is that they are usually shorter than fixed size trials when there is a large difference in the effectiveness of the interventions being compared. Their use is restricted to conditions where the outcome of interest is known relatively quickly. In a group sequential trial, a limited number of interim analyses of the data are carried out at pre-specified times during recruitment and follow up, say 3-6 times in all.

Side effect
Any unintended effect of an intervention. Side effects are most commonly associated with pharmaceutical products, in which case they are related to the pharmacological properties of the drug at doses normally used for therapeutic purposes in humans. See also adverse effect.

Single blind
(Also called single masked). See blinding.

Single case report
See case study.

SMD
See Standardised mean difference.

 Standard deviation
A measure of the spread or dispersion of a set of observations, calculated as the average difference from the mean value in the sample.

Standard error
The standard deviation of the sampling distribution of a statistic. Measurements taken from a sample of the population will vary from sample to sample. The standard error is a measure of the variation in the sample statistic over all possible samples of the same size. The standard error decreases as the sample size increases. (Also called SE.)

Standard treatment
See conventional treatment.

 Standardised mean difference
The difference between two estimated means divided by an estimate of the standard deviation. It is used to combine results from studies using different ways of measuring the same concept, e.g. mental health. By expressing the effects as a standardised value, the results can be combined since they have no units.  Standardised mean differences are sometimes referred to as a d index. (Also called SMD.)

Statistical power
See power.

 Statistical significant
A result that is unlikely to have happened by chance. The usual threshold for this judgement is that the results, or more extreme results, would occur by chance with a probability of less than 0.05 if the null hypothesis was true. Statistical tests produce a p-value used to assess this.

Stratification
The process by which groups are separated into mutually exclusive sub-groups of the population that share a characteristic: e.g. age group, sex, or socioeconomic status. It is possible to compare these different strata to try and see if the effects of a treatment differ between the sub-groups. See also sub-group analysis.

 Stratified randomisation
A method used to ensure that equal numbers of participants with a characteristic thought to affect prognosis or response to the intervention will be allocated to each comparison group. For example, in a trial of women with breast cancer, it may be important to have similar numbers of pre-menopausal and post-menopausal women in each comparison group. Stratified randomisation could be used to allocate equal numbers of pre- and post-menopausal women to each treatment group. Stratified randomisation is performed by performing separate randomisation (often using random permuted blocks) for each strata. See also minimisation.

 Sub-group analysis
An analysis in which the intervention effect is evaluated in a defined subset of the participants in a trial, or in complementary subsets, such as by sex or in age categories. Trial sizes are generally too small for sub-group analyses to have adequate statistical power. Comparison of sub-groups should be by test of interaction rather than by comparison of p-values. Sub-group analyses are also subject to the multiple comparisons problem. See also multiple comparisons.

 Surrogate endpoints
Outcome measures that are not of direct practical importance but are believed to reflect outcomes that are important; for example, blood pressure is not directly important to patients but it is often used as an outcome in clinical trials because it is a risk factor for stroke and heart attacks. Surrogate endpoints are often physiological or biochemical markers that can be relatively quickly and easily measured, and that are taken as being predictive of important clinical outcomes. They are often used when observation of clinical outcomes requires long follow-up. (Also called intermediary outcomes, surrogate outcomes.)

Surrogate outcomes
See surrogate endpoints.

Survey
See cross-sectional study.

 Survival analysis
The analysis of data that measure the time to an event e.g. death, next episode of disease. See also time to event.

Sub-group analysis
An analysis in which the intervention effect is evaluated in a defined subset of the participants in a trial, or in complementary subsets, such as by sex or in age categories. Trial sizes are generally too small for sub-group analyses to have adequate statistical power. Comparison of sub-groups should be by test of interaction rather than by comparison of p-values. Sub-group analyses are also subject to the multiple comparisons problem. See also multiple comparisons.

Surrogate endpoints
Outcome measures that are not of direct practical importance but are believed to reflect outcomes that are important; for example, blood pressure is not directly important to patients but it is often used as an outcome in clinical trials because it is a risk factor for stroke and heart attacks. Surrogate endpoints are often physiological or biochemical markers that can be relatively quickly and easily measured, and that are taken as being predictive of important clinical outcomes.  They are often used when observation of clinical outcomes requires long follow-up.  (Also called intermediary outcomes, surrogate outcomes.)

Systematic error
See bias.

 Systematic review (synonym: systematic overview)
A review of a clearly formulated question that uses systematic and explicit methods to identify, select, and critically appraise relevant research, and to collect and analyse data from the studies that are included in the review. Statistical methods (meta-analysis) may or may not be used to analyse and summarise the results of the included studies. See also Cochrane Review.

 

T

Test of association
A statistical test to assess whether the value of one variable is associated (i.e. varies with) the value of another variable, or whether the presence or absence of a factor is more likely when a particular outcome is present. See also correlation.

 Time to event
A description of the data in studies where the analysis relates not just to whether an event occurs but also when. Such data are analysed using survival analysis. (Also called survival data.)

Tolerability
[of an intervention:] usually refers to medically less important (that is, without serious or permanent sequelae), but unpleasant adverse effects of drugs. These include symptoms such as dry mouth, tiredness, etc, that can affect a person’s quality of life and willingness to continue the treatment. As these adverse effects usually develop early on and are relatively frequent, randomised controlled trials may yield reliable data on their incidence.

Toxicity
The degree to which a medicine is poisonous. How much of a medicine can be taken before it has a toxic effect.

 Treatment
The process of intervening on people with the aim of enhancing health or life expectancy. Sometimes, and particularly in statistical texts, the word is used to cover all comparison groups, including placebo and no treatment arms of a controlled trial and even interventions designed to prevent bad outcomes in healthy people, rather than cure ill people. See also intervention, experimental intervention and control.

 Treatment effect
See estimate of effect.

Trend

  1. A consistent movement across ordered categories, e.g. a change in the effect observed in studies grouped according to, for instance, intensity of treatment.
  2. Used loosely to refer to an association or possible effect that is not statistically significant.  This usage should be avoided.

Trialist
Used to refer to a person conducting or publishing a controlled trial.

Type I error
A conclusion that a treatment works, when it actually does not work. The risk of a Type I error is often called alpha. In a statistical test, it describes the chance of rejecting the null hypothesis when it is in fact true. (Also called false positive.)

Type II error
A conclusion that there is no evidence that a treatment works, when it actually does work. The risk of a Type II error is often called beta. In a statistical test, it describes the chance of not rejecting the null hypothesis when it is in fact false. The risk of a Type II error decreases as the number of participants in a study increases. (Also called false negative.)

 

U

 Unconfounded comparison
A comparison between two treatment groups that will give an unbiased estimate of the effect of treatment due to the study design. For a comparison to be unconfounded, the two treatment groups must be treated identically, apart from the randomised treatment. For instance, to estimate the effect of heparin in acute stroke, a trial of heparin alone versus placebo would provide an unconfounded comparison. However, a trial of heparin alone versus aspirin alone provides a confounded comparison of the effect of heparin.

Uncontrolled trial
A clinical trial that has no control group.

 Unit of allocation
The unit that is assigned to the alternative interventions being investigated in a trial. Most commonly, the unit will be an individual person but, in a cluster randomised trial, groups of people will be assigned together to one or the other of the interventions. In some other trials, different parts of a person (such as the left or right eye) might be assigned to receive different interventions. See also unit of analysis error.

 Unit of analysis error
An error made in statistical analysis when the analysis does not take account of the unit of allocation. In some studies, the unit of allocation is not a person, but is instead a group of people, or parts of a person, such as eyes or teeth.  Sometimes the data from these studies are analysed as if people had been allocated individually. Using individuals as the unit of analysis when groups of people are allocated can result in overly narrow confidence intervals. In meta-analysis, it can result in studies receiving more weight than is appropriate.

 

V

 Validity
The degree to which a result (of a measurement or study) is likely to be true and free of bias (systematic errors). Validity has several other meanings, usually accompanied by a qualifying word or phrase; for example, in the context of measurement, expressions such as ‘construct validity’, ‘content validity’ and ‘criterion validity’ are used. See also external validity, internal validity.

 Variable
A factor that differs among and between groups of people. Variables include patient characteristics such as age, sex, and smoking, or measurements such as blood pressure or depression score. There can also be treatment or condition variables, e.g. in a childbirth study, the length of time someone was in labour, and outcome variables. The set of values of a variable in a population or sample is known as a distribution.

Variance
A measure of the variation shown by a set of observations, equal to the square of the standard deviation. It is defined as the sum of the squares of deviations from the mean, divided by the number of observations minus one.

 

W

Washout period
In a cross-over trial:] The stage after the first treatment is withdrawn, but before the second treatment is started. The washout period aims to allow time for any active effects of the first treatment to wear off before the new one gets started.

Weighted least squares regression
[In meta-analysis:] A meta-regression technique for estimating the parameters of a regression model, wherein each study's contribution to the sum of products of the measured variables (study characteristics) is weighted by the precision of that study's estimate of effect.

Weighted mean difference 
See mean difference.

WMD
See mean difference.