El protocol de recerca clínica/Metodologia

En aquesta secció del protocol d'investigació científica es presentarà com es contestarà la pregunta de recerca. És una secció tècnica que descriu les activitats, els mètodes, les dades i la lògica que s'utilitzarà per fer-hi front.

El principi rector per escriure aquesta secció és que ha de contenir suficient informació perquè el lector pugui determinar si la metodologia proposada te sentit i és la més adequada. Alguns fins i tot sostenen que una bona proposta ha de contenir els detalls suficients perquè un altre investigador qualificat pugui executar l'estudi. [1]

En aquest apartat es precís també demostrar que l'equip investigador no només coneix les metodologies proposades, sinó que també coneix els mètodes alternatius i que l'aproximació proposada és la més apropida i vàlida per fer front al problema d'investigació.[1]

Disseny de l'estudi[modifica]

Es descriurà:

  • En una frase, es citarà el tipus d'estudi epidemiològic utilitzat i la seva finalitat.

Exemple: «L'estudi EAGLE és un estudi de casos i controls de base poblacional que explora tot l'espectre de l'etiologia del càncer de pulmó, des de l'addicció al tabac fins al càncer mitjançant l'anàlisi de dades epidemiològiques, moleculars i clíniques» [2].

Exemple: «L'estudi CKiD és un estudi de cohort observacional i prospectiu de 540 nens que tenen malaltia renal crònica i seran reclutats durant un període de 24 mesos» [3].

  • Les raons per les quals s'ha escollit un disseny determinat.

Exemple: «Es va dissenyar un estudi gran de casos i controls de base poblacional per combinar un disseny més tradicional d'epidemiologia molecular amb un enfocament més integrador per investigar els efectes d'un procés dinàmic que comença amb l'inici del consum, continua amb la dependència i la persistència del tabaquisme, continua amb el desenvolupament del càncer de pulmó i finalitza amb la malaltia disseminada o la guarició i la supervivència» [2].

A continuació es útil resumir altres aspectes de l'estudi com, per exemple, les seves hipòtesis i com seran contrastades. El que es pretén, és que quedin reflectits de forma clara i resumida tots aquells punts que han condicionat el disseny de l'estudi, malgrat que alguns d'ells es desenvoluparan més endavant.

Àmbit[modifica]

Es descriurà on es realitzarà la recerca (p. ex., hospital, centre sociosanitari, centre d'atenció primària o comunitat), especificant aquelles característiques (p. ex, geogràfiques, demogràfiques, socials o culturals) que poden tenir una influència en la realització de la recerca o en la interpretació dels resultats. Si la recerca es realitzarà amb poblacions hospitalàries, es descriurà breument el tipus i característiques del centre i la grandària i característiques rellevants de la població que atent.

Població[modifica]

En la gran majoria d'estudis es poden diferenciar quatre tipus de poblacions (adaptat de [4] pàg. 186-88):

  • La població externa és el conjunt d'individus amb la característica estudiada (i sense aplicar cap restricció) i a la que idealment es vol generalitzar els resultats de l'estudi. Si els resultats de l'estudi es poden generalitzar a aquesta població, vol dir que presenta una bona validesa externa.
  • La població diana o objectiu és el conjunt d'individus d'interès sobre el que es vol realitzar una inferència estadística en relació a l'objectiu de l'estudi. Són, p. ex., els habitants d'una ciutat, els components d'una comunitat o els que tenen una ocupació determinada i que estan a risc d'emmalaltir o de presentar algun altre aspecte que es vol estudiar. Per tant es defineix segons les seves característiques clíniques i demogràfiques. Si l'estudi no és poblacional, sinó que es parteix dels malalts d'un determinat registre, com, p. ex., els malalts donats d'alta d'un determinat hospital, la població diana està formada per aquell conjunt d'individus que, si haguessin presentat la malaltia durant el període d'estudi, formarien part de l'estudi (o seria elegible per l'estudi, en el cas de que només es selecciona una mostra) ([5] pag 54). En aquest cas no sempre es pot determinar de forma clara quina és la població diana, ja que els hospital solen tractar malalt que no són de la seva àrea. A aquesta població diana també se l'ha denominat població base de l'estudi i és el grup a qui es podrà extrapolar directament els resultats de l'estudi. Si els resultats de l'estudi es poden aplicar a aquesta població diana (és a dir, la llei estadística trobada a l'estudi és vigent en aquesta població diana), vol dir que l'estudi té una bona validesa interna.
Exemples
Miettinen posa els següents exemples de població base ([5] pag 102):
− "Malalts donats d'alta de l'hospital X vius amb el diagnòstic d'infart agut de miocardi i seguits durant T temps".
− "La població de la ciutat de Barcelona entre els anys 2000 i 2005".
− "La població de tots els casos de mort sobtada d'origen cardíac diagnosticats a l'institució X en el període de temps entre T1 i T2" (per un estudi de sèrie de casos).
  • La població d'estudi (o mostrejada) és la formada per aquells individus de la població diana als que es pot accedir per realitzar l'estudi. Habitualment es selecciona (idealment de forma representativa) a un conjunt d'individus d'aquesta població (o mostra) per realitzar l'estudi. La població d'estudi és una mostra (no necessàriament representativa) de la població diana. Aquesta població es defineix en funció de:
    • Criteris d'inclusió a l'estudi.
    • Criteris d'exclusió.
  • La mostra és la part de la població d'estudi que realment ha participat a l'estudi, ja que habitualment no s'estudien tots els individus de la població d'estudi. La mostra es pot obtenir, p. ex., dels malalts ingressats en un o més hospitals en un període determinat, o a partir de les dades d'un cens municipal d'un determinat any. S'ha d'especificar el mostreig utilitzat, és a dir, com s'ha obtingut la mostra.

Exemple ([6] pàg. 113).

Un estudi realitzat a Barcelona vol determinar si l'obesitat s'associa a hipertensió arterial en els adults joves. Els investigadors utilitzen el darrer cens per obtenir el llistat de tots els adults joves de Barcelona. Fan un mostreig en base a aquest llistat per seleccionar els que s'estudien

Població externa: tots els adults joves.

Població diana: adults joves de Barcelona.

Població d'estudi: adults joves censats a la ciutat de Barcelona segons el darrer cents

Mostra: individus seleccionats de la població d'estudi

Cal descriure les tres darreres poblacions per l'estudi planificat. Es pot començar descrivint la població d'estudi, és a dir, aquella de la qual s'extraurà la mostra. Seguidament es definirà de forma operativa els criteris d'entrada que han de complir els individus per ser inclosos a l'estudi. A més a més, s'especificaran els criteris d'exclusió, si n'existeixen. Ha de justificar-se l'elecció dels subjectes o dels malalts en funció dels objectius proposats.

A continuació es descriurà la mostra que s'utilitzarà, especificant el seu origen (la població d'estudi). S'especificarà l'estratègia de mostreig i com seran seleccionats els subjectes. L'elecció d'una estratègia de mostreig adequada és essencial per garantir la validesa de l'estudi. Si es disposa d'estimacions de les característiques de la població d'estudi (per exemple, edat, sexe o nivell d'estudis) a través d'estudis preexistents, s'aportaran en aquest apartat.

Variables de l'estudi[modifica]

En aquest apartat i els següents, es farà una descripció detallada de quines dades s'obtindran dels participants, com s'obtindran i com es registraran. En la descripció de les dades que es recolliran s'especificarà:

  • Les variables que es recolliran per a cada individu. És clau identificar quina serà la variable dependent i quines seran les independents. Les variables de l'estudi es poden organitzar segons les següents categories conceptuals (modificat de [5] pàg. 88):
    • Informació administrativa. Incloent la identificació del persona(-es) i de qui recull la informació.
    • Criteris d'inclusió.
    • Variable dependent. És la variable d'interès, és a dir, aquell paràmetre que es vol estimar. Habitualment és única. En els estudis clínics o epidemiològics sol ser el resultat o desenllaç que es vol estudiar o explicar amb la recerca.
    • Variables independents. Són les que defineixen els diferents grups en què es mesurarà la variable dependent. Són aquells factors que poden influir en el valor de la variable dependent.
    • Variables de confusió o modificadores de l'efecte. Aquells altres factors de risc estudiats que poden estar associats amb l'exposició estudiada. S'ha de tenir cura en recollir tots aquells possibles factors de risc de la malaltia estudiada ja que, si estan distribuïts de forma desigual entre els grups a comparar, poden alterar l'associació entre la malaltia i l'exposició (poden ser factors de confusió).
    • Altres característiques que poden suggerir la generalització dels resultats.

Exemple. En l'estudi citat anteriorment de la profilaxi de la pneumònia per P. carinii [7]:

Variable dependent: desenvolupament d'una pneumònia per P. carinii.

Variable independent: nombre de limfòcits CD4 a l'entrar a l'estudi.

Factors de confusió: candidiasi oral, pèrdua de pes, febre, fatiga persistent, diarrea, herpes zòster i leucoplàsia.

Exemple. En l'estudi anterior sobre l'efectivitat de les teràpies antiretrovirals potents [8], les variables van ser:

Dependent: Van ser dos, la taxa d'incidència de sida i la taxa de mortalitat per sida.

Independent: El període: abans i després de 1995,5, ja que es pretenia estimar les taxes abans i després de l'any 1995,5 a fi d'avaluar si eren diferents.

Factors de confusió: Duració de la infecció i edat a la seroconversió (infecció pel VIH).

  • Justificació del perquè es recullen. Per cada una de les variables, s'ha de raonar que per assolir els objectis de l'estudi, cal recollir la variable.
  • Definició operativa de les variables. Cal diferenciar entre el concepte que pretén recollir la variable (p. ex., obesitat) i el criteri operacional (p, ex., índex de massa corporal igual o superior a 30). S'ha de proporcionar aquest criteri operatiu per cada uns dels conceptes que es vol mesurar.
  • Definició de la codificació (variables qualitatives) o les unitats de mesura (variables quantitatives).
Exemple
Sexe: 0 = Home, 1 = Dona

Es posarà una atenció especial en definir de forma operativa les variables claus de l'estudi. En els estudis observacionals analítics (cohort i de casos i controls), caldrà definir de forma mesurable allò que s'entén per malaltia i per exposició. No hauria d'iniciar-se un estudi si l'investigador no ha establert de forma concreta i operativa quins són els criteris diagnòstics de la malaltia i el criteris que s'utilitzaran per determinar si un participant està o no exposat al factor estudiat.

També es descriurà com es determinarà el valor de cada variable i com es minimitzarà la pèrdua d'informació en els perduts de vista (p. ex. «per a aquells participants perduts durant el seguiment, es determinarà si han presentat la sida consultant el registre de casos de sida»).

Per les variables de l'estudi, al hora de determinar quina informació es recull concretament, convé seguir les pautes següent (modificat de [5] pàg. 88-89):

  • Primària i no informació inferida. A partir de la variable primària es poden derivar secundàries, però a partir de les secundàries no es pot calcular la primària.
Exemples
— Registrar el pes i la talla en comptes del índex de massa corporal. Es pot calcular l'índex de massa corporal a partir del pes i la talla, però no es pot calcular el pes i la talla a partir de l'índex de massa corporal.
— Registrar la pressió arterial sistòlica i la diastòlica en lloc de hipertensió si o no.
— Recollir les dates de calendari en lloc dels dies després de, pe. ex., l'ingrés o la intervenció quirúrgica:
– Data de la complicació i no els dies en referència a, p. ex., la data d'ingrés del malalt a l'hospital o la data d'entrada a l'estudi.
– Data de la intervenció quirúrgica i no els dies en referència a, p. ex., la data d'ingrés del malalt a l'hospital.
– Data de defunció i no els dies o mesos després de, p. ex., haver entrat a l'estudi o haver iniciat el tractament.
— Registrar al data de naixement i la d'entrada del malalt a l'estudi o la data de revisió, en lloc de l'edat.
  • Detallada en lloc d'informació agregada. No es codificaran les variables quantitatives, sinó que es registrara el nombre tal com s'ha mesurat.
Exemples
— Registrar el nombre de cigarrets al dia (p. ex. 7), i no de 5-9 cigarrets al dia o "fumador / no fumador".
— Recollir la temperatura corporal en lloc de, p. ex., "febre".
  • Objectiva.
  • Necessaria per assolir els objectius de l'estudi. Un problema corrent és incloure moltes variables sobre aspectes que es creu que pot ser important analitzar, però que no són consistents amb els objectius de l'estudi i, en canvi, deixar fora variables importants per a la finalitat de l'estudi. A més a més, el fet d'augmentar el volum de variables a recollir i gestionar, pot fer que la qualitat de les dades disminueixi. Per tant, s'ha d'assegurar que totes les variables escollides són importants i que totes les importants s'han considerat.

Registre de les dades[modifica]

Un cop s'ha detallat quina informació es recollirà, s'han de presentar el disseny dels formularis (en paper o electrònics) on es registraran les dades i que s'han dissenyat específicament per l'estudi. Els formularis que es preveu utilitzar per registrar les dades es comentaran en aquesta secció i s'adjuntaran en un annex. Tanmateix, alguns investigadors preferiran presentar-los en l'apartat següent de Recollida de les dades.

Al hora de dissenyar els formularis, convé seguir les pautes següents ([5] pag 89):

  • Utilitzar formularis diferents per recollir els diferents aspectes o procediments de l'estudi. Així, p. ex., en l'Estudi de Cohort Multicèntric sobre sida es van dissenyar formularis per: [9]
    • Exploració física a la visita inicial.
    • Dades demogràfiques i psicològiques a la visita inicial.
    • Conducta, història mèdica i d'ús de serveis sanitaris a la visita inicial.
    • Exploració física a la visita 75.
    • Dades demogràfiques i psicològiques a la visita 75.
    • Conducta, història mèdica i d'ús de serveis sanitaris a la visita 75.
  • Els diferents elements dels formularis s'ordenaran seguin la seqüència del procés (p. ex., l'exploració física) a fi de que sigui fàcil d'emplenar.
  • S'ha de dissenyar a fi de que el formulari sigui fàcil d'omplir.
  • Probablement en moltes de les preguntes ha d'existir l'opció de "desconegut".

Recollida de les dades[modifica]

Una vegada definida la informació que es recollirà i presentats els qüestionaris que s'utilitzaran per registra-la, es descriuran els procediments de la recollida de les dades. S'especificarà qui, què, quan, com i a on es recolliran les dades. Les dades es solen obtenir amb (modificat de [10]):

  • Qüestionaris autocontestats.
  • Entrevistes cara a cara.
  • Exàmens mèdics.
  • Anàlisi de laboratori.
  • Procediments de cribratge.
  • Revisions de dades prèvies (per exemple, històries clíniques).

Per aquests mètodes de recollir les dades, cal diferenciar:

  • Procediments que és la descripció de com es durà a terme l'obtenció de les dades, quines activitats es realitzaran i com, a on, quan i qui realitzarà les mesures sobre els malalts i les mostres.
  • Instruments, que són els mitjans que s'utilitzen per recollir les dades, p. ex., aparell de mesurar la pressió arterial o la oxitocina. Si els qüestionaris no s'han presentat a l'apartat anterior de Registre de les dades, es presentaran ara.
  • Tècniques, que és la descripció de com s'utilitzaran els instruments. Si s'escau, es precisarà els aspectes següents de la tècnica per recollir las dades:
    • Qui la farà.
    • En quin moment.
    • En quin lloc.
    • Com es realitzarà.
    • Com es mantindrà la qualitat de les dades.
    • Com es mantindrà la confidencialitat de les dades.

Per cada un dels mètodes utilitzats per obtenir les dades, s'explicaran quests tres aspectes: els procediments, els instruments (inclosos els qüestionaris, si no s'ha fet en l'aparat anterior de Registre de les dades) i la tècnica.

Es valorarà la qualitat (sensibilitat, especificitat, validesa, repetibilitat i acceptabilitat) d'aquells instruments de mesurament proposats que siguin d'ús poc freqüent o complicat, des dels qüestionaris fins als mètodes de laboratori utilitzats. Pels qüestionaris generals (p. ex. els de les variables sociodemogràfiques), no cal justificar la seva fiabilitat. Però per a les variables que són difícils de mesurar (p. ex. la qualitat de vida, l'autoestima, la depressió o el nivell socioeconòmic), és millor utilitzar qüestionaris ja validats. En el cas que no sigui possible, s'ha d'incloure una descripció de com es van desenvolupar, les seves característiques i com es controlarà la qualitat de les mesures proporcionades.

Si l'estudi requereix anàlisis de mostres biològiques, es descriurà com es recolliran. Es pot incloure un apartat («Processament proves de laboratori») que descrigui com seran processades i on seran analitzades les mostres biològiques.

També es descriurà el lloc on es farà la recerca, el treball de camp i de quins recursos es disposaran (tant de temps de personal com de recursos materials) per realitzar el treball.

Si es tracta d'un estudi etiològic, ha d'especificar-se com es mesurarà l'exposició i la malaltia. Si es tracta d'un estudi clínic, hauran d'especificar-se amb tota precisió tots els procediments que es realitzaran amb els participants humans, i els mètodes previstos per a l'assistència i vigilància dels pacients.

Visites, entrevistes i examen mèdic[modifica]

Es descriurà com seran citats els pacients i que es farà a la vista. Per exemple, «a cada persona que entri a l'estudi, un psicòleg obtindrà informació demogràfica i sobre els patrons de consum en una entrevista cara a cara realitzada confidencialment i, un metge realitzarà una exploració física».

Exemple.[11]

Qüestionari: En base dels qüestionaris existents per NKRs i el qüestionari de la Enquesta Nacional de Salut i Nutrició de Corea (KNHANES) s'ha desenvolupat un qüestionari de salut amb 42 preguntes i que es compon de les següents sis àrees: 1) demogràfic i informació sobre migració 2) antecedents de malalties, 3) l'estat de salut mental, 4) estils de vida relacionats amb la salut, 5) la salut reproductiva de les dones, i 6) l'adaptació sociocultural:

Característiques demogràfiques: Sexe, edat, nivell d'educació a Corea del Nord, ocupació principal, tant a Corea del Nord com a la del Sud, estat civil, el nivell d'ingressos actual, zona de residència a Corea de Nord, el dia de sortida de Corea del Nord i d'arribada a Corea del Sud.

Antededents: Malalties diagnosticades per un metge.

Salut mental: Depressió, estres psicològic, intents de suïcide, idees de suïcidi.

Estils de vida relacionats amb la salut: Fumar, consum d'alcohol, exercici, seguiment de cribratge, la ingesta de suplements nutricionals.

Condicions específiques de les dones: Estat de la menstruació, historia d'embarassos i parts.

Examen mèdic bàsic que es realitzarà a tots els participants, es compondrà de mesures antropomètriques, mesura de la pressió arterial i de l'arteriosclerosi, determinacions bioquímiques, ecografia tiroïdal, i densitometria òssia:

Mesures antropomètriques: Alçada, pes, circumferència de la cintura, circumferència del maluc i l'anàlisi de la composició corporal.

Pressió arterial

Proves per l'aterosclerosi: Prova de velocitat d'ona del pols en ambdues artèries braquial i el turmell.

Determinacions bioquímiques: Hemograma complet, funció hepàtica i renal, glucosa, insulina, hormones tiroïdals, perfil lipídic, altres proves metabòliques.

Garantir la qualitat recollida dades[modifica]

Es presentaran els procediments que s'utilitzaran per garantir que es recullin i es registrin totes les dades correctament. En aquesta secció es descriurà com es realitzarà la formació i supervisió del personal que ha de recollir-les.

Si l'estudi és una enquesta o un estudi de seguiment, es descriuran els mètodes que s'utilitzaran per evitar les no respostes i els perduts de vista.

Gestió de les dades[modifica]

En aquest apartat s'especificarà el circuit que seguiran els formularis, on i qui els emmagatzemarà, i finalment com es realitzarà la seva mecanització per tal de preservar la validesa de la informació recollida i quins procediments s'utilitzaran per a l'edició i preparació de dades per a l'anàlisi. No s'ha d'oblidar descriure els mètodes que s'utilitzaran per garantir durant tot el procés la confidencialitat de les dades.

Si l'entrada de les dades es realitza manualment (fet cada vegada menys freqüent), independentment de si la realitza personal de l'equip investigador o una empresa externa, és convenient utilitzar el mètode de doble entrada validada. Per a això, pot utilitzar-se un programa informàtic a mida, o bé utilitzar paquets que incloguin aquesta opció. Si ho ha de fer una empresa externa, és convenient establir quin nivell d'error és inacceptable a l'entrada de les dades (pot convenir-se amb l'empresa externa, per exemple, que si almenys un 5% dels registres presenta algun error haurà de repetir-se l'entrada de dades). Finalment, s'especificarà com es procedirà davant dels errors detectats en el moment de la mecanització de les dades.

Si l'entrada de les dades és realitza mitjançat algun sistema electrònic, s'especificarà quin.

Exemple: "Totes les dades recollides de forma manual es van introduir en la bases de dades «Captura electrònica de dades per la investigació» (REDCap) allotjada a la Facultat de medicina de la Universitat de Carolina del [12]. REDCap proporciona una ubicació segura a Internet per a la recopilació de dades i un mitjà d'importació de dades addicionals i exportació de dades als programes estadístics.» [13]

Exemple: "Totes les dades recollides amb els qüestionaris seran introduïdes en un programari de gestió de base de dades (FileMaker Pro versió 10, FileMaker Inc Santa Clara, CA, EUA), dos investigadors independents realitzaran una doble entrada validada i s'exportaran al paquet estadístic PASW Statistics versió 20 (IBM Corporation, EUA)"[14]

Recomanacions per organitzar les dades[modifica]

Si no s'utilitza una entrada de dades validada, amb clau única (que impedeix entrar casos duplicats) i, a ser possible, amb doble entrada, convé tenir els registres primer en paper, abans de mecanitzar-los per poder seguir els possibles errors en casos duplicats. A més a més, si les dades s'entren directament en una base de dades o un full de càlcul, és molt fàcil que inadvertidament es premi una tecla i es canvi una de les dades entrada. Si la informació es te en paper, és fàcil corregir-lo.

Taula 1. Exemple de dades d'un estudi.
ID Data DNaix Sexe0h1d PAS
1 10-01-2013 01-01-2000 1 110,50
2 10-01-2013 09-09-1999 0 113,30
3 11-01-2013 06-02-2000 0 90,34
4 ... ... ... ...
... ... ... ... ...

Es sol dir que el 80% de l'esforç en l'anàlisi de les dades s'inverteix en arreglar i netejar de dades. Es pot disminuir aquest esforç si les dades estan ben "ordenades". Per aconseguir-lo, Hadley Wickham, professor d'estadística, ha presentat tot una sèrie de recomanacions [15]. A continuació es transcriuen algunes de les idees que presenta. Les dades d'un estudi en general es poden conceptualitzar com una taula rectangular, formada per files i columnes (Taula 1). Aquestes dades són una col·lecció de valors numèrics (si la variable és quantitativa) o caràcters (si és qualitativa). Els valors s'agrupen en les variables de l'estudi, que són mesures d'un sol atribut (p. ex., l'edat o el sexe d'un dels participants a l'estudi). Les diferents mesures (p. ex., l'edat, sexe i estat de salut) que es realitzen a la mateixa unitat d'anàlisi (habitualment l'individu) forment una observació. A fi de que les dades siguin ordenades, es recomana (adaptat de [15]):

  • Cada variable estarà en una única columna.
  • Cada columna només emmagatzemarà la informació d'una sola variable. És a dir, en cada columna només entrar un sol concepte. No col·locar dos conceptes en una mateixa columna (és a dir, en una mateixa variable).
  • Cada observació estarà en una sola fila. En general, cada observació o unitat d'anàlisi diferent (per exemple: cada malalt, cada mostra biològica) anirà en una fila única i diferent. És a dir, en les files hi estarà el malalt (o altra unitat d'anàlisi) i en les columnes les variables a analitzar.
  • En cada taula només s'emmagatzemaran les dades sobre una sola classe d'unitat experimental.
  • La capçalera de cada columna serà el nom de la variable, no un valor d'aquesta.
  • Tant les columnes com les files estaran etiquetades i l'etiqueta serà única.
    • L'etiqueta de les columnes serà el nom de la variable.
    • L'etiqueta de la fila serà la identificació de l'individu (o la identificació de l'individu i la identificació del nombre de mesura si aquest s'ha mesurat repetidament). Cada malalt ha de tenir un nombre d'identificació de l'estudi que sigui únic i que no se re-utilitzi si s'esborra (gens recomanable) el registre del malalt pel motiu que sigui. Ha de ser un nombre diferents al de la història clínica per si un mateix malalt contribueix amb més d'un episodi. Si un mateix malalt es visita repetidament, la identificació de la fila serà la variable amb nombre d'identificació del individuo juntament amb la variable amb el nombre d'identificació de la visita (p. ex., 1 per la visita primera, 2 per la segona i successivament).

Al hora de dissenyar l'estructura convé seguir aquestes altres recomanacions:

  • No incloure el nom del malalt en les dades.
  • Les dades estaran malalts a malalt (o altra unitat d'anàlisi). No agregades en estadístics com mitjanes, desviacions típiques o el nombre de casos de cada una de les categories d'una variable categòrica.
  • És preferible entrar la data de naixement i la data de revisió del malalt, en lloc d'entrar directament l'edat.
  • Els valors entrats seran en preferència números, no caràcters alfabètics. Per exemple: en lloc de codificar el sexe del malalt com a “H” o “D”, s'entrarà 1 o 2 o bé 0 o 1. Tanmateix, aquesta regla serà criticada per més d'un.
  • Les dades entrades en cada columna tindran totes les mateixes unitats. Per exemple, en una mateixa columna de l'edat no es barrejaren mesos o anys. O els mesos es transformaran en anys o els anys en mesos.
  • En cas que per algun malalt es desconeix el valor d'alguna variable s'entrarà un 9 o un -9 si aquests valors no són uns valors plausibles. Si els 9 o el -9 són valors plausibles, es pot utilitzar, per exemple -99 o -999 o un valor similar.
  • Entrar sempre dades del calendari, no “x” dies després de, p. ex., l'ingres, ja que, si després hi han errors i el malalt te més d'un episodi en dades diferents, és més complicat identificar quin és l'episodi erroni.
  • En el cas de mesures repetides (per exemple: estudi de cohort en què cada malalt es revisa o visita repetidament), cada “visita” o “revisió” anirà en una fila diferent. Tanmateix, aquesta regla general no sempre és aplicable, tal com es comenta aquí sota.
  • Amb certa freqüència l'investigador, a partir d'un base de dades seva, en genera repetidament subconjunts d'aquesta per analitzar les dades. Es important que:
    • El nom de les variables no canvii d'una versió a un altre.
    • Les variables incloses siguin sempre les mateixes o almenys, no s'esborrin en una versió posterior.
Si en cada nova versió de la base de dades es canvien els noms de les variables o s'elimine variables, els programes escrits per analitzar les dades s'han d'anar adaptat contínuament, dificultant el procés d'anàlisi i el fa més lent.

En cas especial de dades són les dels estudis en que el malalt és mesura més d'una vegada (p. ex., estudi de cohort en què cada malalt es revisa al entrar a l'estudi i posteriorment es visita repetidament). Aquest tipus de dades es poden organitzar "per individu" o "per visita" (o mesura). Tinguis en compte que en aquest context, "individu" es refereix a una unitat d'anàlisi, que no és sempre un individu. P. ex., en un estudi de casos i controls aparellats estudis la unitat d'anàlisi és sovint la parella de cas-control.

  • Per individu: les mesures de la mateixa característica, p. ex., de la pressió arterial, que es realitzen en les diferents visites s'introdueixen com a variables diferents en una mateixa observació. Per tant les diferents mesures de la pressió arterial estan en columnes diferents. Les mesures de les variables que no varien amb el temps com p. ex., el sexe, s'introdueixen una sola vegada en una columna única. Habitualment els paquets estadístics necessiten que les dades s'organitzin d'aquesta manera pels anàlisi de:
    • Prova de khi-quadrat de McNemar per dades aparellades.
    • Prova t per dades aparellades.
    • Correlació.
    • Anàlisi de mesures repetides amb el procediment "proc glm" del programa estadístic SAS.
  • Per visita (o mesura): les mesures repetides de la mateixa característica com és, p. ex., la pressió arterial, s'introdueixen com una única variable en múltiples observacions. Ha d'existir una variables que permeti identificar de forma única l'individu i la visita. Les variables que no varien en el temps (p. ex., el sexe), tindran el mateix valor per a totes les observacions del mateix individu. Habitualment els paquets estadístics necessiten que les dades s'organitzin d'aquesta manera per:
  • Anàlisi de mesures repetides utilitzant els procediments de SAS "proc mixed" o "proc glimmix"
  • Representar gràficament l'evolució en el temps del valor de la variable.

Segons el tipus d'anàlisi que es preveu realitzar, convindrà organitzar les dades per individu o per visita, però sovint caldrà canviar les dades d'un format a un altre.

Organització administrativa[modifica]

En estudis complexo, especialment els multicèntrics, en el protocol es descriurà l'organització administrativa, on s'especificarà, p. ex.: [16]

  • Centres col·laboradors i investigadors principals de cada centre.
  • Comitè executiu de l'estudi.
  • Grups de treball.
  • Reunions de l'estudi.
  • Per àries de responsabilitat, personal implicat, càrrecs i els temps que hi dediquen a l'estudi.
  • Política de viatges.
    • Despeses de viatges.
    • Programa de viatges.
  • Subministraments
    • Protocol d'adquisició de material.
    • Proveïdors de material d'oficina.
    • Compres de material.
  • Comunicacions externes i internes.

Sovint, aquests apartats s'inclou en un annex.

Aspectes estadístics[modifica]

Hipòtesis que es volen contrastar[modifica]

Es descriuran:

  • Les hipòtesis que seran contrastades en el moment de l'anàlisi.
  • Les proves estadístiques que s'utilitzaran per contrastar cada una de les hipòtesis plantejades.

Exemple: En l'estudi anterior de la profilaxi de la pneumònia per P. carinii [7], les hipòtesis fonamentals eren que els malalts que desenvolupaven una pneumònia en el decurs de la seva infecció pel VIH eren diferents que els que no la desenvolupaven en relació a les diferents variables independents (per exemple, nombre de CD4 o pèrdua de pes). Estadísticament això es traduïa en les hipòtesis nul·les següents: Les incidències acumulades estimades mitjançant el mètode de Kaplan-Meier eren les mateixes pels grups definits pel nombre de CD4 a l'entrar a l'estudi. La prova estadística que es va utilitzar va ser un log-rank, que compara diverses corbes de Kaplan-Meier.

Exemple: En l'estudi anterior sobre l'efectivitat de les teràpies antiretrovirals potents [8], les hipòtesis nul·les fonamentals van ser:

  • El risc relatiu de l'associació entre període i incidència de sida era d'1 després d'ajustar per duració de la infecció i edat de la seroconversió.
  • El risc relatiu de l'associació entre període i mortalitat per sida era d'1 després d'ajustar per duració de la infecció i edat de la seroconversió

La prova estadística que van utilitzar va ser la regressió de Cox.

Exemple: En un estudi sobre el tractament mèdic del AVC en malalts amb foramen oval permeable (FOP) on el desenllaç primari va ser accident vascular cerebral isquèmic recurrent o la defunció per qualsevol causa, les hipòtesis es presentaven [17]:

«La hipòtesi nul·la principal va ser que la presència o absència d'un FOP no afectava el temps fins a la recidiva del AVC o fins a la defunció per qualsevol causa en pacients tractats amb warfarina o aspirina. Les hipòtesis nul·la secundàries varen ser que la mida de FOP o el grau de derivació tampoc influïa el temps fins a la recidiva del AVC o fins a la defunció, que el tractament amb warfarina o aspirina no afectaven diferencialment el temps fins al desenllaç primari, que la presència d'un FOP tampoc afectaven en el temps fins al desenllaç primari o el temps finms atac isquèmic transitori (AIT), i que la presència d'aneurisma del sèptum auricular no va modificar el risc d'accident cerebrovascular isquèmic recurrent o mort associat amb FOP.»

Mida de la mostra[modifica]

Es realitzarà una estimació de la mida de la mostra necessària per rebutjar la hipòtesi nul·la en funció dels resultats esperats i amb un determinat nivell de confiança o de significació. Cal tenir en compte que una part dels individus de la mostra no acabaran l'estudi per diverses raons com, p. ex., no voler continuar l'estudi, pèrdua de la informació, defunció per alguna causa no relacionada amb la qüestió estudiada o canvis de domicili. Per tant, a la mida de la mostra si li haurà de sumar un determinat percentatge que compensi els possibles perduts de vista.

Per estimar la mida de la mostra, es pot utilitzar la Calculadora de Grandària Mostral GRANMO o OpenEpi, que permeten estimar la mida per alguns dels dissenys més freqüents (p. ex. estimació d'una proporció, estudi de casos i controls no aparellats o un assaig clínic).

Exemple: Estudi sobre l'eficàcia d'un programa de prevenció del tabaquisme en adolescents. Es volia comparar el % de fumadors en un grup intervenció amb el d'un grup control [18]: «En base als resultats d'estudis previs als EUA, s'espera una diferència del 10% en les taxes d'inici del consum entre el grup d'intervenció i el control. S'assumeix [...] una potència estadística de 0,80. La hipòtesi principal es posarà a prova amb un nivell de significació global de dos cues de 0,05. Es va utilitzar el paquet estadístic Stata per calcular la mida de la mostra per a la comparació de dues proporcions. Basant-se en les dades EUA i la prevalença del tabaquisme en 12 a 14 anys [...], que és al voltant del 30%, es necessitarien 428 nens de cada grup».

Exemple: Es va realitzar el càlcul de la grandària de mostra (sobre la base dels resultats de la literatura anterior) per estimar la quantitat de participants que es necessitarien a fi de que el resultat primari fos estadísticament i clínicament i / o políticament significatiu. Per el resultat primari específic del greix al fetge i la microbiota, en base al nostre estudi de camp, amb 34 subjectes en cada grup es tindria una potència del 85% per a la comparació de mitjanes del greix en el fetge entre els grups. S'ha augmentat la mida simple de 50 en cada grup establert un nivell de significació de 0,05 i s'ha suposat que es realitzarien 10 comparacions de mitjanes amb la correcció de Bonferroni entre els grups. S'ha Tenint en compte les comparacions en l'anàlisi multivariable. També s'ha tingut en compte el compliment i les pèrdues (15%), per estimar el nombre total de participants necessaris per complir amb cada objectiu específic.[14]

En ocasions es requerirà realitzar un càlcul mostral per a cada objectiu.

En el cas que la mida de la mostra estigui, per les raons que sigui, predeterminada, es calcularà la potència estadística que es tindrà amb aquesta grandària. Sempre que sigui possible, es calcularà quina potència presenta l'estudi per a diferents hipotètics resultats.

Exemple: La mortalitat als 6 mesos dels malalts amb una determinada neoplàsia era del 35%. Estudis preliminars amb un nou enfocament terapèutic suggerien que la mortalitat podia reduir-se al 20%. Es vol realitzar un assaig clínic per comparar el nou tractament amb el vell. El nombre de malalts de què es podria disposar era de 100 per grup. La hipòtesi nul·la era que els dos tractaments eren igualment eficaços. Si es vol rebutjar aquesta hipòtesi nul·la amb una prova de comparació de dues proporcions, la potència de l'estudi, amb 100 malalts per grup, es pot calcular amb les fórmules proporcionades en els llibres d'estadística. Els resultats es presenten en la taula següent. Com que és poc versemblant que en l'assaig clínic que es realitzarà el % de malalts morts als 6 mesos siguin exactament de 35% pel grup control i de 20% pel grup tractat amb el nou enfocament terapèutic, es calcula la potència sota diferents supòsits de la supervivència.

Potència d'un estudi en el qual es comparen dues proporcions amb 100 malalts per grup. La taula presenta els diferents valors de la potència de l'estudi per diferents valors de p0 (en l'exemple actual, proporció de morts amb l'enfocament terapèutic clàssic) i p1 (en l'exemple actual, proporció de morts amb l'enfocament terapèutic nou). Així, si la diferència entre la proporció de mortalitat entre el tractament nou i el vell serà de 0,25 -- 0,40, la potència que es tindrà serà del 98,9%
p0=0,30 p0=0,35 p0=0,40
p1=0,15 72,2% 91,0% 98,1%
p1=0,20 37,1% 66,3% 87,6%
p1=0,25 78,6% 94,0% 98,9%

Pla d'anàlisis[modifica]

Es presentarà com seran analitzades les dades i els mètodes estadístics que s'utilitzaran. Es justificaran els mètodes en funció de les dades que es maneguin (p. ex., independents o correlacionades), el tipus de variable dependent (p. ex., quantitativa, qualitativa o qualitativa ordinal), i el de les variables independents. Si l'estudi té finalitat etiològica, es descriuran les hipòtesis que seran provades a l'anàlisi i, per a cada hipòtesi, es descriuran els mètodes estadístics adequats.

Exemple: «L'avaluació de l'efecte de les principals variables independents de l'estudi sobre el temps fins al primer consum de tabac es realitzarà amb els mètodes d'anàlisi de supervivència» [18].

Un exemple més complert es pot trobar a [14]. Si es vol ser més concret, aquest apartat es pot dividir en 4 subapartats:

  • Descriptiva dels individus de la mostra estudiada.

Exemple: «Es realitzarà l'estadística descriptiva per a les mesures dels resultats [variables dependents], les característiques basals i les mesures clíniques utilitzant mitjanes (i desviacions típiques) o percentatges i intervals de confiança del 95% de fiabilitat en cada visita i per a tots els malalts de cada grup» [19].

Exemple: «S'identificaran les característiques basals de salut dels subjectes a partir d'una anàlisi descriptiva del qüestionari i l'examen mèdic. És descriuran la majoria de les variables mesurades amb el qüestionari en funció del sexe i dels grups d'edat. Amb els resultats de l'examen mèdic s'estimarà el valor mitjà de les mesures numèriques i la prevalença de les malalties diagnosticades com la hipertensió, diabetis, dislipidèmia, obesitat i síndrome metabòlica. Aquestes variables es descriuran amb un número (%) o una mitjana (i desviació estàndard).[11]»

  • Associació bivariada entre la variable dependent i les independents.

Exemple: «Per a la comparació dels grups, s'utilitzarà la t-Student o la U de Mann-Whitney per dades independents per a les variables quantitatives contínues i la prova de khi quadrat o la prova exacta de Fisher per variables qualitatives» [19].

Exemple: Es compararan les característiques incials dels dos grups amb les proves de khi quadrat (per a les variables categòriques), t de Student (per a variables contínues) i U de Mann-Whitney i (per a les que no presentin una distribució normal).

Exemple: Per a la comparació dels grups, en el cas de variables qualitatives, s'utilitzarà la prova de de khi-quadrat de Pearson amb la correcció per continuïtat per a taules 2x2. Si les freqüències esperades són menors que 5, s'utilitzarà l'estadístic exacte de Fisher. Per comparar els valor de les variables quantitatives de dos grups, s'utilitzarà la prova t de Student, verificant prèviament la hipòtesi d'homogeneïtat de les variàncies mitjançant la prova de Levene. La comparació de variables quantitatives entre més de dos grups es realitzarà mitjançant models ANOVA d'un factor o proves no paramètriques (Kruskal-Wallis) per a aquelles variables que no segueixin una distribució normal [20].

  • Identificar els factors de confusió o els modificadors de l'efecte (interacció): Anàlisi estratificat: associació entre la variable dependent i les independents, estratificant per les variables de confusió.
  • Associació independent (és a dir, ajustada pels factors de confusió) entre els possibles factors de risc i la variable dependent: anàlisi de regressió.

Exemple: «S'utilitzarà un model de regressió de Cox multi-nivell per avaluar l'associació entre la variable independent principal, els factors pronòstics i el temps entre l'inici de l'episodi de dolor lumbar i la millora o la reincorporació a la feina» [19].

Exemple: «S'utilitzarà un model de regressió logística per avaluar com la intervenció està relacionada amb la susceptibilitat al tabaquisme en els nens abstinents a l'inici» [18].

Tractament de les no respostes[modifica]

Es descriurà com es procedirà enfront a les persones que rebutgen entrar a l'estudi i amb aquells valors desconeguts de les persones que sí han acceptat entrar a l'estudi, però que, per alguna raó, es desconeix el valor d'alguna variable.

Preguntes que han de contestar-se en aquest apartat[modifica]

  • La metodologia proposada és adequada per contestar la pregunta plantejada.
  • A quina població es vol extrapolar els resultats.
  • Perquè és adequada la població diana escollida.
  • Quin tipus de disseny s'utilitzarà.
  • On es durà a terme la investigació.
  • Com es seleccionarà i reclutarà la mostra. Quin mètode de mostreig s'utilitzarà.
  • Quantes persones s'han d'estudiar o quantes històries clíniques s'han de revisar.
  • Quin tipus de dades es recollirà.
  • Com i quan es recolliran les dades.
  • Com s'emmagatzemaran les dades i com es mantindrà es seu anonimat i confidencialitat.
  • Com s'analitzaran les dades.
  • Quina es la funció de cada un dels membres del grup d'investigació.

Bibliografia[modifica]

  1. 1,0 1,1 Wong PTP. How to Write a Research Proposal (consultat 05-03-2013).
  2. 2,0 2,1 Landi MT, Consonni D, Rotunno M et al. Environment And Genetics in Lung cancer Etiology (EAGLE) study: an integrative population-based case-control study of lung cancer. BMC Public Health 2008; 8:203
  3. Furth SL, Cole SR, Moxey-Mims M et al. Design and Methods of the Chronic Kidney Disease in Children (CKiD) Prospective Cohort Study. Clin J Am Soc Nephrol 2006; 1: 1006-15
  4. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiology research. Belmont, CA: Lifetime Learning Publications, 1982
  5. 5,0 5,1 5,2 5,3 5,4 Miettinen OS. Theoretical epidemiology: Principles of occurrence research in medicine. New-York: John Wiley & Sons, 1985.
  6. Kleinbaum DG, Sullivan KM, Barker ND. Pocket Guide to Epidemiology. New York: Springer 2007
  7. 7,0 7,1 Phair J, Munoz A, Detels R. The risk of Pneumocystis carinii pneumonia among men infected with human immunodeficiency virus type 1. N Engl J Med 1990; 322: 161-5
  8. 8,0 8,1 Detels R, Munoz A, McFarlane G et al. Effectiveness of potent antiretroviral therapy on time to AIDS and death in men with known HIV infection duration. JAMA 1998; 280: 1497-1503
  9. MACS Forms (consultat 08-03-2013)
  10. Betkerur J. Guidelines for writing a research project synopsis or protocol. Indian J Dermatol Venereol Leprol; 2008; 74: 687-90
  11. 11,0 11,1 Lee YH, Lee WJ, Kim YJ, Cho MJ, Kim JH, Lee YJ, Kim HY, Choi DS, Kim SG, Robinson C. North Korean refugee health in South Korea (NORNS) study: study design and methods. BMC Public Health 2012; 12: 172
  12. Harris PA, Taylor R, Thielke R et al. Research electronic data capture (REDCap)--a metadata-driven methodology and workflow process for providing translational research informatics support. J Biomed Inform 2009; 42: 377-381
  13. Lehtinen SJ, Onicescu G, Kuhn KM et al. Normothermia to prevent surgical site infections after gastrointestinal surgery: holy grail or false idol? Ann Surg 2010; 252: 696-704
  14. 14,0 14,1 14,2 Liu WY, Lu da J, Du XM et al. Effect of aerobic exercise and low carbohydrate diet on pre-diabetic non-alcoholic fatty liver disease in postmenopausal women and middle aged men – the role of gut microbiota composition: study protocol for the AELC randomized controlled trial. BMC Public Health. 2014 Jan 17;14(1):48. doi: 10.1186/1471-2458-14-48
  15. 15,0 15,1 Wickham H. Tidy data. The American Statistician, Submitted
  16. Roca J. Cómo y para qué hacer un protocolo. Med Clin (Barc); 1996; 105: 257-262
  17. Homma S, Sacco RL, Di Tullio MR et al. Effect of medical treatment in stroke patients with patent foramen ovale: patent foramen ovale in Cryptogenic Stroke Study. Circulation 2002; 105: 2625-2631
  18. 18,0 18,1 18,2 Hiemstra M, Ringlever L, Otten R, et al. Efficacy of smoking prevention program 'Smoke-free Kids': study protocol of a randomized controlled trial. BMC Public Health 2009; 9: 477 Error de citació: Etiqueta <ref> no vàlida; el nom «Hiemstra2009» està definit diverses vegades amb contingut diferent.
  19. 19,0 19,1 19,2 Rodriguez-Blanco T, Fernandez-San-Martin I, Balague-Corbella M, et al. Study protocol of effectiveness of a biopsychosocial multidisciplinary intervention in the evolution of non-specific sub-acute low back pain in the working population: cluster randomised trial. BMC Health Serv Res 2010; 10: 12
  20. D'una sol·licitud de beca FISS del 2012


Enllaços externs[modifica]