Statistisk hypotesetesting

Statistisk hypotesetesting er en metode til å trekke slutninger fra usikre data slik at en kan beregne graden av usikkerhet i konklusjonen. (...)

Statisitisk hypotesetesting baserer seg på beregning av en bestemt sannsynlighet (kalt signifikanssansynligheten eller P-verdien). (Innføring i statistikk - med medisinske eksempler. Oslo: Ad Notam Gyldendal, 1998)

Ikke tro på relative risikoer og odds ratior i abstrakter (BMJ 2006;333 (29 July))

Lesere vær på vakt

Ikke tro alt du leser. Det er budskapet i flere artikler i denne ukes BMJ. (Don't believe everything you read. That's the message from several articles in this week's BMJ.) (BMJ 2007;334 (14 April))

- Absolutt usant og relativt sant om risikoreduksjon

Absolutt usant og relativt sant om risikoreduksjon
Tidsskr Nor Lægeforen 2003; 123:78-9 (1-9 januar)
Legemidlers effektivitet og deres bivirkninger kan beskrives ved hjelp av risikotall. Inntrykket som dannes avhenger av hvilke risikotall som brukes. I denne kommentaren problematiseres bruken av slike tall i legemiddelreklame, og det reises spørsmål om hva som er å forstå som uriktige, misvisende og villedende opplysninger i denne sammenhengen.

Osteoporotiske brudd er et stort helseproblem – og et større problem i Norge enn i mange andre land (1). Det er derfor svært ønskelig med tiltak som reduserer forekomsten av brudd. For å imøtekomme dette ønsket er det i de senere år utviklet flere legemidler. Lanseringen av Fosamax vakte i sin tid debatt, en debatt som endog endte i rettssalen (2). Nylig kom en reklamebrosjyre om et annet medikament oss i hende, nemlig Evista (raloxifen). Budskapet i brosjyren får oss til å undres over hvilke lærdommer firmaet Lilly har trukket av Fosamax-saken.

Relative og absolutte sannheter i medisinen
Bruk av risikotall står sentralt i beskrivelsen av enkelte legemidlers effektivitet. Den kan fremstilles som henholdsvis relativ risikoreduksjon, absolutt risikoreduksjon eller antall som må behandles (NNT). Svarene som gis gjennom de ulike effektmålene er forskjellige, men har det til felles at de alle er sanne (3). Sannhet og løgn er imidlertid relative begreper, og det har lenge vært kjent at det er mulig å forlede med statistikk uten å snakke direkte usant (4). Inntrykkene som dannes ut fra de ulike effektmålene er forskjellige, og effektiviteten oppfattes gjennomgående som størst når den fremstilles som relativ risikoreduksjon (5). Det er derfor neppe tilfeldig at dette effektmålet benyttes hyppig i legemiddelreklame (6) og medieomtale av legemidlers risikoreduserende effekt (7). En slik beskrivelse er metodologisk sett korrekt, men egnet til å forlede. Dette fordi relativ risikoreduksjon ikke sier noe om utgangsrisikoen for sykdom (8). Følgelig er det også tatt til orde for at den absolutte risikoreduksjonen må vurderes før det fattes en beslutning om intervensjon mot osteoporose (9). Ensidig bruk av relativ risikoreduksjon som effektmål var da også noe det ble reagert på i beskrivelsen av effektiviteten ved Fosamax-behandling (10). (...)

(Anm: Forskning og ressurser (mintankesmie.no).)

(Anm: Hvordan lese/fortolke en medisinsk artikkel (statistiske resultater) (mintankesmie.no).)

(Anm: Arvelig uføretrygd? Forskning: Medier må være mer edruelige i sin omgang med forskningsresultater. (aftenposten.no 9.7.2013).)

(Anm: How statistics can be misleading - Mark Liddell (ed.ted.com).)

- Ikke tro på relative risikoer og oddsratior i abstrakter

Dont believe the relative risks and odds ratios in abstracts (Ikke tro på relative risikoer og odds ratior i abstrakter)
BMJ 2006;333 (29 July)
Significant P values for relative risks and odds ratios in abstracts of published studies should generally be disbelieved, says Gøtzsche on page 231. He compared the distribution of P values in abstracts of 260 randomised trials with that in 260 observational studies (130 cohort studies and 130 case control studies) and checked P values between 0.04 and 0.06. A high proportion of abstracts of randomised controlled trials and observational studies had significant results, although many of these results were derived from subgroup analyses or biased selection of results. Also, errors in analysis and reporting were common.

(Anm: Believability of relative risks and odds ratios in abstracts: cross sectional study. BMJ 2006 333: 231-234.)

(Anm: odds ratio; OR, forholdet mellom to odds. En odds er sannsynligheten for at en gitt hendelse skal inntreffe i forhold til sannsynligheten for at den ikke skal inntreffe. Hvis man i en vitenskapelig studie f.eks. finner at 20 av 100 personer som er blitt utsatt for et giftstoff får en viss sykdom, sier man at oddsen er 20/80 = 0,25. I en kontrollgruppe på 100 personer som ikke er blitt utsatt for giftstoffet, blir 10 syke. Da er oddsen 10/90 = 0,11. Odds ratio, forholdet mellom de to oddsene, er da 0,25/0,11 = 2,25.For sykdommer med sjelden forekomst kan odds ratio benyttes som en tilnærming til relativ risiko. Kilde: Store norske leksikon.)

(Anm: Medisinske tidsskrifter og uavhengighet etc. (mintankesmie.no).)

- Forskere kan skille årsak fra statistisk sammenheng

Forskere kan skille årsak fra statistisk sammenheng
aftenposten.no 26.6.2014
Uviten Simen Gaure, forsker ved Frisch-senteret

Selv om det kan være vanskelig å skille årsak fra statistisk sammenheng har forskerne verktøyene til å gjøre det.

Vi kan gjøre mer med statistikk enn å vise at to tall beveger seg i takt, vi kan også forklare hvorfor de gjør det.  (…)

Kausalitet
La meg kort bemerke at statistikk som fag er delt i to, deskriptiv statistikk, som handler om å beskrive data med begreper som gjennomsnitt og standardavvik. Dernest er det statistisk inferens, som handler om hvor sikre konklusjoner man kan trekke om fenomener som har et innslag av tilfeldighet, for eksempel fordi man ikke måler helt nøyaktig eller ikke har tilgang til all informasjon, slikt som valgdagsmålinger og klimaberegninger.

En viktig del av praktisk statistisk inferens er kausal inferens, å skille statistisk sammenheng fra årsak. Det ville jo ikke være riktig klokt å prøve å få fuglene til å pare seg i november i håp om at dét skal få russen til å lese til tentamen. Eller omvendt.

Så hvordan kan man gjøre kausal inferens? Vi ser på et tenkt eksempel, si vi skal prøve å finne ut om røyking øker sannsynligheten for lungekreft. Vi vil ikke gjøre medisinske eksperimenter på mennesker, men vi er en eller annen type samfunnsforskere som bruker statistiske metoder på innsamlede data. Da er det et problem med å telle opp lungekreft og røykere og se om det er en korrelasjon, altså statistisk sammenheng, for det kan for eksempel tenkes at folk med begynnende lungekreft begynner å røyke fordi de føler seg bedre av det. Det vil gi en korrelasjon, uten at den nødvendigvis skyldes at røyking er årsak til lungekreft.

Hvis vi nå er heldige har myndighetene økt tobakksavgiften, men forskjellig fra kommune til kommune, etter mynt og kron-metoden. Hvis vi påviser at økning av tobakksavgiften sammenfaller med nedgang i lungekreft er vi et stykke på vei. Avgiften har jo neppe noen direkte virkning på lungene til folk, og ingenting har noen virkning på avgiften som jo er tilfeldig innført. Så effekten går antageligvis via at folk røyker mindre når det blir dyrere. (…)

- Sammenlikninger innen randomiserte grupper kan være svært misvisende

Comparisons within randomised groups can be very misleading (Sammenlikninger innen randomiserte grupper kan være svært misvisende)
BMJ 2011; 342:d561 (6 May)
When we randomise trial participants into two or more intervention groups, we do this to remove bias; the groups will, on average, be comparable in every respect except the treatment which they receive. Provided the trial is well conducted, without other sources of bias, any difference in the outcome of the groups can then reasonably be attributed to the different interventions received. In a previous note we discussed the analysis of those trials in which the primary outcome measure is also measured at baseline. We discussed several valid analyses, observing that “analysis of covariance” (a regression method) is the method of choice.1 (...)

(Anm: Uredelighet og fusk (juks/forskningsjuks) i medisinsk forskning. (mintankesmie.no).)

- Hvorfor oversiktsartikler om helseeffekter ved passiv røyking kommer frem til forskjellige konklusjoner

Why Review Articles on the Health Effects of Passive Smoking Reach Different Conclusions (Hvorfor oversiktsartikler om helseeffekter ved passiv røyking kommer frem til forskjellige konklusjoner)
JAMA. 1998;279(19):1566-1570 (May 7)
(...) den eneste faktor som påvirket konklusjonen om at passiv røyking var ufarlig var hvorvidt forfatterne hadde tilknytninger til tobakksindustrien (odds ratio, 88,4; 95% konfidensintervall, 16,4-476,5, p*0.001).”

(Anm: Dette innebærer at middelverdien for odds-ratio er 88,4, at intervallet ligger mellon 16,4 og 476,5, dvs. man kan være mer enn 95% sikker på at dette intervallet inneholder den virkelige middelverdien i den gruppen som er gransket.)

Statistisk hypotesetesting, p-verdier, konfidensintervaller, standarddeviasjon, type I og type II-feil, og odds-ratio

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

(Anm: p-verdier; sannsynligheten for at funnene i en vitenskapelig studie ved slump skal ha blitt slik de er dersom nullhypotesen er sann; eller noe enklere og mer unøyaktig uttrykt: Sannsynligheten for at funnene i en vitenskapelig studie skal ha kunnet oppstå ved slump. Begrepet er nær knyttet til hypotesetesting som del av hypotetisk-deduktiv forskningsmetode. Se også statistisk signifikans. Kilde: Store norske leksikon.)

- Store navn på statistikk ønsker å ruske opp i svært skadelig P-verdi. En av forskernes favoritter innen statistikk - P-verdien – bør står overfor tøffere standarder, sier ledende forskere.

(Anm: Big names in statistics want to shake up much-maligned P value. One of scientists’ favourite statistics — the P value — should face tougher standards, say leading researchers. (nature.com (26 July 2017)).)

- Feilfortolkninger av "p-verdi": en kort ABC for faglig idrettsmedisin. (- Imidlertid ville man ikke endre sin beslutning om å kjøpe et lodd i lotteriet hvis sjansen for å vinne var 4,9 % (p = 0,049) i stedet for 5,1 % (p = 0,051).)

(Anm: Editorial. Misinterpretations of the ‘p value’: a brief primer for academic sports medicine. Introduction When comparing treatment groups, the p value is a statistical measure that summarises the chance (‘p’ for probability) that one would obtain the observed result (or more extreme), if and only if, the treatment is ineffective (ie, under the assumption of the ‘null’ hypothesis). The p value does not tell us the probability that the null hypothesis is true.1 This editorial discusses how some common misinterpretations of the p value may impact sports medicine research. Although presented from a treatment standpoint, the same principles hold for causes or prevention. Probabilities do not translate into yes or no decisions p Values are probabilities, yet often interpreted based on a categorical cut-off, generally at the level of 0.05 (ie, 5%). Anything below is considered a ‘statistically significant difference’ and vice versa. However, one would not change a decision to buy a lottery ticket if the chance of winning was 4.9% (p=0.049i) instead of 5.1% (p=0.051). Consider a study where 100 participants who were given an injury prevention programme had six injuries, and 100 participants in the control group had 13 injuries (p=0.091). If the prevention group had one fewer injury (ie, 5/100 injuries), the results become statistically significant (p=0.048). Is it appropriate to conclude the treatment is ineffective when a single injury changes the results from non-significant to significant? Using a cut-off converts a continuous variable (the probability) into a categorical variable (yes/no). Presenting actual p values rather than simply >0.05 or <0.05 may help readers understand that any cut-off is arbitrary. Misinterpretations of the ‘p value’: a brief primer for academic sports medicine. Br J Sports Med 2017;51:1176-1177.)

- Vitenskapelig metode: Statistiske feil. P-verdier, "gullstandarden" av statistisk gyldighet, er ikke like pålitelige som mange forskere antar.

(Anm: Scientific method: Statistical errors. P values, the 'gold standard' of statistical validity, are not as reliable as many scientists assume. For a brief moment in 2010, Matt Motyl was on the brink of scientific glory: he had discovered that extremists quite literally see the world in black and white. The results were “plain as day”, recalls Motyl, a psychology PhD student at the University of Virginia in Charlottesville. Data from a study of nearly 2,000 people seemed to show that political moderates saw shades of grey more accurately than did either left-wing or right-wing extremists. “The hypothesis was sexy,” he says, “and the data provided clear support.” The P value, a common index for the strength of evidence, was 0.01 — usually interpreted as 'very significant'. Publication in a high-impact journal seemed within Motyl's grasp. (nature.com (12 February 2014).)

(Anm: Statistikk og helseregistre (helsedata) (mintankesmie.no).)

Statistical Question
P values or confidence intervals?

BMJ 2013;346:f3212 (17 May 2013)
The effectiveness of topical chloramphenicol in preventing wound infection after minor dermatological surgery was evaluated. Researchers performed a randomised placebo controlled double blind superiority trial. The intervention was a single application of topical chloramphenicol ointment to the sutured wound immediately after suturing. The placebo treatment was a single application of paraffin ointment. In total, 972 minor surgery patients with high risk sutured wounds were recruited. Trial participants were randomised to topical chloramphenicol ointment (n=488) or placebo (n=484). The primary outcome was infection on the agreed day of removal of sutures or sooner if the patient re-presented with a perceived infection.1

The critical level of significance for statistical testing was set at 0.05 (5%). The proportion of participants with an infection was significantly lower in the chloramphenicol group than in the placebo group (6.6% v 11.0%; difference −4.4%, 95% confidence interval −7.9% to −0.8%; P=0.010). The researchers concluded that the application of a single dose of topical chloramphenicol to high risk sutured wounds after minor surgery produced a statistically significant yet moderate absolute reduction in infection rate.

Which of the following statements, if any, are true? (...)

Statistical Question
Confidence intervals: predicting uncertainty
(Konfidensintervaller: forutsigelse av usikkerhet)
BMJ 2012;344:e3147 (9 May)
Researchers evaluated the effectiveness of standardised consultations for patients with osteoarthritis of the knee.1 Standardised consultations involved three goal oriented visits, which comprised education about osteoarthritis and treatment management, as well as information on physical exercises and weight loss. A cluster randomised controlled trial was used. Control treatment was usual care. Participants were recruited from primary care. Inclusion criteria included age 45-75 years and a diagnosis by a rheumatologist of osteoarthritis of the knee according to the American College of Rheumatology clinical and radiological definition. Main outcome measures included change in body weight at four months from baseline. (...)

Innføring i statistikk - med medisinske eksempler
Odd Aalen. Oslo: Ad Notam Gyldendal, 1998, s. 76
(...) En bærende ide i boken er at leseren skal lære såpass mye sannsynlighetsregning at han/hun kan skjønne hva p-verdier og konfidensintervaller egentlig er for noe. Disse begrepene støter en på overalt i forskningslitteraturen, ikke minst i medisin, og forståelsen er ofte dårlig. (...)

Statistisk hypotesetesting er en metode til å trekke slutninger fra usikre data slik at en kan beregne graden av usikkerhet i konklusjonen. (...)

Statisitisk hypotesetesting baserer seg på beregning av en bestemt sannsynlighet (kalt signifikanssansynligheten eller P-verdien. (...)

En annen svært viktig metodikk er de såkalte konfidensintervaller som angir usikkerheten i et statisitisk estimat. (...)

Spørsmålet er hvor grensen for forkastning går. Ofte setter vi den ved 5 %, andre ganger ved 1%. Den grensen en velger, kalles signifikansnivået, eller bare nivået. (...)

Generelt kan en oppfatte p-verdien som et mål for sikkerheten i konklusjonen.

Uttrykket statistisk signifikans vil si at det er lite sannsynlig at det man observerer kan skyldes tilfeldigheter. Selv om en p-verdi viser en mulig statisitisk signifikans behøver det imidlertid ikke nødvendigvis være en klinisk signifikans. Det kan være en tilfeldighet. (...)

(Anm: S E Vollset - Odd O. Aalen red Statistiske metoder i medisin og helsefag. Oslo: Gyldendal Akademisk, 2006.ISBN 82-05-34685-2 (2006) (Tidsskr Nor Lægeforen 2006; 126:2843-4 (211.2006).)

Forebygging av risiko - Riktig informasjon kan villede

- Forebygging av risiko - Riktig informasjon kan villede
Tidsskr Nor Lægeforen 1997;117:1170-1171
(...) Landets leger har mottatt et et informasjonsbrev datert 14.02.1997 fra MSD (Merck Sharp & Dome) VED direktør Egil BodD. I dette brevet informeres det om at helseminister Gudmund Hernes har sagt på Dagsrevy n at ett av 100 hoftebrudd kan hindres ved bruk av Fosamax (alendronat, MSD), og at sikring av hjem og strøing av fortau ville ha en minst like god effekt til langt lavere kostnader. Videre har Helseministereren meddelt at sikring av hjem og strøing av fortau ville ha en mist like god effekt til langt lavere kostnad. Men ”MSD tror mer på dokumentasjon enn på Gudmund Hernes”. Brevet refererer til dokumentasjonen, som er til å tro på. Slik resultatene fra en referert studie brukes i brevet fra MSD, er det fare for at leger i klinisk praksis, med ansvar for å behandle enkeltindivider, villedes. Dette til tross for at informasjonen som gis ikke er feil. (...)

MSD refererer at dødeligheten kan være så høy som 20 % eter et hoftebrudd. Med påpeker videre at behandling med Fosamax gir 51 % mindre risiko for hoftebrudd. Dette er korrekte tall fra studien for relativ risikovurdering av hoftebrudd.

Hvordan kan så legene bli villedet? I veiledningen av enkeltindivider er isolerte tall for relativ risikovurdering unyttige. Hva trenger leger i klinisk praksis å vite? Jo, blant de 1005 kvinnene i placebogruppen fikk 22 hoftebrudd i denne perioden. Blant de 1022 som ble behandlet med alendronat fikk 11 hoftebrudd. Dvs i løpet av 2,9 år får 2,2 av 100 personer et hoftebrudd hvis de er ubehandlet, en absolutt risiko for å få hoftebrudd på 2,2% i løpet av 2,9 år. Dette reduseres til 1,1 av 100 personer i behandlingsgruppen, dvs en absolutt risiko på 1,1 % i denne gruppen. Absolutt risiko reduksjon er differansen mellom 2,2 og 1,1. Nødvendig antall man må behandle for å forebygge ett hoftebrudd fremkommer som invers verdi av absolutt risiko reduksjon. Absolutt risiko reduksjon blir 1,1 %, og nødvendig antall kvinner som må behandles i 2,9 år for å forebygge ett hoftebrudd blir 91. Men husk, denne effekten gjelder bare for kvinner som tidligere har hatt vertebrale brudd. Hvis disse resultatene brukes som grunnlag for primærprofylakse, dvs som grunnlag for å behandle kvinner med høy risiko, men uten tidligere brudd, får dette to alvorlige konsekvenser: antall personer som behandles mangedobles, og effekten er i beste fall mindre og så langt udokumentert. (...)

Hvis en gruppe på 100 personer som deg følges i 2,9 år uten behandling, vil to personer få hoftebrudd. Jeg vet ikke om du er blant de 98 eller de to. Hvis du derimot er i en gruppe på 100 personer som behandles med Fosamax i 2,9 år, vil én av 100 få hoftebrudd. Jeg vet ikke om du er den ene eller blant de 99. (...)

Pasienten kan da ta stilling til om hun vil være blant de 100 som bruker medisinen i 2,9 år og derved ha sjansen til å være den ene pasienten som «trekker vinnerloddet» og ved hjelp av medisinen unngår hoftebrudd. Hun vil da kunne holde dette opp mot sitt øvrige liv. Det er ikke grunn til å tro at alle vil bedømme denne risikoen likt, ikke alle mennesker er like opptatt av risiko og helse.

Våre innvendinger til MSDs informasjon er derfor:
- Tall for relativ risiko fremstilles som den dokumentasjon man har behov for og skal tro på.
- Det gis utilstrekkleig informasjon om at studien omtaler sekundærprofylakse hos kvinner.”

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

(Anm: Legemiddelindustrien (Big Pharma) (mintankesmie.no).)

(Anm: USAs mest beundrede lovbryter. (America's Most Admired Lawbreaker ) I løpet av 20 år utviklet Johnson & Johnson et kraftig legemiddel, promoterte det ulovlig overfor barn og eldre, skjulte bivirkninger og tjente milliarder av dollar. Dette er innsidehistorien. (Over the course of 20 years, Johnson & Johnson created a powerful drug, promoted it illegally to children and the elderly, covered up the side effects and made billions of dollars. This is the inside story.) (huffingtonpost.com 8.10.2015).)

(Anm: Tjenestemenn anklaget også firmaene for at de i markedsføringen av legemidler til barn hadde unnlatt å opplyse om at Risperdal (risperidone) kan føre til hormonelle ubalanser som kan føre til brystvevutvikling og infertilitet (barnløshet) hos gutter og jenter. I markedsføringen av legemidlet for behandling av eldre mennesker med demens hadde firmaet opprettet et salgsteam for omsorg for eldre, til tross for at data fra en studie finansiert av Janssen som viste at risperidon doblet risikoen for dødsfall blant eldre mennesker, ifølge statlige tjenestemenn. BMJ 2015;351:h7018 (Published 31 December 2015).)

(Anm: - Således ble bruk av antipsykotika knyttet til en doblet risiko for lungebetennelse hos pasienter med AD (Alzheimers sykdom), og til og med en høyere relativ risikoøkning (3,43 ganger) blant dem uten AD. (…) Resultatene indikerer at bruk antipsykotika er knyttet til en høyere risiko for lungebetennelse uavhengig av alder, anvendt studiedesign, behandlingsvarighet, valg av legemidler eller samtidige sykdommer. (dgnews.docguide.com 30.8.2016).)

(Anm: Among antidementia drugs, memantine is associated with the highest risk of pneumonia. A recent study from the University of Eastern Finland shows that among users of antidementia drugs, persons using memantine have the highest risk of pneumonia. The use of rivastigmine patches is associated with an increased risk as well. (medicalnewstoday.com 24.11.2016).)

(Anm: Publikum ønsker tøffere straffetiltak mot uansvarlig atferd i næringslivet. (- Resultatene viste en sterk offentlig bekymring for skjevhet i rettssystemet) (theconversation.com 25.7.2016).)

(Anm: Superrike skattesnytarar. (…) Denne verksemda vil ikkje ta slutt før dei som legg til rette for hemmeleghald og skatteunndraging – bankar, advokatar og rådgjevarar – opplever ein reell risiko for å bli straffa for å utføre slike tenester.) (dn.no 3.7.2017).)

(Anm: EU-kommissionen visste om VW-fusket. (- Misstankarna inom kommissionen väcktes till liv när dess experter insåg att luftkvaliteten i städer inte förbättrades som förväntat efter de strängare utsläppskraven för bilar som infördes 2007, enligt Der Spiegel.) (nyteknik.se 15.7.2016).)

(Anm: Volkswagen mistenkt for å ha villedet EUs investeringsbank. Volkswagen er mistenkt for å ha brukt et lån fra Den europeiske investeringsbanken (EIB) til å utvikle teknologi som åpnet for juks med utslippstester. Sjefen for den europeiske investeringsbanken (EIB) Werner Hoyer er skuffet over Volkswagen. (dn.no 2.8.2017).)

(Anm: VW-chef erkänner bedrägeri. En högt uppsatt chef på tyska Volkswagen (VW) i USA, inblandad i avgasskandalen, erkänner bedrägeri, meddelade en talesperson för domstolen i Detroit på tisdagen. (nyteknik.se 26.7.2017).)

(Anm: VW-topp sier seg skyldig – risikerer 169 år i fengsel. Den tidligere VW-toppen i USA, Oliver Schmidt, innrømmer å ha forsøkt å dekke over utslippsjukset. Nå risikerer han mange år bak murene. (tv2.no 28.7.2017).)

(Anm: Tidligere Volkswagen-ingeniør dømt til fengsel. En tidligere ingeniør i Volkswagen får 40 måneders fengsel etter Volkswagen-skandalen. (vg.no 25.8.2017).)

(Anm: Dieselskandalen truer tysk økonomi. Den tyske dieselskandalen utgjør en risiko for landets økonomi, opplyser Tysklands finansdepartement i en rapport mandag. Dieselskandalen oppsto for nesten to år siden, da det ble kjent at Volkswagen jukset med utslippstallene. Her monterer tyske arbeidere dieselmotorer på en Volkswagen-fabrikk i Chemnitz i Tyskland. (dn.no 21.8.2017).)

(Anm: -1200 vil dø av utslipp fra Volkswagens «juksebiler». Amerikanske forskere har undersøkt konsekvensene av utslippsjuks. (…) Det er forskere ved universitetet MIT i USA som har sett nærmere på konsekvensene av Volkswagens utslippsjuks. (dagbladet.no 3.3.2017).)

(Anm: Dieseljuks. Forskere har funnet den skjulte koden i juksebilene til Volkswagen. Gikk langt for å hindre at det var mulig å teste det virkelige utslippet. (…) Nå har de funnet svaret, gjemt i programvaren til bilene, melder University of California San Diego. (…) Resultatene er publisert i en rapport (PDF), som blir lagt frem frem under IEEE Symposium on Security and Privacy i San Francisco denne uken. Under vanlig bruk, slipper bilene ut inntil 40 ganger mer NOx enn tillatt. Utslippsavsløring: Skrur av eksosrensingen allerede ved 17 grader (tu.no 23.5.2017).)

(Anm: Research. The Volkswagen Emissions Scandal Could Shorten Thousands of Lives, Study Says (time.com 3.3.2017).)

(Anm: VW-sjef pågrepet i USA En høytstående sjef i Volkswagen i USA har i kjølvannet av dieselskandalen blitt pågrepet av FBI, mistenkt for bedrageri, ifølge The New York Times. Oliver Schmidt ble ifølge den amerikanske avisa pågrepet lørdag. (nrk.no 9.1.2017).)

(Anm: Volkswagen må betale 36 milliarder kroner etter utslippsjukset. (aftenposten.no 11.1.2017).)

(Anm: Volkswagen trolig spart for milliarder i USA. En dommer i USA har avvist et søksmål mot Volkswagen, noe som kan spare den tyske bilprodusenten for milliarder av dollar i utbetalinger. Avgjørelsen kan avskrekke en rekke amerikanske stater fra å saksøke Volkswagen etter utslippsskandalen som har fulgt bilprodusenten i nesten to år. Den føderale dommeren Charles Breyer avviste søksmålet fra delstaten Wyoming med henvisning til at den aktuelle forurensningsloven må reguleres sentralt og ikke av de amerikanske delstatene. (dn.no 1.9.2017).)

(Anm: Tysk avis: VW-sjefen godkjente dekkoperasjon. Martin Winterkorn, avgått konsernsjef i Volkswagen, godkjente en plan om å holde tilbake informasjon fra amerikanske myndigheter, skriver Bild. (e24.no 26.9.2016).)

(Anm: VW må betale 2,8 milliarder dollar i bot for dieseljuks. Beløpet tilsvarer over 24 milliarder kroner. (dagbladet.no 21.4.2017).)

(Anm: Nobelprisvinner trekker seg fra Panama-gransking. (…) Begrunnelsen er at granskingen vanskeliggjøres av hemmelighold og manglende åpenhet.) (…) Pieth sier det blant annet finnes beviser for hvitvasking av penger fra barneprostitusjon i Panama-dokumentene. (dn.no 6.8.2016).)

(Anm: Margaret McCartney: Valgfri offentliggjøring av utbetalinger er meningsløst. (Margaret McCartney: Optional disclosure of payments is pointless.) (- Og åpenhet anskueliggjør problemene: bør de som mottar tusenvis av pund fra industrien som "påtenkte ledere" sitte i paneler for utarbeidelse av nasjonale retningslinjer eller hjelpe til med å stake ut regjeringens politikk?) BMJ 2016;354:i3692 (Published 01 July 2016).)

(Anm: For mange retningslinjer for behandlinger er skrevet av eksperter med finansielle konflikter, viser studien. (statnews.com 22.8.2016).)

(Anm: Naturlig at dette er offentlig. OUS-lege Elisabeth Gulowsen Celius samtykket til offentliggjøring av honorarer. Hun er kritisk til kolleger som ikke har gjort det samme. – Det kan reise spørsmål om det er bindinger som ikke tåler dagens lys. (dagensmedisin.no 12.8.2016).)

(Anm: Resultater publisert i JAMA Internal Medicine antyder at ett enkelt gratis måltid kan øke sannsynligheten for at en lege vil foreskrive et bestemt legemiddel. (Findings published by JAMA Internal Medicine suggest that even a single free meal can boost the likelihood a doctor will prescribe a certain drug) (online.wsj.com 20.6.2016).)

(Anm: FDAs rådgivere på opioider sparket grunnet bånd til industrien, ifølge AP. (FDA's advisers on opioids booted for ties to industry, AP learns. Having been buffeted by controversy over its approval of addictive opioid drugs, the FDA is calling on a panel of experts to help it sort through the thorny issue. But even before the new panel met, it has been tinged by controversy itself, dismissing four advisers because of perceived ties to drugmakers.) (fiercepharma.com 8.7.2016).)

(Anm: Offentliggjøring av verdioverføringer. Legemiddelindustrien offentliggjør i dag alle verdioverføringer til helsepersonell og helseforetak. (lmi.no 30.6.2016).)

(Anm: Leder. Disclosure UK: åpenhet (offentliggjøring) bør ikke lenger være valgfritt BMJ. (Editorials. Disclosure UK: transparency should no longer be an optional extra) BMJ 2016;354:i3730 (Published 06 July 2016).)

(Anm: Disclosure UKs nettsted gir en "illusjon av åpenhet", sier Goldacre (Disclosure UKs nettsted gir en "illusjon av åpenhet", sier Goldacre) (Disclosure UK website gives “illusion of transparency,” says Goldacre) BMJ 2016;354:i3760BMJ 2016; 354 (Published 06 July 2016).)

(Anm: Reporting of financial and non-financial conflicts of interest by authors of systematic reviews: a methodological survey. (…) Conclusions Although close to half of the published systematic reviews report that authors (typically many) have conflicts of interest, more than half report that they do not. Authors reported individual conflicts of interest more frequently than institutional and non-financial conflicts of interest. BMJ Open 2016;6:e011997.)

(Anm: - Legene som deklarerte de høyeste inntektene fra legemiddelfirmaer i Storbritannias nye database uttaler at åpenhet om utbetalingene bør være obligatorisk. (The doctors who declared the most earnings from drug companies in the United Kingdom’s new database have said that being transparent about payments should be mandatory.) BMJ 2016;354:i3716 (Published 04 July 2016).)

(Anm: Leger som mottar de største utbetalingene fra legemiddelfirmaer deklarerer dem ikke på nytt nettsted. (Doctors getting biggest payments from drug companies don’t declare them on new website. BMJ 2016;354:i3679 (Published 01 July 2016).)

(Anm: Association between payments from manufacturers of pharmaceuticals to physicians and regional prescribing: cross sectional ecological study. BMJ 2016;354:i4189 (Published 18 August 2016).)

(Anm: Medisinsk utstyr (mintankesmie.no).)

(Anm: Legemiddelprodusenter og medisinske utstyrsprodusenter betalte i fjor 6,5 milliarder dollar til leger og undervisningssykehus. (Drug and device makers paid $6.5 billion to docs and teaching hospitals last year.) (statnews.com 30.6.2016).)

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. (Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

(Anm: Interessekonflikter vanlig blant forfattere av amerikanske retningslinjer for kreft, ifølge studie. (Conflicts of interest common among US cancer guideline authors, study finds.) BMJ 2016;354:i4660 (Published 25 August 2016).)

(Anm: Selgere i kirurgenes rekker: Relasjoner mellom kirurger og medisinske utstyrsrepresentanter (Salespeople in the Surgical Suite: Relationships between Surgeons and Medical Device Representatives. PLoS ONE 11(8): e0158510).

(Anm: - Nesten ni av 10 leger og forskere som bidro til å utvikle et førende sett med retningslinjer for kreftomsorgen i USA rapporterte finansielle bånd til legemiddelindustrien og medisinske utstyrsfirmaer). (medicalnewstoday.com 30.8.2016).)

(Anm: Ingen gratis lunsj for leger: Sponsede måltider knyttet til flere resepter (No free lunch for docs: Sponsored meals linked to more prescriptions) (mmm-online.com 20.6.2016).)

Handbok i medicinsk och biologisk forskning
Lars Lind. Stockholm: Liber AB, 2001
(...) Ett 95% konfidensintervall brukar oftast förkortas 95% CI och kan anges som (97,145) eller [97,145], med vilket menas att intervallet ligger mellan 97 och 145. Oftast har då gruppens medelvärde angivits före parentesen. 95% CI är altså ett intervall av mätvärden, där man kan vara 95% säker på att detta intervall innehåller det sanna medelvärdet i den population som gruppen valdes ifrån.

Ett exempel: Om vi väljer ut 100 stycken 18-åringar som mönstrar för militärtjänsten och mäter deras systoliska blodtryck så kan medelvärdet vara tex 123 mmHg. Standarddeviationen är 14 mmHg. Ett 95% CI blir då (121,126). Med 95 % säkerhet vet vi därmed att medelvärdet för alla som mönstrar ligger mellan 121 och 126 mmHg.

Ytterligare ett exempel: Om vi i stället bara valde ut 10 stycken, som av en slump hade samma medelvärde, skulle det nya 95 % CI bli vidare (112,136).
Ett exempel: Om vi väljer ut 100 stycken 18-åringar som mönstrar för militärtjänsten och mäter deras systoliska blodtryck så kan medelvärdet vara tex 123 mmHg. Standarddeviationen är 14 mmHg. Ett 95% CI blir då I (121,126). Med 95 % säkerhet vet vi därmed att medelvärdet för alla som!
mönstrar ligger mellan 121 och 126 mmHg.Ytterligare ett exempel: Om vi i stället bara valde ut 10 stycken, som av en slump hade samma medelvärde, skulle det nya 95 % CI bli vidare (112,136).

Med denna mindre grupp vet vi att med 95 % säkerhet ligger medelvärdet for alla som mönstrar mellan 112 och 136 mmHg. Vi ser att när vi plockar ut en mindre grupp kommer vi att kunna ringa in populationens sanna medelvärde sämre. Ur det inser vi intuitivt att ju större grupp vi undersöker, desto närmare det sanna medelvärdet kommer vi. När vi till slut har undersökt alla i populationen har vi ju det sanna medeivardet i populationen!
For att resonemanget om 95 % CI för ett medelvärde skall galla måste följande villkor vara uppfyllda:

  • Variabeln som mats måste vara normalfordelad.
  • Gruppen måste vara slumpvis utvald (randomly selected) ur den underliggande populationen.
  • De utvalda personerna måste vara valda oberoende av varandra, dvs man får inte välja en person t ex bara for att hans granne eller bror har blivit utvald.

Är inte dessa villkor uppfyllda kommer det sanna konfidensintervallet troligen att vara vidare än det beraknade. (...)

Av konvention brukar man i biomedicinsk forskning acceptera att förkasta nollhypotesen om p < 0,05. Detta leder till att man i en del fall förkastar nollhypotesen när i själva verket skillnaden mellan t ex två medelvärden bara berodde på slumpen. Denna typ av fel brukar kallas typ I-fel (eller alfa). Det enda sättet att minska risken för denna typ av fel är att sätta en strängare (= lägre) gräns för p- värdet.

Vi kan även tänka oss det motsatta. Vi ser en klar skillnad mellan medelvärdena i två grupper, men vi får ändå ett p-värde> 0,05. Vi måste då hålla oss kvar vid nollhypotesen och rapportera att vi inte kunde påvisa någon skillnad mellan grupperna även om vi egentligen tror att den finns. Detta fenomen kan ha två förklaringar. Antingen eristerade det ingen skillnad, och då var ju slutsatsen korrekt, eller så var vår studie underdimensionerad, dvs innehöll för få observationer för att adekvat kunna påvisa ett signifikant resultat. Det är tyvärr alltför vanligt att studier är underdimensionerade och att man därför måste hålla kvar vid en nollhypotes som faktiskt inte är riktig. Detta brukar kallas för typ II-fel (eller beta). För att undvika denna typ av fel bör man beräkna gruppstorleken i förväg. Detta behandlas i ett separat avsnitt.

(Anm: confidence; kan oversettes som tillit eller sikkerhet; confidence interval (konfidensintervall) forteller noe om sikkerheten i et statistisk estimat.)

(Anm: confidence interval; In statistics, a confidence interval (CI) is a particular kind of interval estimate of a population parameter and is used to indicate the reliability of an estimate. It is an observed interval (i.e it is calculated from the observations), in principle different from sample to sample, that frequently includes the parameter of interest, if the experiment is repeated. How frequently the observed interval contains the parameter is determined by the confidence level or confidence coefficient. (en.wikipedia.org).)

(Anm: odds; odds, antatt sannsynlighet for å lykkes eller at et visst resultat inntreffer; forholdet mellom gevinst og innsats i veddemål og pengespill. Se også totalisatorspill. Kilde: Store norske leksikon.)

(Anm: Innføring i statistikk - med medisinske eksempler. (...) Hvis man i en normalfordeling lager et intervall som har sentrum i forventningen og går to standardavvik ut til hver side, dekker det ca. 95% av fordelingen.” Dette intervallet er et såkalt konfidensintervall, hvor tallet 95% kalles konfidenskoefisienten. (mintankesmie.no).)

(Anm: Dersom man antar at én pasient i en gruppe på 100 erfarte alvorlige bivirkninger ved bruk av et spesifikt medikament, mens de øvrige 99 ikke erfarte slike bivirkninger, vil odds-ratio være 0,01/0,99=0,0101, dvs. man deler den gruppe som erfarte bivirkninger, med den gruppe som ikke erfarte bivirkninger. Odds-ratio må ikke forveksles med prevalensen (utbredelse av en sykdom målt i antall syke dividert med befolkningstallet), som her vil være 1:100 (1%) eller 0,01 (dvs. ikke 0,0101). I det nevnte eksemplet, hvor prevalensen er relativt lav, er forskjellen mellom de to metodene nærmest ubetydelig, men dersom man tenker seg at halvparten av gruppen hadde erfart bivirkninger, ville odds-ratio vært 0,5/0,5=1, mens prevalensen vil være 50:100=0,5 (50 %). Dette eksemplet viser at det er svært viktig å kunne skille disse to metodene fra hverandre.)

- Leger feiltolker screening

Leger feiltolker screening
Tidsskr Nor Legeforen 2012; 132:1221 (29.5.2012)
Leger anbefaler ofte screeningtester, men mange vet ikke hvordan resultater fra slike tester skal forstås.

Screening er å teste friske personer for sykdom, for eksempel kreft. Screeningstudier kan være vanskelige å tolke, blant annet på grunn av overdiagnostikk og forskyvning av diagnosetidspunkt ved screening (lead-time bias).

413 amerikanske primærleger ble forelagt to scenarioer om effekten av to hypotetiske screeningtester: en som forbedret femårsoverlevelsen og ga tidligere diagnostikk av kreft (irrelevante resultater), en annen som reduserte kreftdødeligheten (relevante resultater), men ga økt kreftforekomst (1). Legene var mer begeistret for den første screeningtesten (som viste at femårsoverlevelsen økte fra 68 % til 99 %) enn for den andre (som reduserte kreftdødeligheten fra 2,0 til 1,6 per 1 000 personer). 69 % av legene ville anbefale den første testen, bare 23 % den andre (p < 0,001). Nesten halvparten av legene mente - feilaktig - at påvisning av flere krefttilfeller ved screening var bevis for at screening redder liv.

- Disse resultatene er nokså nedslående, sier professor Michael Bretthauer ved Oslo universitetssykehus, Rikshospitalet. Han leder en stor internasjonal screeningstudie om tykktarmskreft. - Studien viser at selv ikke leger forstår fordeler og begrensninger ved screeningtester.

Tidlig diagnostikk av kreft fremstår intuitivt som positivt for både leger og allmennhet. Ved omtale av screeningtester bør bare absolutte screeninggevinster med redusert dødelighet brukes, ikke overlevelse og tall om tidlig diagnostisert sykdom. Forskere og medisinskvitenskapelige tidsskrifter har en viktig oppgave i å spre riktig informasjon om screening og forskningsmetoder, sier Bretthauer.

(Anm: Do physicians understand cancer screening statistics? A national survey of primary care physicians in the United States. Ann Intern Med. 2012 Mar 6;156(5):340-9.)

Legemiddelkontroll og statistikk

Fosamax, statistikk og Statens legemiddelkontroll
Tidsskr Nor Lægeforen 1998;118:74) bl.a., sitat.
(...) Et problem i denne sammenheng har vært den manglende vilje ved Statens legemiddelkontroll (SLK) til å sikre seg statistisk fagkunnskap i sin stab. Statistikk er essensielt i kliniske utprøvninger og i enhver vurdering av dokumentasjon for medikamenters effekt. SLK har basert seg på eksterne konsulenter som trekkes inn i enkelte sammenhenger. Dette er åpenbart utilstrekkelig i forhold til det betydelige behovet for slik kunnskap som trengs i et organ som SLK. Det er på høy tid at SLK sørger for å få statistisk ekspertise inn i sin egen stab. SLKs ”motpart” i mange saker, legemiddelindustrien, har for lengst innsett betydningen av slik fagkunnskap og har tildels betydelige fagavdelinger på feltet. SLK kan neppe håndtere industriens økende press uten i noen grad å matche deres faglige kompetanse. (...)

Ledig stilling (web.archive.org)
Statens legemiddelverk. Annonse: Seniorrådgiver – Biostatistiker.
(...) Seniorrådgiver – Biostatistiker.

Medisinsk avdeling.

Ved medisinsk avdeling er det ledig en nyopprettet stilling som seniorrådgiver med tiltredelse snarest. Stillingen inngår i et stimulerende tverrfaglig miljø som arbeider med effekt og sikkerhet av humane og veterinære legemidler, overvåking av legemidler på markedet og kliniske utprøvinger. Avdelingen har en utstrakt kontaktflate både nasjonalt og internasjonalt og deltar i det europeiske samarbeidet for godkjenning av legemidler. Seniorrådgiveren skal i hovedsak bistå seksjon for medisinsk utredning samt seksjon for kliniske utprøvinger. Arbeidsoppgaver:

  • Vurdere statistisk dokumentasjon innsendt i forbindelse med søknader om kliniske utprøvinger og markedsføringstillatelser for nye legemidler samt endringssøknader
  • Gi råd og veiledning til medarbeidere ved medisinsk avdeling i forbindelse med statistiske problemstillinger ved vurdering av kliniske studier
  • Kvalitetssikre utredernes statistiske vurderinger av innsendt klinisk dokumentasjon
  • Intern undervisning innenfor området statistikk
  • Bistå andre avdelinger ved Legemiddelverket i forbindelse med statistiske problemstillinger” (...)

- Er det riktig at etablert osteoporose skal gjøre livet hennes til et mareritt?

Er det riktig at etablert osteoporose skal gjøre livet hennes til et mareritt?
Legemidler og Samfunn (1998;19(8):17) (dvs. "forgjengeren" til Dagens Medisin)
(...) Merck Sharp & Dome (...)

Fosamax® reduserte risikoen for brudd i håndledd og hofte. I den samme undersøkelsen ble det for første gang i en kontrollert studie vist at man kan halvere forekomsten av hofte og håndleddsbrudd, i tillegg til rygg. Den relative risikoen for hoftefrakturer ble redusert med 51 % (11/1022 vs. 22/1005) P= 0,047, og for håndleddsbrudd med 48 % (22/1022 vs. 41/1005) p= 0,013.”

(Anm: p-verdier; sannsynligheten for at funnene i en vitenskapelig studie ved slump skal ha blitt slik de er dersom nullhypotesen er sann; eller noe enklere og mer unøyaktig uttrykt: Sannsynligheten for at funnene i en vitenskapelig studie skal ha kunnet oppstå ved slump. Begrepet er nær knyttet til hypotesetesting som del av hypotetisk-deduktiv forskningsmetode. Se også statistisk signifikans. Kilde: Store norske leksikon.)

Diverse artikler

Converting an odds ratio to a range of plausible relative risks for better communication of research findings
BMJ 2014;348:f7450 (Published 24 January 2014)
Odds ratios are a necessary evil in medical research; although used as a measure of effect size from logistic regressions and case-control studies, they are poorly understood. This paper provides practical advice for authors and readers on converting odds ratios to relative risks (...)

Sample size: how many participants are needed in a trial?
BMJ 2013;346:f1041 (15 February 2013)
Researchers investigated the effectiveness of a home based early intervention on children’s body mass index (BMI) at age 2 years. A randomised controlled superiority trial was used. The intervention consisted of eight home visits from specially trained community nurses in the first 24 months after birth; this was in addition to the usual childhood nursing service from community health service nurses. The control group received the usual childhood nursing service alone. Participants were first time mothers and their infants. The primary outcome was children’s BMI at age 2.1 (...)

Statistical Question
Why randomise in clinical trials?

BMJ 2012;345:e5584 (22 August 2012)
Researchers evaluated the efficacy of a 23-valent pneumococcal polysaccharide vaccine in preventing pneumonia in people at high risk. A randomised, placebo controlled, double blind trial was used. (...)

How to obtain the confidence interval from a P value
BMJ 2011; 343:d2090 (8 August)
Confidence intervals (CIs) are widely used in reporting statistical analyses of research data, and are usually considered to be more informative than P values from significance tests.1 2 Some published articles, however, report estimated effects and P values, but do not give CIs (a practice BMJ now strongly discourages). Here we show how to obtain the confidence interval when only the observed effect and the P value were reported.

The method is outlined in the box below in which we have distinguished two cases. (...)

Relative risks and statistical significance
BMJ 2010;341:c4265 (11 August)
Statistical Question (...)

P Values vs Estimates of Association With Confidence Intervals
Arch Pediatr Adolesc Med. 2010;164(2):193-196 (February)
Since 1988, the International Committee of Medical Journal Editors has used this language in their guidelines for authors: "When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals). Avoid relying solely on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information."1-2 Hundreds of biomedical journals, including the Archives,3 endorse these guidelines. What concerns do editors have about P values and hypothesis testing? (...)

Relative vs. absolute measures of benefit and risk: what's the difference?
Acta Psychiatrica Scandinavica 2009;121(2):94-102
Objective: When appraising evidence clinicians are confronted with two types of comparisons: ratios, such as relative risk, and absolute differences, such as number needed to treat (NNT) or number needed to harm (NNH).

Method: A review of the definition, calculation and interpretation of relative measures such as relative risk, odds ratio and the hazard ratio, and how they are different from absolute measures such as NNT and NNH.

Results: Relative and absolute measures provide different perspectives. Ratios can be misleading and exaggerate clinical differences, but NNT can appear to trivialize the risk of potentially important adverse events.

Conclusion: There is a need to understand both relative and absolute differences in order to make informed decisions. (...)

Migraine and risk of stroke
BMJ 2009;339:b4844 (17 November)
Misleading relative risks?

The absolute risk of stroke in women with migraine is low: 17-19 per 100 000 woman years.1 This roughly equates to one per 5000 women years. The risk increases twofold in migraine with aura, seemingly to two per 5000.

This seems low.

Is the use of relative risk misleading? Are we justified in treating patients with migraine "aggressively for modifiable cardiovascular risk factors"? (...)

Relativa tal viktigare än absoluta
lakemedelsvarlden.se 27.8.2009
När människor fattar beslut om de ska börja en förebyggande läkemedelsbehandling är det mer avgörande med den relativa riskminskningen än den absoluta. Det visar en studie på norska och nordamerikanska patienter. (...)

Det är känt från tidigare studier att patienter som får riskreduktion presenterat i relativa tal, till exempel ”behandlingen minskar risken att drabbas av sjukdom med 50 procent” i högre grad är positiva till den än de som får samma data presenterat i absoluta tal ”risken sjönk från 4 till 2 procent”. (...)

New group aims to detect misuse of statistics by government and media (Ny gruppe har som målsetting å påvise statens og medienes misbruk av statistikk)
BMJ 2009;338:b2469 (18 June)
Published 2009, doi:10.1136/bmj.b2469
A new group that aims to detect and highlight the misuse of statistics was launched on 18 June to help promote the public’s confidence in statistical information.

Straight Statistics, which is supported by a grant from the Nuffield Foundation, will encourage the appropriate use of statistical data by a range of establishments, including the government and the media. It will report its findings on its website (www.straightstatistics.org) and promote its work through reports and conferences.

Together with the charity Sense about Science, which promotes good science among the public, the group is also producing a booklet, Making Sense of Statistics, which will be available in September. It is also supporting the establishment of an all party parliamentary group on statistics. (...)

Statistical question
Study design
BMJ 2009;338:b2381 (17 June)
A clinical trial investigated the effectiveness of topical versus oral ibuprofen for chronic knee pain in people over 50. In designing a trial to decide the best treatment approach, which answer best describes how confounding could be minimised?

a) Double blind trial
b) Intention to treat analyses
c) Matching by age and sex
d) Randomisation of research participants (...)

Hvor "farlige" fødsler?
aftenposten.no 8.8.2009
Dag Moster er barnelege, overlege ved Haukeland universitetssykehus og postdoc-stipendiat ved Universitetet i Bergen
Rolv Terje Lie er professor ved Universitetet i Bergen.
Trond Markestad er barnelege, dr.med. og leder i Rådet for legeetikk
aftenposten.no 8.8.2008
Det er korrekt at noen for tidlig fødte kan få problemer senere i livet. Men de aller fleste for tidlig fødte klarer seg svært godt som voksne. (...)

Et eksempel som kan illustrere hva relativ risiko betyr, er at sjansen for å vinne i Lotto øker 10 ganger hvis en kjøper 10 rekker i stedet for én. Likevel er den reelle sjansen for å vinne fortsatt liten.

Tilsvarende fikk ca. 1 av 1000 barn født til termin og, tross alt, bare 9 av 100 født mer enn tre måneder før termin cerebral parese i vår studie. Så selv om det var 79 ganger så høy risiko var det fortsatt 91 % som ikke hadde cerebral parese av de minste premature. I tallene for risiko er det også mulig at samme barn har flere diagnoser, for eksempel både cerebral parese og psykisk utviklingshemning. Betydningen av funksjonsvansker kan også illustreres ved at 11 av 100 barn som var født mer enn tre måneder før tiden mottok uførestønad mot 2 av 100 født til termin. 89 % av de aller minste premature mottok altså ikke uførestønad. (...)

Ingen grunn til bekymring.
Det vil si at økt overlevelse har ført til at langt flere for tidlig fødte barn overlever i dag uten alvorlige funksjonshemninger. (...)

Ubrukelig undersøkelse
Vegard Nilsen - Overlege, Sørlandet sykehus Kristiansand
dagbladet.no 21.6.2008
(...)Et kjent eksempel fra medisinens verden er kvinners bruk av østrogen. En rekke observasjonsundersøkelser fra ulike deler av verden har vist at kvinner som bruker østrogen får mindre hjertesykdom enn kvinner som ikke bruker det. Dette har gjort at mange leger har gitt dette til sine kvinnelige pasienter og mange kvinner har bedt om å få det av sin lege. Er dette god medisin? For å finne ut av slikt bruker medisinsk vitenskap det som kalles «randomisert kontrollert studie» (RKS). Da ble det samlet en stor gruppe kvinner som ved loddtrekning ble delt i to grupper. Gruppene var like m.t.p. røyking og en rekke andre faktorer som vi vet har betydning på sykdom/død. Kun bruk eller ikke bruk av østrogen var det som skilte dem, halvparten fikk østrogen og de andre «narreøstrogen». Konklusjonen ble det motsatte av hva observasjonsundersøkelsene hadde vist. Bruk av østrogen økte faren for hjertesykdom. Forklaringen er at østrogenbrukende kvinner lever sunnere: de røyker mindre, trener mer og spiser sunnere kost. Den statistiske justeringen til tross, observasjonsundersøkelsen hadde lurt oss. (...)

How to interpret figures in reports of clinical trials
BMJ 2008;336:1166-1169 (24 May)
A picture may be worth a thousand words but in medical research, caution

(...) Summary points
Clinical trials contain four main types of figure: flow diagrams, Kaplan-Meier plots, forest plots, and repeated measures plots
Many published figures have deficiencies in presentation or content
Examples highlight good practice and pitfalls to avoid when interpreting figures (...)

Statistisk signifikans og klinisk relevans
Tidsskr Nor Legeforen 2008; 128:279 (31.1.2008)
Statistikk er et viktig hjelpemiddel i vitenskapelige studier, men brukes for ofte som erstatning for klinisk vurdering av resultatene

I desember 2005 skjedde det noe uventet i det europeiske legemiddelverket EMEA (European Medical Agency). EMEAs komité for humane legemidler (CHMP) avviste en søknad fra Novartis om markedsføringstillatelse for legemidlet tegaserod (1). Saken fikk ingen oppmerksomhet i Norge, men den er av stor betydning for fortolkningen av vitenskapelige studier. (...)

Survey: How Good Are You at Interpreting Conflicting Research?
medpagetoday.com 14.9.2007
A recent study indicated that internal medicine residents are ill-prepared to understand -- and translate into daily practice -- the statistics presented in most published research. (See: Medicine Residents Have Poor Grasp of Biostatistics in Clinical Studies)

Yet today's emphasis on evidence-based medicine demands that clinicians be able to interpret often-conflicting studies and modify their practice accordingly.
Two studies published this week in the Journal of the American Medical Association point up the dilemma. (See: Ups and Downs of Thiazolinediones for Diabetes Assessed by Dueling Meta-Analyses)

These meta-analyses are just the latest chapter in a drug safety controversy over rosiglitazone that has been playing out since May, when an earlier Cleveland Clinic meta-analysis grabbed headlines. (...)

Readers beware (Lesere vær på vakt)
BMJ 2007;334 (14 April)
Editor's Choice
Ikke tro alt du leser. Det er budskapet i flere artikler i denne ukes BMJ. (Don't believe everything you read. That's the message from several articles in this week's BMJ.)

Neill Adhikari and colleagues systematically reviewed the results of 12 clinical trials of nitric oxide in the treatment of acute respiratory distress syndrome (doi: 10.1136/bmj.39139.716794.55). A selective vasodilator, nitric oxide has been widely used in intensive care units because of its demonstrated beneficial effects on oxygenization in critically ill patients. But this meta-analysis of small trials totaling more than 1200 patients found no significant effect on hospital mortality and an increased risk of renal dysfunction. In an accompanying editorial, Niall Ferguson discusses the theoretical advantages of nitric oxide in catastrophic respiratory failure (doi: 10.1136/bmj.39168.568692.BE).

Unfortunately this seems to be a case when physiological improvements do not lead to better clinical outcomes, which Ferguson calls a "recurring theme in critical care." (...)

Journals omit absolute risks
BMJ 2006;333 (16 December)
Absolute risks should be routinely included in abstracts, adjacent to any reported risk ratio, to allow readers to discern the meaning of ratio measures. In a structured review of the accessibility of absolute risk data in six leading journals, including the BMJ, Schwartz and colleagues (10.1136/bmj.38985.564317.7C) examined 222 articles with study designs that allow absolute risks to be calculated. They found 68% of articles failed to report absolute risks in the abstract, and half of these did not report them anywhere in the article. (...)

Websidene er designet og tilrettelagt av Hein Tore Tønnesen © 2009