Statistisk hypotesetesting

Statistisk hypotesetesting er en metode til å trekke slutninger fra usikre data slik at en kan beregne graden av usikkerhet i konklusjonen. (...)

Statisitisk hypotesetesting baserer seg på beregning av en bestemt sannsynlighet (kalt signifikanssansynligheten eller P-verdien). (Innføring i statistikk - med medisinske eksempler. Oslo: Ad Notam Gyldendal, 1998)

Ikke tro på relative risikoer og odds ratior i abstrakter (BMJ 2006;333 (29 July))

Lesere vær på vakt

Ikke tro alt du leser. Det er budskapet i flere artikler i denne ukes BMJ. (Don't believe everything you read. That's the message from several articles in this week's BMJ.) (BMJ 2007;334 (14 April))

- Absolutt usant og relativt sant om risikoreduksjon

Absolutt usant og relativt sant om risikoreduksjon
Tidsskr Nor Lægeforen 2003; 123:78-9 (1-9 januar)
Legemidlers effektivitet og deres bivirkninger kan beskrives ved hjelp av risikotall. Inntrykket som dannes avhenger av hvilke risikotall som brukes. I denne kommentaren problematiseres bruken av slike tall i legemiddelreklame, og det reises spørsmål om hva som er å forstå som uriktige, misvisende og villedende opplysninger i denne sammenhengen.

Osteoporotiske brudd er et stort helseproblem – og et større problem i Norge enn i mange andre land (1). Det er derfor svært ønskelig med tiltak som reduserer forekomsten av brudd. For å imøtekomme dette ønsket er det i de senere år utviklet flere legemidler. Lanseringen av Fosamax vakte i sin tid debatt, en debatt som endog endte i rettssalen (2). Nylig kom en reklamebrosjyre om et annet medikament oss i hende, nemlig Evista (raloxifen). Budskapet i brosjyren får oss til å undres over hvilke lærdommer firmaet Lilly har trukket av Fosamax-saken.

Relative og absolutte sannheter i medisinen
Bruk av risikotall står sentralt i beskrivelsen av enkelte legemidlers effektivitet. Den kan fremstilles som henholdsvis relativ risikoreduksjon, absolutt risikoreduksjon eller antall som må behandles (NNT). Svarene som gis gjennom de ulike effektmålene er forskjellige, men har det til felles at de alle er sanne (3). Sannhet og løgn er imidlertid relative begreper, og det har lenge vært kjent at det er mulig å forlede med statistikk uten å snakke direkte usant (4). Inntrykkene som dannes ut fra de ulike effektmålene er forskjellige, og effektiviteten oppfattes gjennomgående som størst når den fremstilles som relativ risikoreduksjon (5). Det er derfor neppe tilfeldig at dette effektmålet benyttes hyppig i legemiddelreklame (6) og medieomtale av legemidlers risikoreduserende effekt (7). En slik beskrivelse er metodologisk sett korrekt, men egnet til å forlede. Dette fordi relativ risikoreduksjon ikke sier noe om utgangsrisikoen for sykdom (8). Følgelig er det også tatt til orde for at den absolutte risikoreduksjonen må vurderes før det fattes en beslutning om intervensjon mot osteoporose (9). Ensidig bruk av relativ risikoreduksjon som effektmål var da også noe det ble reagert på i beskrivelsen av effektiviteten ved Fosamax-behandling (10). (...)

(Anm: Forskning og ressurser (mintankesmie.no).)

(Anm: Hvordan lese/fortolke en medisinsk artikkel (statistiske resultater) (mintankesmie.no).)

(Anm: Arvelig uføretrygd? Forskning: Medier må være mer edruelige i sin omgang med forskningsresultater. (aftenposten.no 9.7.2013).)

- Lave P-verdier bør ikke alltid imponere deg. (- Hva er en god størrelse for en NNT? "Jeg respekterer enhver NNT versus placebo på under 10," sa dr. Citrome.)

(Anm: Low P values shouldn’t always impress you. REPORTING FROM PSYCH CONGRESS 2019 SAN DIEGO – Even if a P value hints at statistical significance by dipping under .05, it might not tell you anything worthwhile. Effect sizes are hugely important – as long as accompanying P values measure up. And pharmaceutical companies often keep revealing numbers under wraps unless you know what – and whom – to ask. (…) “It’s something I’ll probably consider in day-to-day practice.” Double-digit and triple-digit NNTs “are usually irrelevant unless we’re dealing with very specific outcomes that have long-term consequences.” As for the opposite side of the picture – NNH – values higher than 10 are ideal. He cautioned that NNT and NNH, like P values, cannot stand alone. In fact, they work together. In order to have value, NNT or NNH must be statistically significant, and P values provide this crucial insight. (mdedge.com - October 17, 2019).)

(Anm: NNT; antall som må behandles for å forebygge ett sykdomstilfelle (number needed to treat, NNT) (en.wikipedia.org).)

- LEDER. Høna, egget og forskjellene. (- Jo mer skolegang folk har, desto færre legemidler bruker de.) (- Er folk med lang utdanning også friskest, eller vet de noe alle andre ikke vet?)

(Anm: LEDER. Høna, egget og forskjellene. Jo mer skolegang folk har, desto færre legemidler bruker de. Er folk med lang utdanning også friskest, eller vet de noe alle andre ikke vet? (...) Fenomenet ses for de fleste legemiddelgruppene. De med grunnskoleutdanning bruker mer av både lipidsenkende midler (hvor statinene dominerer), diuretika, antidepressiver, syrehemmende midler (hvor protonpumpehemmerne dominerer), betablokkere, ACE-hemmere og angiotensin-2-reseptorantagonister, sovemidler, antitrombotiske midler og - men her begynner forskjellen å bli liten - opioider enn de med mer enn ti års skolegang. Tidsskr Nor Legeforen 2012; 132:2142 (16.10.2012).)

(Anm: Legemiddelforskrivning (feilforskrivning, overmedisinering, deforskrivning (seponering) (mintankesmie.no).)

- Betablokkere ved hjerteinfarkt. (- Antall som må behandles for å ha nytte (NNTB) = 209.)

(Anm: Betablokkere ved hjerteinfarkt. (- number needed to treat to benefit (NNTB) = 209.) (- Konklusjon Forfatterne konkluderer at i dagens praksis ved behandling av hjerteinfarkt, har betablokkere ingen mortalitetsbeskyttende effekt, men de reduserer insidensen av nytt hjerteinfarkt og angina (i et kort tidsperspektiv) på bekostning av økt insidens av hjertesvikt, kardiogent sjokk og stans i behandlingen. Forfatterne tilrår at utviklere av retningslinjer revurderer styrken av anbefaling av bruk av betablokkere etter et hjerteinfarkt. (nhi.no 10.11.2014).)

- Risiko for forgiftning ved brug af propranolol (og andre betablokkere).

(Anm: - Risiko for forgiftning ved brug af propranolol: En rapport fra den engelske sundhedsmyndighed NHS rejser bekymringer vedrørende risikoen for forgiftninger ved brug af den helt almindelige betablokker propranolol. (...) Nationale data fra England viser, at der i perioden fra 2012 til 2017 var 34 pct. øget risiko for overdosis relateret til propranolol. (dagenspharma.dk 20.2.2020).)

- NNT; antall som må behandles for å forebygge ett sykdomstilfelle (number needed to treat, NNT),

(Anm: NNT; antall som må behandles for å forebygge ett sykdomstilfelle (number needed to treat, NNT) (en.wikipedia.org).)

- Antall som er nødvendig å behandle og skade bør inkluderes i forskningsresultater.

(Anm: NNT; antall som må behandles for å forebygge ett sykdomstilfelle (number needed to treat, NNT) (en.wikipedia.org).)

(Anm: NNT; antall som må behandles for å forebygge ett sykdomstilfelle (number needed to treat, NNT) (en.wikipedia.org).)

(Anm: Numbers needed to treat and to harm should be included in research. BMJ 2017;356:j1265  (Published 10 March 2017).)

- Antall som er nødvendig å skade (NNH) er et epidemiologisk mål (bedømming) som indikerer hvor mange personer som i gjennomsnitt trenger å bli utsatt for en risikofaktor over en spesifikk periode for å forårsake en gjennomsnittlig skade hos en person som ellers ikke ville blitt skadet.

(Anm: The number needed to harm (NNH) is an epidemiological measure that indicates how many persons on average need to be exposed to a risk factor over a specific period to cause harm in an average of one person who would not otherwise have been harmed. (en.wikipedia.org).)

- Konfidensintervaller for antallet som er nødvendig å behandle. (- Konfidensintervaller bør alltid oppgis når antall som er nødvendig å behandle er anført.)

(Anm: Confidence intervals for the number needed to treat. (…) Summary points The number needed to treat is a useful way of reporting results of randomised clinical trials - When the difference between the two treatments is not statistically significant, the confidence interval for the number needed to treat is difficult to describe - Sensible confidence intervals can always be constructed for the number needed to treat - Confidence intervals should be quoted whenever a number needed to treat value is given. BMJ. 1998 Nov 7; 317(7168): 1309–1312.)

(Anm: The number needed to harm (NNH) is an epidemiological measure that indicates how many persons on average need to be exposed to a risk factor over a specific period to cause harm in an average of one person who would not otherwise have been harmed. (en.wikipedia.org).)

- Konfidensintervaller for antallet som er nødvendig å behandle. (- Konfidensintervaller bør alltid oppgis når antall som er nødvendig å behandle er anført.)

(Anm: Confidence intervals for the number needed to treat. (…) Summary points The number needed to treat is a useful way of reporting results of randomised clinical trials - When the difference between the two treatments is not statistically significant, the confidence interval for the number needed to treat is difficult to describe - Sensible confidence intervals can always be constructed for the number needed to treat - Confidence intervals should be quoted whenever a number needed to treat value is given. BMJ. 1998 Nov 7; 317(7168): 1309–1312.)

(Anm: How statistics can be misleading - Mark Liddell (ed.ted.com).)

(Anm: The number needed to harm (NNH) is an epidemiological measure that indicates how many persons on average need to be exposed to a risk factor over a specific period to cause harm in an average of one person who would not otherwise have been harmed. (en.wikipedia.org).)

(Anm: Problematic Advice From Suicide Prevention Experts. Hjelmeland, H., Jaworski, K., Knizek, B. L., Marsh, I. Ethical Hum Psychol Psychiatry. 2019; 20:79-85.)

- Hypotesetesting – statistikk. (- Hypotesetesting er en metode i statistikk for testing av hypoteser (teorier) om ukjente størrelser på bakgrunn av innsamlet datamateriale.)

(Anm: hypotesetesting – statistikk. Hypotesetesting er en metode i statistikk for testing av hypoteser (teorier) om ukjente størrelser på bakgrunn av innsamlet datamateriale. Metoden brukes innen statistisk analyse av data som det er knyttet usikkerhet og variasjon til. Man stiller opp en nullhypotese, som kalles H0, og en alternativ hypotese H1. Formålet med testingen er å undersøke om datamaterialet gir grunnlag for å forkaste nullhypotesen med høy grad av sikkerhet, slik at man kan påstå at det er tilstrekkelig bevis for at den alternative hypotesen er sann. Kilde: Store norske leksikon.)

- Hvorfor brukes sjelden ensidige hypotesetester? Mange hypoteser i medisinsk forskning er i utgangspunktet ensidige, for eksempel i et randomisert kontrollert forsøk der man vil undersøke om en ny type medisinsk behandling har bedre effekt enn vanlig behandling (treatment as usual).

(Anm: Hvorfor brukes sjelden ensidige hypotesetester? Mange hypoteser i medisinsk forskning er i utgangspunktet ensidige, for eksempel i et randomisert kontrollert forsøk der man vil undersøke om en ny type medisinsk behandling har bedre effekt enn vanlig behandling (treatment as usual). Hvorfor bruker man da tosidige hypotesetester? La oss for eksempel anta at man registrerer antall suksesser, altså antall som blir friske av sykdommen, i hver av to behandlingsgrupper. Nullhypotesen (H0) er at sannsynligheten for suksess er den samme i hver gruppe. Men hva er alternativhypotesen? Dette er en studie der man vil undersøke om den nye behandlingen har bedre effekt enn standard behandling, altså en overlegenhetsstudie. Da kunne man tenke seg at alternativhypotesen er nettopp dette. Dette kalles en ensidig alternativhypotese, og den tilhørende hypotesetesten og p-verdien kalles ensidig. Hvis man derimot velger en tosidig alternativhypotese, dvs. at den nye behandlingen har en effekt som er forskjellig fra vanlig behandling, får man en tosidig hypotesetest og en tilhørende tosidig p-verdi. Høyere styrke i ensidige tester? (…) Konsensus om tosidige tester Det synes i dag å være konsensus om å bruke tosidige tester innen medisinsk forskning. Det gjelder både i intervensjonsstudier og observasjonelle studier. Det eneste viktige unntaket er ikke-underlegenhetsstudier, der det er riktig å bruke ensidige tester. Tidsskr Nor Legeforen 2021 Publisert: 7. juni 2021.)

- Nullhypotese.

(Anm: nullhypotese. (…) Nullhypotese er en hypotese om at endringer i en gitt årsak ikke påvirker utfallet. Eksempel: Nullhypotesen kan være at det å droppe frokost ikke fører til overvekt. Da er den alternative hypotesen at å droppe frokost fører til overvekt. For å teste en slik hypotese kan man bruke for eksempel eksperimenter og kohortstudier. Kilde: Store norske leksikon.)

- Ny hypotese utfordrer biopsykiatrien.

(Anm: Ny hypotese utfordrer biopsykiatrien. Tidsskrift for psykisk helsearbeid 02 / 2019 (Volum 16).)

(Anm: Habilitet (integritet) (mintankesmie.no).)

- Ny hypotese utfordrer biopsykiatrien.

(Anm: Ny hypotese utfordrer biopsykiatrien. Tidsskrift for psykisk helsearbeid02 / 2019 (Volum 16).)

(Anm: Biologisk psykiatri eller biopsykiatri är en ansats till psykiatrin som siktar på att förstå psykiska sjukdomar genom den biologiska funktionen av nervsystemet. Den är interdisciplinär och berör vetenskaper som neurovetenskappsykofarmakologibiokemigenetik och fysiologi för att bilda teorier om biologiska basen för beteende och psykopatologi.[1] [2] [3] [4] (sv.wikipedia.org).)

- Slik slurver forskere med statistikk. – I forskningens verden er det mye dårlig kompetanse på statistikk. 

(Anm: Slik slurver forskere med statistikk. (forskning.no 10.2.2019).)

- Statistisk svakhet er en utfordring i forskning.

(Anm: Statistisk svakhet er en utfordring i forskning. Urovekkende mange «funn» i forskningen er trolig rent tilfeldige sammenhenger. Men det finnes råd når vi skal ta stilling til nye forskningsresultater, skriver Torstein Låg. (psykologisk.no 14.8.2018).)

(Anm: Fri tilgang til forskningsresultater? (forskningsdata) (mintankesmie.no).)

(Anm: The hidden side of clinical trials | Sile Lane | TEDxMadrid (youtube.com).)

(Anm: Is Your Doctor in Denial? (Nekter din lege å erkjenne fakta?) Undersøkelse viser at leger ofte avviser klager om legemidlers bivirkninger (Survey Finds Physicians Often Dismiss Complaints About Drugs' Side Effects) (washingtonpost.com 28.8.2007).)

- Ikke tro på relative risikoer og oddsratior i abstrakter

Dont believe the relative risks and odds ratios in abstracts (Ikke tro på relative risikoer og odds ratior i abstrakter)
BMJ 2006;333 (29 July)
Significant P values for relative risks and odds ratios in abstracts of published studies should generally be disbelieved, says Gøtzsche on page 231. He compared the distribution of P values in abstracts of 260 randomised trials with that in 260 observational studies (130 cohort studies and 130 case control studies) and checked P values between 0.04 and 0.06. A high proportion of abstracts of randomised controlled trials and observational studies had significant results, although many of these results were derived from subgroup analyses or biased selection of results. Also, errors in analysis and reporting were common.

(Anm: Believability of relative risks and odds ratios in abstracts: cross sectional study. BMJ 2006 333: 231-234.)

(Anm: odds ratio; OR, forholdet mellom to odds. En odds er sannsynligheten for at en gitt hendelse skal inntreffe i forhold til sannsynligheten for at den ikke skal inntreffe. Hvis man i en vitenskapelig studie f.eks. finner at 20 av 100 personer som er blitt utsatt for et giftstoff får en viss sykdom, sier man at oddsen er 20/80 = 0,25. I en kontrollgruppe på 100 personer som ikke er blitt utsatt for giftstoffet, blir 10 syke. Da er oddsen 10/90 = 0,11. Odds ratio, forholdet mellom de to oddsene, er da 0,25/0,11 = 2,25.For sykdommer med sjelden forekomst kan odds ratio benyttes som en tilnærming til relativ risiko. Kilde: Store norske leksikon.)

(Anm: Medisinske tidsskrifter og uavhengighet etc. (mintankesmie.no).)

- Nei, VGs meningsmåling er ikke «fake news» og resultatet er ikke tatt ut av løse luften (- Statistiske tester viser at avstanden mellom dem som ønsker KrF inn i en Støre-ledet regjering og dem som vil ha partiet inn i en Solberg-ledet regjering, er så stor at forskjellen ikke kan være tilfeldig. Dermed har VG dekning for tittelen sin, mens Stavrum ikke har det.) (- 2. Utvalget er lite, noe som i seg selv gir en stor feilmargin. Hadde man trukket de 48 tilfeldig blant KrF-velgere ville en vanlig feilmargin (med 95 % konfidensnivå) vært på 14 prosent. Altså hvis resultatet var 50/50, så ville alt innenfor cirka 35/65 prosent vært innenfor konfidensnivået – i klartekst: Man ville ikke visst om det riktige svaret var 35 prosent eller 65 prosent.)

(Anm: Påstand VGs sjokkmåling er fake news. At et flertall av KrF-velgerne vil ha Støre-regjering er tatt ut av [løse] luften. Gunnar StavrumNettavisen Konklusjon VG skriver at «KrF-velgere vil ha Støre-regjering» basert på en meningsmåling. Nettavisens redaktør Gunnar Stavrum kaller dette «fake news», og hevder det er tatt helt ut av løse luften. Han mener at et utvalg på 48 personer er altfor lite til å si noe som helst om hvilket regjeringsalternativ KrFs velgere ønsker seg. Her tar Stavrum feil, ifølge eksperter på samfunnsvitenskapelig metode. Statistiske tester viser at avstanden mellom dem som ønsker KrF inn i en Støre-ledet regjering og dem som vil ha partiet inn i en Solberg-ledet regjering, er så stor at forskjellen ikke kan være tilfeldig. Dermed har VG dekning for tittelen sin, mens Stavrum ikke har det. Faktisk helt feil Venner lar ikke venner tro på usannheter. Del fakta. (faktisk.no 5.10.2018).)

(Anm: Media (Big Media) (mintankesmie.no).)

(Anm: - Definitivt redaktørmakt. (…) Hva som skal trykkes i en avis er jo gjenstand for en silingsprosess som avisen alene står for. Meg bekjent er det ingen åpenhet hverken i Aftenposten eller i noen andre medier om hvilke standarder som benyttes i utvelgelsen. Er det den redaksjonelle linjen som avgjør? Er det hva som er nyhetsverdig eller er det salgstallene som bestemmer? Eller kanskje avisens politiske orientering? (aftenposten.no 10.11.2016).)

(Anm: NRK og Adresseavisen lot tips om at lærer mobbet egne elever på barneskole i Trondheim ligge. (…) – Svikter barna. (…) Han undrer seg også over at ingen medier stiller kritiske spørsmål til de ansvarlige i kommunen om hvordan mobbingen kunne pågå. (…) NRK og Adresseavisen lot tips om at lærer mobbet egne elever på barneskole i Trondheim ligge. Sjefredaktør Tor Olav Mørseth i Adressa sier det handler om prioriteringer. (journalisten.no 24.2.2017).)

- Sunshine Policies (retningslinjer for åpenhet om interessekonflikter) og mørke skygger over Europa: Offentliggjøring av legemiddelindustriens utbetalinger til helsepersonell i ni europeiske land. (- Er åpenheten om individuelle data obligatorisk og komplett? Flertallet av de frivillige retningslinjer inkluderer en "opt-out" (frameldelse)-klausul i form av et krav om individuelt samtykke, hvilket undergraver betydningen av en åpenhetspolitikk.)

(Anm: Sunshine Policies (retningslinjer for åpenhet om interessekonflikter) og mørke skygger over Europa: Offentliggjøring av legemiddelindustriens utbetalinger til helsepersonell i ni europeiske land. (Sunshine Policies and Murky Shadows in Europe: Disclosure of Pharmaceutical Industry Payments to Health Professionals in Nine European Countries. (...) Er åpenheten om individuelle data obligatorisk og komplette? Flertallet av de frivillige retningslinjer inkluderer en "opt-out" (frameldelse)-klausul, gjennom et krav om individuelt samtykke, hvilket undergraver betydningen av en åpenhetspolitikk. (The majority of the voluntary codes include an “opt-out” clause, through a requirement for individual consent, that undermines the meaning of a transparency policy.) (...) Disclosure rules must follow EFPIA guidelines, but exceptions are allowed when these provisions are in conflict with national laws or regulations. Int J Health Policy Manag 2018 (ePublished: 14 March 2018).)

(Anm: Habilitet (integritet) (mintankesmie.no).)

(Anm: Ny studie: Raddiser er mer skråsikre. (…) Scorer lavt på åpenhet. (…) Lite svekket selvtillit (forskning.no 7.1.2019).)

(Anm: Media (Big Media) (mintankesmie.no).)

(Anm: Interessekonflikter, bestikkelser og korrupsjon (mintankesmie.no).)

- Er leger forskere? (- I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere.)

(Anm: Er leger forskere? (...) De fleste leger følger velkjente mønstre og regler, improviserer ofte rundt disse regler. I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere. (Doctors are not scientists) (Editor's Choice (Redaktørens valg) BMJ 2004;328 (19 June).)

(Anm: For mange retningslinjer for behandlinger er skrevet av eksperter med finansielle konflikter, ifølge studie. (Too many treatment guidelines are written by experts with financial conflicts, study finds). (statnews.com 22.8.2016).)

- Sviket. (- Presidenten i det medisinske vitenskapsakademiet, samt syv av femten medlemmer av retningslinjepanelet for opioider, har udeklarerte bindinger til opioidprodusenter.)

(Anm: Brean A. Sjefsredaktør. Sviket. Firmaet Johnson & Johnson ble nylig dømt i amerikansk rett til å betale giganterstatning for å ha bidratt til den verste legemiddelepidemien i USAs historie. (…) En undersøkelse publisert i BMJ fant at presidenten i det medisinske vitenskapsakademiet, samt syv av femten medlemmer av retningslinjepanelet for opioider, har udeklarerte bindinger til opioidprodusenter. (…) At de akademiske og kliniske medisinske miljøer har misbrukt tillit og sviktet sine pasienter er kanskje det som for ettertiden blir stående som den største skandalen. Tidsskr Nor Legeforen 2019 Publisert: 9. september 2019.)

(Anm: Habilitet (integritet) (mintankesmie.no).)

- Världshälsoorganisationen, WHO, har dragit tillbaka två vägledningar om bland annat opioidbehandling.

(Anm: Världshälsoorganisationen, WHO, har dragit tillbaka två vägledningar om bland annat opioidbehandling. (...) Kritikerna menar att det finns bevis för att en amerikansk läkemedelsjätte lyckats påverka WHO och få in direkt felaktiga påståenden i dokumenten. (lakemedelsvarlden.se 16.1.2020).)

- Korrupt påvirkning/Purdue & WHO. RAPPORT: AVSLØRING AV FARLIG FIRMAPÅVIRKNING PÅ VERDENS HELSEORGANISASJON (WHO)

(Anm: Corrupting influence/Purdue & the WHO. REPORT: EXPOSING DANGEROUS MANUFACTORER INFLUENCE AT THE WORLD HEALTH ORGANISATION (katherineclark.house.gov.no MAY 22 2019).)

(Anm: Interessekonflikter, bestikkelser og korrupsjon (mintankesmie.no).)

- Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie.

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

- Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre.

(Anm: Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre (Editorials. Making patient relevant clinical research a reality. Researchers, funders, and publishers all have work to do.) BMJ 2016;355:i6627 (Published 23 December 2016).)

- Hvordan vise likhet? Hvordan kan man dokumentere at to behandlinger har like god effekt? Det kan man faktisk ikke, men man kan vise at forskjellen i effekt er så liten at den ikke antas å ha klinisk betydning.

(Anm: Hvordan vise likhet? Hvordan kan man dokumentere at to behandlinger har like god effekt? Det kan man faktisk ikke, men man kan vise at forskjellen i effekt er så liten at den ikke antas å ha klinisk betydning. I mange kontrollerte kliniske studier er forskningshypotesen at en ny behandling har bedre effekt enn standardbehandling, men slik er det ikke alltid. Noen ganger ønsker man i stedet å vise at en behandlingsstrategi ikke er dårligere enn en annen, for eksempel at en kortvarig antibiotikakur gir like god terapeutisk effekt som en lengre. Hypoteser I medisinsk forskning er det vanlig å teste hypoteser og beregne p-verdier. Den såkalte nullhypotesen er den hypotesen man ønsker å motbevise. Hvis målet er å vise forskjell mellom to behandlinger, er nullhypotesen at det ikke er forskjell. P-verdien leder enten til å forkaste eller ikke forkaste nullhypotesen. En relativt vanlig misforståelse er at en høy p-verdi (> 5 %) kan tolkes som et uttrykk for at det ikke er forskjell i effekten av to behandlinger. Det er ikke en korrekt anvendelse av en p-verdi (1), og det er ikke slik man dokumenterer likhet (2). Dersom man kunne hevde at to behandlinger var like gode, kun basert på en høy p-verdi, ville det innebære at man kunne «dokumentere likhet» ved hjelp av små studier med så få pasienter at det ville være tilnærmet umulig å avdekke forskjell i effekt. At en nullhypotese ikke kan forkastes betyr på ingen måte at man har vist at den er sann. Tidsskr Nor Legeforen 2017 (Publisert: 28. november 2017).)

- Videnskab er mere end anvendt statistik - kan vi blive fri for p-værdi-tyranni, tak! (- I en ny kommentar publiceret i tidsskriftet Nature opfordrer forfatterne og mere end 800 medunderskrivere til et oprør mod den udbredte praksis med at konkludere på et forskningsprojekt primært på basis af de opnåede p-værdier.)

(Anm: Videnskab er mere end anvendt statistik - kan vi blive fri for p-værdi-tyranni, tak! KOMMENTAR: Det er dejligt, når komplekse ting kan reduceres til noget simpelt. Men nogle gange taber man mere, end man vinder – som for eksempel når videnskabelige studier med vold presses ned i to simple kasser: ’signifikante’ og ’tilfældige’ fund. (…) I en ny kommentar publiceret i tidsskriftet Nature opfordrer forfatterne og mere end 800 medunderskrivere til et oprør mod den udbredte praksis med at konkludere på et forskningsprojekt primært på basis af de opnåede p-værdier. De fremfører, at det snævre fokus på p-værdier alt for ofte fører til, at man afviser i øvrigt vigtige fund som værende tilfældige. De konstaterer også, at meget ens fund beskrives som forskellige, afhængig af om de var ’signifikante’ eller ej. Kort sagt: P-værdier gør mere skade end gavn, mener de – og vi er enige! (videnskab.dk 1.5.2019).)

- Statistisk hypotesetesting, p-verdier, konfidensintervaller, standarddeviasjon, type I og type II-feil, og odds-ratio

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

(Anm: p-verdier; sannsynligheten for at funnene i en vitenskapelig studie ved slump skal ha blitt slik de er dersom nullhypotesen er sann; eller noe enklere og mer unøyaktig uttrykt: Sannsynligheten for at funnene i en vitenskapelig studie skal ha kunnet oppstå ved slump. Begrepet er nær knyttet til hypotesetesting som del av hypotetisk-deduktiv forskningsmetode. Se også statistisk signifikans. Kilde: Store norske leksikon.)

- P-hacking i kliniske studier og hvordan insentiver former fordelingen av resultater over faser.

(Anm: P-hacking in clinical trials and how incentives shape the distribution of results across phases. Significance Statistical significance in clinical trials is a key prerequisite for marketing approval of new drugs. The large economic payoffs at stake might undermine investigators’ ethical obligations and incentivize manipulation of results. This study systematically evaluates the integrity of results reported to the largest registry of clinical trials, ClinicalTrials.gov. Contrary to what has been documented in previous studies of academic publications across a number of disciplines, our analysis does not detect evidence for widespread manipulation of results to clear the 5% threshold for statistical significance. However, we find that the increase in the share of significant results from phase II to phase III can be explained only partially by investigators’ incentives to selectively continue experimentation following favorable early results. Proceedings of the National Academy of Sciences 2020 (Jun 2020).)

- Forskere kan skille årsak fra statistisk sammenheng

Forskere kan skille årsak fra statistisk sammenheng
aftenposten.no 26.6.2014
Uviten Simen Gaure, forsker ved Frisch-senteret

Selv om det kan være vanskelig å skille årsak fra statistisk sammenheng har forskerne verktøyene til å gjøre det.

Vi kan gjøre mer med statistikk enn å vise at to tall beveger seg i takt, vi kan også forklare hvorfor de gjør det.  (…)

Kausalitet
La meg kort bemerke at statistikk som fag er delt i to, deskriptiv statistikk, som handler om å beskrive data med begreper som gjennomsnitt og standardavvik. Dernest er det statistisk inferens, som handler om hvor sikre konklusjoner man kan trekke om fenomener som har et innslag av tilfeldighet, for eksempel fordi man ikke måler helt nøyaktig eller ikke har tilgang til all informasjon, slikt som valgdagsmålinger og klimaberegninger.

En viktig del av praktisk statistisk inferens er kausal inferens, å skille statistisk sammenheng fra årsak. Det ville jo ikke være riktig klokt å prøve å få fuglene til å pare seg i november i håp om at dét skal få russen til å lese til tentamen. Eller omvendt.

Så hvordan kan man gjøre kausal inferens? Vi ser på et tenkt eksempel, si vi skal prøve å finne ut om røyking øker sannsynligheten for lungekreft. Vi vil ikke gjøre medisinske eksperimenter på mennesker, men vi er en eller annen type samfunnsforskere som bruker statistiske metoder på innsamlede data. Da er det et problem med å telle opp lungekreft og røykere og se om det er en korrelasjon, altså statistisk sammenheng, for det kan for eksempel tenkes at folk med begynnende lungekreft begynner å røyke fordi de føler seg bedre av det. Det vil gi en korrelasjon, uten at den nødvendigvis skyldes at røyking er årsak til lungekreft.

Hvis vi nå er heldige har myndighetene økt tobakksavgiften, men forskjellig fra kommune til kommune, etter mynt og kron-metoden. Hvis vi påviser at økning av tobakksavgiften sammenfaller med nedgang i lungekreft er vi et stykke på vei. Avgiften har jo neppe noen direkte virkning på lungene til folk, og ingenting har noen virkning på avgiften som jo er tilfeldig innført. Så effekten går antageligvis via at folk røyker mindre når det blir dyrere. (…)

- Korrelasjonen er relativ. (- Korrelasjonskoeffisienten er et mye brukt mål på sammenheng mellom to variabler.)

(Anm: Korrelasjonen er relativ. Korrelasjonskoeffisienten er et mye brukt mål på sammenheng mellom to variabler. Men ikke alle er klar over at den er et relativt mål som avhenger av hvor homogent datamaterialet er. La oss se på et eksempel: Figur 1 viser høyde og vekt for 166 personer. Pearsons korrelasjonskoeffisient er et mål på grad av lineær sammenheng mellom de to variablene. Korrelasjonen er per definisjon et tall mellom −1 og 1. Dersom punktene ligger perfekt på en rett linje med positivt stigningstall, vil korrelasjonen være lik 1. Dersom det ikke er noen sammenheng, vil korrelasjonen være 0, og dersom punktene ligger perfekt på en linje med negativt stigningstall, vil korrelasjonen være −1 (1). Tidsskr Nor Legeforen 2020 Publisert: 9. november 2020.)

- Sammenlikninger innen randomiserte grupper kan være svært misvisende

Comparisons within randomised groups can be very misleading (Sammenlikninger innen randomiserte grupper kan være svært misvisende)
BMJ 2011; 342:d561 (6 May)
When we randomise trial participants into two or more intervention groups, we do this to remove bias; the groups will, on average, be comparable in every respect except the treatment which they receive. Provided the trial is well conducted, without other sources of bias, any difference in the outcome of the groups can then reasonably be attributed to the different interventions received. In a previous note we discussed the analysis of those trials in which the primary outcome measure is also measured at baseline. We discussed several valid analyses, observing that “analysis of covariance” (a regression method) is the method of choice.1 (...)

(Anm: Uredelighet og fusk (juks/forskningsjuks) i medisinsk forskning. (mintankesmie.no).)

- Hvorfor oversiktsartikler om helseeffekter ved passiv røyking kommer frem til forskjellige konklusjoner

Why Review Articles on the Health Effects of Passive Smoking Reach Different Conclusions (Hvorfor oversiktsartikler om helseeffekter ved passiv røyking kommer frem til forskjellige konklusjoner)
JAMA. 1998;279(19):1566-1570 (May 7)
(...) den eneste faktor som påvirket konklusjonen om at passiv røyking var ufarlig var hvorvidt forfatterne hadde tilknytninger til tobakksindustrien (odds ratio, 88,4; 95% konfidensintervall, 16,4-476,5, p*0.001).”

(Anm: Dette innebærer at middelverdien for odds-ratio er 88,4, at intervallet ligger mellon 16,4 og 476,5, dvs. man kan være mer enn 95% sikker på at dette intervallet inneholder den virkelige middelverdien i den gruppen som er gransket.)

- Statistisk hypotesetesting, p-verdier, konfidensintervaller, standarddeviasjon, type I og type II-feil, og odds-ratio

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

(Anm: p-verdier; sannsynligheten for at funnene i en vitenskapelig studie ved slump skal ha blitt slik de er dersom nullhypotesen er sann; eller noe enklere og mer unøyaktig uttrykt: Sannsynligheten for at funnene i en vitenskapelig studie skal ha kunnet oppstå ved slump. Begrepet er nær knyttet til hypotesetesting som del av hypotetisk-deduktiv forskningsmetode. Se også statistisk signifikans. Kilde: Store norske leksikon.)

- Store navn på statistikk ønsker å ruske opp i svært skadelig P-verdi. En av forskernes favoritter innen statistikk - P-verdien – bør står overfor tøffere standarder, sier ledende forskere.

(Anm: Big names in statistics want to shake up much-maligned P value. One of scientists’ favourite statistics — the P value — should face tougher standards, say leading researchers. (nature.com (26 July 2017).)

- Statistikk er vanskelig, også for forskere. Statistiske tester er en av bærebjelkene i medisinsk forskning. (– Dersom én eller to til hadde overlevd ville p-verdien ha havnet like under 5 prosent. I så fall ville forskerne ha konkludert motsatt: Den nye behandlingen er effektiv!)

(Anm: Atle Fretheim, fagdirektør, Folkehelseinstituttet. Statistikk er vanskelig, også for forskere. Statistiske tester er en av bærebjelkene i medisinsk forskning. Det er et problem. Mange forskere forstår ikke de statistiske tester som de selv benytter, og nå har det skjedd igjen, skriver Atle Fretheim. Som skribentkollega Simen Gaure også var inne på nylig: Mange forskere forstår ikke de statistiske tester som de selv benytter. Nå er det skjedd igjen, til og med i et av de mest prestisjetunge tidsskriftene: Forskerne har misforstått en av de mest grunnleggende statistiske metodene. Det preger måten de rapporterer resultatene på. (…) 100 år gammel metode I nesten 100 år har forskere benyttet en statistisk metode for å forsøke besvare dette spørsmålet. Metoden gir svar på hvor sannsynlig det er å få tilsvarende resultat gitt at behandlingen ikke virker. (…) Magisk grense på 5 prosent Av til dels uklare grunner, har 5 prosent blitt en slags magisk grense for p-verdier i medisinsk forskning: For å kunne konkludere at en behandling virker må p-verdien være under 5 prosent. (…) Dette gir både merkelige og uheldige utslag. Ett ferskt eksempel er altså rapporteringen, av en stor studie i tidsskriftet JAMA, utført av en gruppe garvede forskere. De sammenlignet to forskjellige behandlingsmetoder alvorlig syke pasienter (blodforgiftning). Det var 212 pasienter i hver gruppe. Blant dem som fikk standardbehandling døde 92 (43 prosent), mens det var 74 (35 prosent) som døde blant dem som fikk den nye behandlingen. Dette er en betydelig forskjell, men ettersom p-verdien var så vidt over 5 prosent, konkluderte forskerne at den nye behandlingen var virkningsløs. Dersom én eller to til hadde overlevd ville p-verdien ha havnet like under 5 prosent. I så fall ville forskerne ha konkludert motsatt: Den nye behandlingen er effektiv! Opprop fra forskerne At den mer eller mindre tilfeldig valgte 5-prosentgrensen brukes for å avgjøre om noe virker eller ei, er ganske meningsløst – og en kilde til misforståelser. Nå har mange hundre akademikere sett seg lei på dette og skrevet under et opprop om at denne praksisen bør skrinlegges, en gang for alle. Det høres ut som et godt forslag. (aftenposten.no 15.4.2019).)

- Feilfortolkninger av "p-verdi": en kort ABC for faglig idrettsmedisin. (- Imidlertid ville man ikke endre sin beslutning om å kjøpe et lodd i lotteriet hvis sjansen for å vinne var 4,9 % (p = 0,049) i stedet for 5,1 % (p = 0,051).)

(Anm: Editorial. Misinterpretations of the ‘p value’: a brief primer for academic sports medicine. Introduction When comparing treatment groups, the p value is a statistical measure that summarises the chance (‘p’ for probability) that one would obtain the observed result (or more extreme), if and only if, the treatment is ineffective (ie, under the assumption of the ‘null’ hypothesis). The p value does not tell us the probability that the null hypothesis is true.1 This editorial discusses how some common misinterpretations of the p value may impact sports medicine research. Although presented from a treatment standpoint, the same principles hold for causes or prevention. Probabilities do not translate into yes or no decisions p Values are probabilities, yet often interpreted based on a categorical cut-off, generally at the level of 0.05 (ie, 5%). Anything below is considered a ‘statistically significant difference’ and vice versa. However, one would not change a decision to buy a lottery ticket if the chance of winning was 4.9% (p=0.049i) instead of 5.1% (p=0.051). Consider a study where 100 participants who were given an injury prevention programme had six injuries, and 100 participants in the control group had 13 injuries (p=0.091). If the prevention group had one fewer injury (ie, 5/100 injuries), the results become statistically significant (p=0.048). Is it appropriate to conclude the treatment is ineffective when a single injury changes the results from non-significant to significant? Using a cut-off converts a continuous variable (the probability) into a categorical variable (yes/no). Presenting actual p values rather than simply >0.05 or <0.05 may help readers understand that any cut-off is arbitrary. Misinterpretations of the ‘p value’: a brief primer for academic sports medicine. Br J Sports Med 2017;51:1176-1177.)

- Statistisk hypotesetesting, p-verdier, konfidensintervaller, standarddeviasjon, type I og type II-feil, og odds-ratio

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

- Vitenskapelig metode: Statistiske feil. P-verdier, "gullstandarden" av statistisk gyldighet, er ikke like pålitelige som mange forskere antar.

(Anm: Scientific method: Statistical errors. P values, the 'gold standard' of statistical validity, are not as reliable as many scientists assume. For a brief moment in 2010, Matt Motyl was on the brink of scientific glory: he had discovered that extremists quite literally see the world in black and white. The results were “plain as day”, recalls Motyl, a psychology PhD student at the University of Virginia in Charlottesville. Data from a study of nearly 2,000 people seemed to show that political moderates saw shades of grey more accurately than did either left-wing or right-wing extremists. “The hypothesis was sexy,” he says, “and the data provided clear support.” The P value, a common index for the strength of evidence, was 0.01 — usually interpreted as 'very significant'. Publication in a high-impact journal seemed within Motyl's grasp. (nature.com (12 February 2014).)

(Anm: Statistikk (Big Data), byggstatistikk (bolig), miljø, klima (helsedata) etc (mintankesmie.no).)

Statistical Question
P values or confidence intervals?

BMJ 2013;346:f3212 (17 May 2013)
The effectiveness of topical chloramphenicol in preventing wound infection after minor dermatological surgery was evaluated. Researchers performed a randomised placebo controlled double blind superiority trial. The intervention was a single application of topical chloramphenicol ointment to the sutured wound immediately after suturing. The placebo treatment was a single application of paraffin ointment. In total, 972 minor surgery patients with high risk sutured wounds were recruited. Trial participants were randomised to topical chloramphenicol ointment (n=488) or placebo (n=484). The primary outcome was infection on the agreed day of removal of sutures or sooner if the patient re-presented with a perceived infection.1

The critical level of significance for statistical testing was set at 0.05 (5%). The proportion of participants with an infection was significantly lower in the chloramphenicol group than in the placebo group (6.6% v 11.0%; difference −4.4%, 95% confidence interval −7.9% to −0.8%; P=0.010). The researchers concluded that the application of a single dose of topical chloramphenicol to high risk sutured wounds after minor surgery produced a statistically significant yet moderate absolute reduction in infection rate.

Which of the following statements, if any, are true? (...)

Statistical Question
Confidence intervals: predicting uncertainty
(Konfidensintervaller: forutsigelse av usikkerhet)
BMJ 2012;344:e3147 (9 May)
Researchers evaluated the effectiveness of standardised consultations for patients with osteoarthritis of the knee.1 Standardised consultations involved three goal oriented visits, which comprised education about osteoarthritis and treatment management, as well as information on physical exercises and weight loss. A cluster randomised controlled trial was used. Control treatment was usual care. Participants were recruited from primary care. Inclusion criteria included age 45-75 years and a diagnosis by a rheumatologist of osteoarthritis of the knee according to the American College of Rheumatology clinical and radiological definition. Main outcome measures included change in body weight at four months from baseline. (...)

Innføring i statistikk - med medisinske eksempler
Odd Aalen. Oslo: Ad Notam Gyldendal, 1998, s. 76
(...) En bærende ide i boken er at leseren skal lære såpass mye sannsynlighetsregning at han/hun kan skjønne hva p-verdier og konfidensintervaller egentlig er for noe. Disse begrepene støter en på overalt i forskningslitteraturen, ikke minst i medisin, og forståelsen er ofte dårlig. (...)

Statistisk hypotesetesting er en metode til å trekke slutninger fra usikre data slik at en kan beregne graden av usikkerhet i konklusjonen. (...)

Statisitisk hypotesetesting baserer seg på beregning av en bestemt sannsynlighet (kalt signifikanssansynligheten eller P-verdien. (...)

En annen svært viktig metodikk er de såkalte konfidensintervaller som angir usikkerheten i et statisitisk estimat. (...)

Spørsmålet er hvor grensen for forkastning går. Ofte setter vi den ved 5 %, andre ganger ved 1%. Den grensen en velger, kalles signifikansnivået, eller bare nivået. (...)

Generelt kan en oppfatte p-verdien som et mål for sikkerheten i konklusjonen.

Uttrykket statistisk signifikans vil si at det er lite sannsynlig at det man observerer kan skyldes tilfeldigheter. Selv om en p-verdi viser en mulig statisitisk signifikans behøver det imidlertid ikke nødvendigvis være en klinisk signifikans. Det kan være en tilfeldighet. (...)

(Anm: S E Vollset - Odd O. Aalen red Statistiske metoder i medisin og helsefag. Oslo: Gyldendal Akademisk, 2006.ISBN 82-05-34685-2 (2006) (Tidsskr Nor Lægeforen 2006; 126:2843-4 (211.2006).)

- Gjennomsnitt og standardavvik eller median og kvartiler? (89).

(Anm: Gjennomsnitt og standardavvik eller median og kvartiler? (89). Gjennomsnitt og standardavvik er mye brukte mål på sentraltendens og variasjon i data fra skalavariabler. Dersom dataene ikke er normalfordelt, vil enkelte foretrekke å oppgi median og kvartiler isteden. Men gjennomsnitt og standardavvik har nyttige egenskaper og kan være relevant også når dataene ikke er normalfordelt. La oss starte med å se på normalfordelingen, som er vist i figur 1. Dersom dataene er normalfordelt, vil cirka 16 % av observasjonene være lavere enn ett standardavvik under gjennomsnittet. Og tilsvarende vil cirka 84 % av observasjonene være lavere enn gjennomsnittet pluss standardavviket. Dersom dataene er normalfordelt, vil standardavviket altså være direkte knyttet til 16-prosentilen og 84-prosentilen. Hva med medianen og kvartilene? Siden fordelingen er symmetrisk, vil medianen være lik gjennomsnittet. Kvartilene er per definisjon lik 25-prosentilen og 75-prosentilen, og disse angir derfor i normalfordelingen et litt smalere intervall enn ett standardavvik på hver side av gjennomsnittet. Tidsskr Nor Legeforen 2020 Publisert: 9. juni 2020.)

Forebygging av risiko - Riktig informasjon kan villede

- Forebygging av risiko - Riktig informasjon kan villede
Tidsskr Nor Lægeforen 1997;117:1170-1171
(...) Landets leger har mottatt et et informasjonsbrev datert 14.02.1997 fra MSD (Merck Sharp & Dome) VED direktør Egil BodD. I dette brevet informeres det om at helseminister Gudmund Hernes har sagt på Dagsrevy n at ett av 100 hoftebrudd kan hindres ved bruk av Fosamax (alendronat, MSD), og at sikring av hjem og strøing av fortau ville ha en minst like god effekt til langt lavere kostnader. Videre har Helseministereren meddelt at sikring av hjem og strøing av fortau ville ha en mist like god effekt til langt lavere kostnad. Men ”MSD tror mer på dokumentasjon enn på Gudmund Hernes”. Brevet refererer til dokumentasjonen, som er til å tro på. Slik resultatene fra en referert studie brukes i brevet fra MSD, er det fare for at leger i klinisk praksis, med ansvar for å behandle enkeltindivider, villedes. Dette til tross for at informasjonen som gis ikke er feil. (...)

MSD refererer at dødeligheten kan være så høy som 20 % eter et hoftebrudd. Med påpeker videre at behandling med Fosamax gir 51 % mindre risiko for hoftebrudd. Dette er korrekte tall fra studien for relativ risikovurdering av hoftebrudd.

Hvordan kan så legene bli villedet? I veiledningen av enkeltindivider er isolerte tall for relativ risikovurdering unyttige. Hva trenger leger i klinisk praksis å vite? Jo, blant de 1005 kvinnene i placebogruppen fikk 22 hoftebrudd i denne perioden. Blant de 1022 som ble behandlet med alendronat fikk 11 hoftebrudd. Dvs i løpet av 2,9 år får 2,2 av 100 personer et hoftebrudd hvis de er ubehandlet, en absolutt risiko for å få hoftebrudd på 2,2% i løpet av 2,9 år. Dette reduseres til 1,1 av 100 personer i behandlingsgruppen, dvs en absolutt risiko på 1,1 % i denne gruppen. Absolutt risiko reduksjon er differansen mellom 2,2 og 1,1. Nødvendig antall man må behandle for å forebygge ett hoftebrudd fremkommer som invers verdi av absolutt risiko reduksjon. Absolutt risiko reduksjon blir 1,1 %, og nødvendig antall kvinner som må behandles i 2,9 år for å forebygge ett hoftebrudd blir 91. Men husk, denne effekten gjelder bare for kvinner som tidligere har hatt vertebrale brudd. Hvis disse resultatene brukes som grunnlag for primærprofylakse, dvs som grunnlag for å behandle kvinner med høy risiko, men uten tidligere brudd, får dette to alvorlige konsekvenser: antall personer som behandles mangedobles, og effekten er i beste fall mindre og så langt udokumentert. (...)

Hvis en gruppe på 100 personer som deg følges i 2,9 år uten behandling, vil to personer få hoftebrudd. Jeg vet ikke om du er blant de 98 eller de to. Hvis du derimot er i en gruppe på 100 personer som behandles med Fosamax i 2,9 år, vil én av 100 få hoftebrudd. Jeg vet ikke om du er den ene eller blant de 99. (...)

Pasienten kan da ta stilling til om hun vil være blant de 100 som bruker medisinen i 2,9 år og derved ha sjansen til å være den ene pasienten som «trekker vinnerloddet» og ved hjelp av medisinen unngår hoftebrudd. Hun vil da kunne holde dette opp mot sitt øvrige liv. Det er ikke grunn til å tro at alle vil bedømme denne risikoen likt, ikke alle mennesker er like opptatt av risiko og helse.

Våre innvendinger til MSDs informasjon er derfor:
- Tall for relativ risiko fremstilles som den dokumentasjon man har behov for og skal tro på.
- Det gis utilstrekkleig informasjon om at studien omtaler sekundærprofylakse hos kvinner.”

(Anm: En p-verdi = 0,047 vil si at det er 95,3 % (100 – 0,047) sjanse for at funnet er reelt, og 4,7 % sjanse for at det ikke er det; som tidligere nevnt er det relativt vanlig at 0,05 (5 %) brukes som et såkalt forkastningsnivå. En p-verdi mindre enn 0,001 (0,1%), vil si at det er mer enn 99,9 % (100-0,1) sjanse for at funnet er reelt.)

(Anm: Legemiddelindustrien (Big Pharma) (mintankesmie.no).)

- USAs mest beundrede lovbryter.

(Anm: America's Most Admired Lawbreaker (USAs mest beundrede lovbryter). I løpet av 20 år utviklet Johnson & Johnson et kraftig legemiddel, promoterte det ulovlig overfor barn og eldre, skjulte bivirkninger og tjente milliarder av dollar. Dette er innsidehistorien. (huffingtonpost.com 8.10.2015).)

(Anm: Risperdal / Risperidon (risperidone) (mintankesmie.no).)

(Anm: Tjenestemenn anklaget også firmaene for at de i markedsføringen av legemidler til barn hadde unnlatt å opplyse om at Risperdal (risperidone) kan føre til hormonelle ubalanser som kan føre til brystvevutvikling og infertilitet (barnløshet) hos gutter og jenter. I markedsføringen av legemidlet for behandling av eldre mennesker med demens hadde firmaet opprettet et salgsteam for omsorg for eldre, til tross for at data fra en studie finansiert av Janssen som viste at risperidon doblet risikoen for dødsfall blant eldre mennesker, ifølge statlige tjenestemenn. BMJ 2015;351:h7018 (Published 31 December 2015).)

(Anm: - Således ble bruk av antipsykotika knyttet til en doblet risiko for lungebetennelse hos pasienter med AD (Alzheimers sykdom), og til og med en høyere relativ risikoøkning (3,43 ganger) blant dem uten AD. (…) Resultatene indikerer at bruk antipsykotika er knyttet til en høyere risiko for lungebetennelse uavhengig av alder, anvendt studiedesign, behandlingsvarighet, valg av legemidler eller samtidige sykdommer. (dgnews.docguide.com 30.8.2016).)

(Anm: Among antidementia drugs, memantine is associated with the highest risk of pneumonia. A recent study from the University of Eastern Finland shows that among users of antidementia drugs, persons using memantine have the highest risk of pneumonia. The use of rivastigmine patches is associated with an increased risk as well. (medicalnewstoday.com 24.11.2016).)

- Publikum ønsker tøffere straffetiltak mot uansvarlig atferd i næringslivet.

(Anm: Publikum ønsker tøffere straffetiltak mot uansvarlig atferd i næringslivet. (- Resultatene viste en sterk offentlig bekymring for skjevhet i rettssystemet.) (theconversation.com 25.7.2016).)

- Superrike skattesnytarar. (- Denne verksemda vil ikkje ta slutt før dei som legg til rette for hemmeleghald og skatteunndraging – bankar, advokatar og rådgjevarar – opplever ein reell risiko for å bli straffa for å utføre slike tenester.)

(Anm: Superrike skattesnytarar. (…) Denne verksemda vil ikkje ta slutt før dei som legg til rette for hemmeleghald og skatteunndraging – bankar, advokatar og rådgjevarar – opplever ein reell risiko for å bli straffa for å utføre slike tenester.) (dn.no 3.7.2017).)

- EU-kommissionen visste om VW-fusket.

(Anm: EU-kommissionen visste om VW-fusket. (...) Misstankarna inom kommissionen väcktes till liv när dess experter insåg att luftkvaliteten i städer inte förbättrades som förväntat efter de strängare utsläppskraven för bilar som infördes 2007, enligt Der Spiegel.) (nyteknik.se 15.7.2016).)

(Anm: EU-kommisjonen (Den europeiske unions høyeste organ) (mintankesmie.no).)

- Dieselgates gravplasser 2019. Her står VWs skandale-biler.

(Anm: Dieselgates gravplasser 2019. Her står VWs skandale-biler. Bilder viser 100.000-vis av Volkswagen-biler som står dumpet på flere identiske dieselgate-gravplasser rundt om i USA. (dinside.no 21.7.2019).)

(Anm: Volkswagen mistenkt for å ha villedet EUs investeringsbank. Volkswagen er mistenkt for å ha brukt et lån fra Den europeiske investeringsbanken (EIB) til å utvikle teknologi som åpnet for juks med utslippstester. Sjefen for den europeiske investeringsbanken (EIB) Werner Hoyer er skuffet over Volkswagen. (dn.no 2.8.2017).)

(Anm: VW-chef erkänner bedrägeri. En högt uppsatt chef på tyska Volkswagen (VW) i USA, inblandad i avgasskandalen, erkänner bedrägeri, meddelade en talesperson för domstolen i Detroit på tisdagen. (nyteknik.se 26.7.2017).)

(Anm: VW-topp sier seg skyldig – risikerer 169 år i fengsel. Den tidligere VW-toppen i USA, Oliver Schmidt, innrømmer å ha forsøkt å dekke over utslippsjukset. Nå risikerer han mange år bak murene. (tv2.no 28.7.2017).)

(Anm: Audi-sjefen pågrepet i Tyskland. Audis administrerende direktør Rupert Stadler er pågrepet i Tyskland i forbindelse med etterforskningen av utslippsskandalen. (aftenposten.no 16.6.2018).)

(Anm: Oliver Schmidt jailed for seven years for Volkswagen emissions scam. Judge in Detroit imposes $400,000 fine on former VW executive. German was arrested trying to return home from holiday in Florida (theguardian.com 6.12.2017).)

(Anm: «Dieseljukset» ga betydelig oppjusterte utslipp. Utslippene fra dieseldrevne personbiler de siste årene er justert opp med opp mot 30 prosent som følge av det såkalte utslippsjukset. (ssb.no 14.12.2017).)

(Anm: Disse bildene viser det enorme problemet Volkswagen står oppe i. (…) Juks med dieselutslipp har enorme proposjoner. Dieselskandalen som VW-konsernet har havnet i har proposjoner det nesten er vanskelig å fatte. (…) Av de rundt 600.000 dieselbilene som er solgt i landet som omfattes av skandalen, har bilgiganten forpliktet seg til å kjøpe tilbake over 500.000 biler. 350.000 av disse kjøpene er allerede gjennomført til en kostnad på 7,4 milliarder dollar. (nettavisen.no 19.4.2018).)

(Anm: Tidligere Volkswagen-ingeniør dømt til fengsel. En tidligere ingeniør i Volkswagen får 40 måneders fengsel etter Volkswagen-skandalen. (vg.no 25.8.2017).)

(Anm: Dieselskandalen truer tysk økonomi. Den tyske dieselskandalen utgjør en risiko for landets økonomi, opplyser Tysklands finansdepartement i en rapport mandag. Dieselskandalen oppsto for nesten to år siden, da det ble kjent at Volkswagen jukset med utslippstallene. Her monterer tyske arbeidere dieselmotorer på en Volkswagen-fabrikk i Chemnitz i Tyskland. (dn.no 21.8.2017).)

–  Investorer krever nesten 90 milliarder kroner i erstatning fra Volkswagen i forbindelse med utslippsskandalen. (– Han inngår i konsernets team på rundt 50 advokater.)

(Anm: – Investorer krever nesten 90 milliarder kroner i erstatning fra Volkswagen i forbindelse med utslippsskandalen. (– Vi er overbevist om at vi gjorde det vi skulle, sier Volkswagens advokat Markus Pfüeller. Han inngår i konsernets team på rundt 50 advokater.) (dn.no 10.9.2018).)

-1200 vil dø av utslipp fra Volkswagens «juksebiler».

(Anm: -1200 vil dø av utslipp fra Volkswagens «juksebiler». Amerikanske forskere har undersøkt konsekvensene av utslippsjuks. (…) Det er forskere ved universitetet MIT i USA som har sett nærmere på konsekvensene av Volkswagens utslippsjuks. (dagbladet.no 3.3.2017).)

(Anm: Dieseljuks. Forskere har funnet den skjulte koden i juksebilene til Volkswagen. Gikk langt for å hindre at det var mulig å teste det virkelige utslippet. (…) Nå har de funnet svaret, gjemt i programvaren til bilene, melder University of California San Diego. (…) Resultatene er publisert i en rapport (PDF), som blir lagt frem frem under IEEE Symposium on Security and Privacy i San Francisco denne uken. Under vanlig bruk, slipper bilene ut inntil 40 ganger mer NOx enn tillatt. Utslippsavsløring: Skrur av eksosrensingen allerede ved 17 grader (tu.no 23.5.2017).)

(Anm: Research. The Volkswagen Emissions Scandal Could Shorten Thousands of Lives, Study Says (time.com 3.3.2017).)

(Anm: VW-sjef pågrepet i USA En høytstående sjef i Volkswagen i USA har i kjølvannet av dieselskandalen blitt pågrepet av FBI, mistenkt for bedrageri, ifølge The New York Times. Oliver Schmidt ble ifølge den amerikanske avisa pågrepet lørdag. (nrk.no 9.1.2017).)

(Anm: Volkswagen må betale 36 milliarder kroner etter utslippsjukset. (aftenposten.no 11.1.2017).)

(Anm: Volkswagen trolig spart for milliarder i USA. En dommer i USA har avvist et søksmål mot Volkswagen, noe som kan spare den tyske bilprodusenten for milliarder av dollar i utbetalinger. Avgjørelsen kan avskrekke en rekke amerikanske stater fra å saksøke Volkswagen etter utslippsskandalen som har fulgt bilprodusenten i nesten to år. Den føderale dommeren Charles Breyer avviste søksmålet fra delstaten Wyoming med henvisning til at den aktuelle forurensningsloven må reguleres sentralt og ikke av de amerikanske delstatene. (dn.no 1.9.2017).)

(Anm: Tysk avis: VW-sjefen godkjente dekkoperasjon. Martin Winterkorn, avgått konsernsjef i Volkswagen, godkjente en plan om å holde tilbake informasjon fra amerikanske myndigheter, skriver Bild. (e24.no 26.9.2016).)

- Tidligere Volkswagen-sjef stilles for retten etter dieselskandalen. Bilkonsernet Volkswagens tidligere toppsjef, Martin Winterkorn, stilles for retten for svindel i forbindelse med utslippsskandalen kjent som «dieselgate».

(Anm: Tidligere Volkswagen-sjef stilles for retten etter dieselskandalen. Bilkonsernet Volkswagens tidligere toppsjef, Martin Winterkorn, stilles for retten for svindel i forbindelse med utslippsskandalen kjent som «dieselgate». En domstol i den tyske byen Braunschweig slår fast at det er tilstrekkelig bevis til at 73-åringen potensielt kan bli dømt for kommersiell og organisert svindel. Dermed er tiltalen mot ham godkjent og den tidligere toppsjefen må svare for seg i retten. Dato for rettssaken er ikke bestemt. (e24.no 11.9.2020).)

(Anm: VW må betale 2,8 milliarder dollar i bot for dieseljuks. Beløpet tilsvarer over 24 milliarder kroner. (dagbladet.no 21.4.2017).)

(Anm: Nobelprisvinner trekker seg fra Panama-gransking. (…) Begrunnelsen er at granskingen vanskeliggjøres av hemmelighold og manglende åpenhet.) (…) Pieth sier det blant annet finnes beviser for hvitvasking av penger fra barneprostitusjon i Panama-dokumentene. (dn.no 6.8.2016).)

(Anm: Margaret McCartney: Valgfri offentliggjøring av utbetalinger er meningsløst. (Margaret McCartney: Optional disclosure of payments is pointless.) (- Og åpenhet anskueliggjør problemene: bør de som mottar tusenvis av pund fra industrien som "påtenkte ledere" sitte i paneler for utarbeidelse av nasjonale retningslinjer eller hjelpe til med å stake ut regjeringens politikk?) BMJ 2016;354:i3692 (Published 01 July 2016).)

(Anm: For mange retningslinjer for behandlinger er skrevet av eksperter med økonomiske konflikter, ifølge studie. (Too many treatment guidelines are written by experts with financial conflicts, study finds.) (statnews.com 22.8.2016).)

(Anm: Naturlig at dette er offentlig. OUS-lege Elisabeth Gulowsen Celius samtykket til offentliggjøring av honorarer. Hun er kritisk til kolleger som ikke har gjort det samme. – Det kan reise spørsmål om det er bindinger som ikke tåler dagens lys. (dagensmedisin.no 12.8.2016).)

(Anm: Resultater publisert i JAMA Internal Medicine antyder at ett enkelt gratis måltid kan øke sannsynligheten for at en lege vil foreskrive et bestemt legemiddel. (Findings published by JAMA Internal Medicine suggest that even a single free meal can boost the likelihood a doctor will prescribe a certain drug) (online.wsj.com 20.6.2016).)

(Anm: FDAs rådgivere på opioider sparket grunnet bånd til industrien, ifølge AP. (FDA's advisers on opioids booted for ties to industry, AP learns. Having been buffeted by controversy over its approval of addictive opioid drugs, the FDA is calling on a panel of experts to help it sort through the thorny issue. But even before the new panel met, it has been tinged by controversy itself, dismissing four advisers because of perceived ties to drugmakers.) (fiercepharma.com 8.7.2016).)

(Anm: Offentliggjøring av verdioverføringer. Legemiddelindustrien offentliggjør i dag alle verdioverføringer til helsepersonell og helseforetak. (lmi.no 30.6.2016).)

(Anm: Editorials (Lederartikler). Disclosure UK: transparency should no longer be an optional extra (Disclosure UK: åpenhet (offentliggjøring) bør ikke lenger være valgfritt). BMJ 2016;354:i3730 (Published 06 July 2016).)

(Anm: Disclosure UKs nettsted gir en "illusjon av åpenhet", sier Goldacre (Disclosure UKs nettsted gir en "illusjon av åpenhet", sier Goldacre) (Disclosure UK website gives “illusion of transparency,” says Goldacre) BMJ 2016;354:i3760BMJ 2016; 354 (Published 06 July 2016).)

(Anm: Reporting of financial and non-financial conflicts of interest by authors of systematic reviews: a methodological survey. (…) Conclusions Although close to half of the published systematic reviews report that authors (typically many) have conflicts of interest, more than half report that they do not. Authors reported individual conflicts of interest more frequently than institutional and non-financial conflicts of interest. BMJ Open 2016;6:e011997.)

(Anm: - Legene som deklarerte de høyeste inntektene fra legemiddelfirmaer i Storbritannias nye database uttaler at åpenhet om utbetalingene bør være obligatorisk. (The doctors who declared the most earnings from drug companies in the United Kingdom’s new database have said that being transparent about payments should be mandatory.) BMJ 2016;354:i3716 (Published 04 July 2016).)

(Anm: Leger som mottar de største utbetalingene fra legemiddelfirmaer deklarerer dem ikke på nytt nettsted. (Doctors getting biggest payments from drug companies don’t declare them on new website. BMJ 2016;354:i3679 (Published 01 July 2016).)

(Anm: Association between payments from manufacturers of pharmaceuticals to physicians and regional prescribing: cross sectional ecological study. BMJ 2016;354:i4189 (Published 18 August 2016).)

(Anm: Medisinsk utstyr (mintankesmie.no).)

(Anm: Legemiddelprodusenter og medisinske utstyrsprodusenter betalte i fjor 6,5 milliarder dollar til leger og undervisningssykehus. (Drug and device makers paid $6.5 billion to docs and teaching hospitals last year.) (statnews.com 30.6.2016).)

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. (Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

(Anm: Interessekonflikter vanlig blant forfattere av amerikanske retningslinjer for kreft, ifølge studie. (Conflicts of interest common among US cancer guideline authors, study finds.) BMJ 2016;354:i4660 (Published 25 August 2016).)

(Anm: Selgere i kirurgenes rekker: Relasjoner mellom kirurger og medisinske utstyrsrepresentanter (Salespeople in the Surgical Suite: Relationships between Surgeons and Medical Device Representatives. PLoS ONE 11(8): e0158510).

(Anm: - Nesten ni av 10 leger og forskere som bidro til å utvikle et førende sett med retningslinjer for kreftomsorgen i USA rapporterte finansielle bånd til legemiddelindustrien og medisinske utstyrsfirmaer). (medicalnewstoday.com 30.8.2016).)

(Anm: Ingen gratis lunsj for leger: Sponsede måltider knyttet til flere resepter (No free lunch for docs: Sponsored meals linked to more prescriptions) (mmm-online.com 20.6.2016).)

Handbok i medicinsk och biologisk forskning
Lars Lind. Stockholm: Liber AB, 2001
(...) Ett 95% konfidensintervall brukar oftast förkortas 95% CI och kan anges som (97,145) eller [97,145], med vilket menas att intervallet ligger mellan 97 och 145. Oftast har då gruppens medelvärde angivits före parentesen. 95% CI är altså ett intervall av mätvärden, där man kan vara 95% säker på att detta intervall innehåller det sanna medelvärdet i den population som gruppen valdes ifrån.

Ett exempel: Om vi väljer ut 100 stycken 18-åringar som mönstrar för militärtjänsten och mäter deras systoliska blodtryck så kan medelvärdet vara tex 123 mmHg. Standarddeviationen är 14 mmHg. Ett 95% CI blir då (121,126). Med 95 % säkerhet vet vi därmed att medelvärdet för alla som mönstrar ligger mellan 121 och 126 mmHg.

Ytterligare ett exempel: Om vi i stället bara valde ut 10 stycken, som av en slump hade samma medelvärde, skulle det nya 95 % CI bli vidare (112,136).
Ett exempel: Om vi väljer ut 100 stycken 18-åringar som mönstrar för militärtjänsten och mäter deras systoliska blodtryck så kan medelvärdet vara tex 123 mmHg. Standarddeviationen är 14 mmHg. Ett 95% CI blir då I (121,126). Med 95 % säkerhet vet vi därmed att medelvärdet för alla som!
mönstrar ligger mellan 121 och 126 mmHg.Ytterligare ett exempel: Om vi i stället bara valde ut 10 stycken, som av en slump hade samma medelvärde, skulle det nya 95 % CI bli vidare (112,136).

Med denna mindre grupp vet vi att med 95 % säkerhet ligger medelvärdet for alla som mönstrar mellan 112 och 136 mmHg. Vi ser att när vi plockar ut en mindre grupp kommer vi att kunna ringa in populationens sanna medelvärde sämre. Ur det inser vi intuitivt att ju större grupp vi undersöker, desto närmare det sanna medelvärdet kommer vi. När vi till slut har undersökt alla i populationen har vi ju det sanna medeivardet i populationen!
For att resonemanget om 95 % CI för ett medelvärde skall galla måste följande villkor vara uppfyllda:

  • Variabeln som mats måste vara normalfordelad.
  • Gruppen måste vara slumpvis utvald (randomly selected) ur den underliggande populationen.
  • De utvalda personerna måste vara valda oberoende av varandra, dvs man får inte välja en person t ex bara for att hans granne eller bror har blivit utvald.

Är inte dessa villkor uppfyllda kommer det sanna konfidensintervallet troligen att vara vidare än det beraknade. (...)

Av konvention brukar man i biomedicinsk forskning acceptera att förkasta nollhypotesen om p < 0,05. Detta leder till att man i en del fall förkastar nollhypotesen när i själva verket skillnaden mellan t ex två medelvärden bara berodde på slumpen. Denna typ av fel brukar kallas typ I-fel (eller alfa). Det enda sättet att minska risken för denna typ av fel är att sätta en strängare (= lägre) gräns för p- värdet.

Vi kan även tänka oss det motsatta. Vi ser en klar skillnad mellan medelvärdena i två grupper, men vi får ändå ett p-värde> 0,05. Vi måste då hålla oss kvar vid nollhypotesen och rapportera att vi inte kunde påvisa någon skillnad mellan grupperna även om vi egentligen tror att den finns. Detta fenomen kan ha två förklaringar. Antingen eristerade det ingen skillnad, och då var ju slutsatsen korrekt, eller så var vår studie underdimensionerad, dvs innehöll för få observationer för att adekvat kunna påvisa ett signifikant resultat. Det är tyvärr alltför vanligt att studier är underdimensionerade och att man därför måste hålla kvar vid en nollhypotes som faktiskt inte är riktig. Detta brukar kallas för typ II-fel (eller beta). För att undvika denna typ av fel bör man beräkna gruppstorleken i förväg. Detta behandlas i ett separat avsnitt.

(Anm: confidence; kan oversettes som tillit eller sikkerhet; confidence interval (konfidensintervall) forteller noe om sikkerheten i et statistisk estimat.)

(Anm: confidence interval; In statistics, a confidence interval (CI) is a particular kind of interval estimate of a population parameter and is used to indicate the reliability of an estimate. It is an observed interval (i.e it is calculated from the observations), in principle different from sample to sample, that frequently includes the parameter of interest, if the experiment is repeated. How frequently the observed interval contains the parameter is determined by the confidence level or confidence coefficient. (en.wikipedia.org).)

(Anm: odds; odds, antatt sannsynlighet for å lykkes eller at et visst resultat inntreffer; forholdet mellom gevinst og innsats i veddemål og pengespill. Se også totalisatorspill. Kilde: Store norske leksikon.)

(Anm: (...) Hvis man i en normalfordeling lager et intervall som har sentrum i forventningen og går to standardavvik ut til hver side, dekker det ca. 95% av fordelingen.” Dette intervallet er et såkalt konfidensintervall, hvor tallet 95% kalles konfidenskoefisienten. (Innføring i statistikk med medisinske eksempler av Odd O. Aalen (forfatter). Ad Notam Gyldendal 1998).)

(Anm: Dersom man antar at én pasient i en gruppe på 100 erfarte alvorlige bivirkninger ved bruk av et spesifikt medikament, mens de øvrige 99 ikke erfarte slike bivirkninger, vil odds-ratio være 0,01/0,99=0,0101, dvs. man deler den gruppe som erfarte bivirkninger, med den gruppe som ikke erfarte bivirkninger. Odds-ratio må ikke forveksles med prevalensen (utbredelse av en sykdom målt i antall syke dividert med befolkningstallet), som her vil være 1:100 (1%) eller 0,01 (dvs. ikke 0,0101). I det nevnte eksemplet, hvor prevalensen er relativt lav, er forskjellen mellom de to metodene nærmest ubetydelig, men dersom man tenker seg at halvparten av gruppen hadde erfart bivirkninger, ville odds-ratio vært 0,5/0,5=1, mens prevalensen vil være 50:100=0,5 (50 %). Dette eksemplet viser at det er svært viktig å kunne skille disse to metodene fra hverandre.)

- Leger feiltolker screening

Leger feiltolker screening
Tidsskr Nor Legeforen 2012; 132:1221 (29.5.2012)
Leger anbefaler ofte screeningtester, men mange vet ikke hvordan resultater fra slike tester skal forstås.

Screening er å teste friske personer for sykdom, for eksempel kreft. Screeningstudier kan være vanskelige å tolke, blant annet på grunn av overdiagnostikk og forskyvning av diagnosetidspunkt ved screening (lead-time bias).

413 amerikanske primærleger ble forelagt to scenarioer om effekten av to hypotetiske screeningtester: en som forbedret femårsoverlevelsen og ga tidligere diagnostikk av kreft (irrelevante resultater), en annen som reduserte kreftdødeligheten (relevante resultater), men ga økt kreftforekomst (1). Legene var mer begeistret for den første screeningtesten (som viste at femårsoverlevelsen økte fra 68 % til 99 %) enn for den andre (som reduserte kreftdødeligheten fra 2,0 til 1,6 per 1 000 personer). 69 % av legene ville anbefale den første testen, bare 23 % den andre (p < 0,001). Nesten halvparten av legene mente - feilaktig - at påvisning av flere krefttilfeller ved screening var bevis for at screening redder liv.

- Disse resultatene er nokså nedslående, sier professor Michael Bretthauer ved Oslo universitetssykehus, Rikshospitalet. Han leder en stor internasjonal screeningstudie om tykktarmskreft. - Studien viser at selv ikke leger forstår fordeler og begrensninger ved screeningtester.

Tidlig diagnostikk av kreft fremstår intuitivt som positivt for både leger og allmennhet. Ved omtale av screeningtester bør bare absolutte screeninggevinster med redusert dødelighet brukes, ikke overlevelse og tall om tidlig diagnostisert sykdom. Forskere og medisinskvitenskapelige tidsskrifter har en viktig oppgave i å spre riktig informasjon om screening og forskningsmetoder, sier Bretthauer.

(Anm: Do physicians understand cancer screening statistics? A national survey of primary care physicians in the United States. Ann Intern Med. 2012 Mar 6;156(5):340-9.)

Legemiddelkontroll og statistikk

Fosamax, statistikk og Statens legemiddelkontroll
Tidsskr Nor Lægeforen 1998;118:74) bl.a., sitat.
(...) Et problem i denne sammenheng har vært den manglende vilje ved Statens legemiddelkontroll (SLK) til å sikre seg statistisk fagkunnskap i sin stab. Statistikk er essensielt i kliniske utprøvninger og i enhver vurdering av dokumentasjon for medikamenters effekt. SLK har basert seg på eksterne konsulenter som trekkes inn i enkelte sammenhenger. Dette er åpenbart utilstrekkelig i forhold til det betydelige behovet for slik kunnskap som trengs i et organ som SLK. Det er på høy tid at SLK sørger for å få statistisk ekspertise inn i sin egen stab. SLKs ”motpart” i mange saker, legemiddelindustrien, har for lengst innsett betydningen av slik fagkunnskap og har tildels betydelige fagavdelinger på feltet. SLK kan neppe håndtere industriens økende press uten i noen grad å matche deres faglige kompetanse. (...)

Ledig stilling (web.archive.org)
Statens legemiddelverk. Annonse: Seniorrådgiver – Biostatistiker.
(...) Seniorrådgiver – Biostatistiker.

Medisinsk avdeling.

Ved medisinsk avdeling er det ledig en nyopprettet stilling som seniorrådgiver med tiltredelse snarest. Stillingen inngår i et stimulerende tverrfaglig miljø som arbeider med effekt og sikkerhet av humane og veterinære legemidler, overvåking av legemidler på markedet og kliniske utprøvinger. Avdelingen har en utstrakt kontaktflate både nasjonalt og internasjonalt og deltar i det europeiske samarbeidet for godkjenning av legemidler. Seniorrådgiveren skal i hovedsak bistå seksjon for medisinsk utredning samt seksjon for kliniske utprøvinger. Arbeidsoppgaver:

  • Vurdere statistisk dokumentasjon innsendt i forbindelse med søknader om kliniske utprøvinger og markedsføringstillatelser for nye legemidler samt endringssøknader
  • Gi råd og veiledning til medarbeidere ved medisinsk avdeling i forbindelse med statistiske problemstillinger ved vurdering av kliniske studier
  • Kvalitetssikre utredernes statistiske vurderinger av innsendt klinisk dokumentasjon
  • Intern undervisning innenfor området statistikk
  • Bistå andre avdelinger ved Legemiddelverket i forbindelse med statistiske problemstillinger” (...)

- Er det riktig at etablert osteoporose skal gjøre livet hennes til et mareritt?

Er det riktig at etablert osteoporose skal gjøre livet hennes til et mareritt?
Legemidler og Samfunn (1998;19(8):17) (dvs. "forgjengeren" til Dagens Medisin)
(...) Merck Sharp & Dome (...)

Fosamax® reduserte risikoen for brudd i håndledd og hofte. I den samme undersøkelsen ble det for første gang i en kontrollert studie vist at man kan halvere forekomsten av hofte og håndleddsbrudd, i tillegg til rygg. Den relative risikoen for hoftefrakturer ble redusert med 51 % (11/1022 vs. 22/1005) P= 0,047, og for håndleddsbrudd med 48 % (22/1022 vs. 41/1005) p= 0,013.”

(Anm: p-verdier; sannsynligheten for at funnene i en vitenskapelig studie ved slump skal ha blitt slik de er dersom nullhypotesen er sann; eller noe enklere og mer unøyaktig uttrykt: Sannsynligheten for at funnene i en vitenskapelig studie skal ha kunnet oppstå ved slump. Begrepet er nær knyttet til hypotesetesting som del av hypotetisk-deduktiv forskningsmetode. Se også statistisk signifikans. Kilde: Store norske leksikon.)

Diverse artikler

Converting an odds ratio to a range of plausible relative risks for better communication of research findings
BMJ 2014;348:f7450 (Published 24 January 2014)
Odds ratios are a necessary evil in medical research; although used as a measure of effect size from logistic regressions and case-control studies, they are poorly understood. This paper provides practical advice for authors and readers on converting odds ratios to relative risks (...)

Sample size: how many participants are needed in a trial?
BMJ 2013;346:f1041 (15 February 2013)
Researchers investigated the effectiveness of a home based early intervention on children’s body mass index (BMI) at age 2 years. A randomised controlled superiority trial was used. The intervention consisted of eight home visits from specially trained community nurses in the first 24 months after birth; this was in addition to the usual childhood nursing service from community health service nurses. The control group received the usual childhood nursing service alone. Participants were first time mothers and their infants. The primary outcome was children’s BMI at age 2.1 (...)

Statistical Question
Why randomise in clinical trials?

BMJ 2012;345:e5584 (22 August 2012)
Researchers evaluated the efficacy of a 23-valent pneumococcal polysaccharide vaccine in preventing pneumonia in people at high risk. A randomised, placebo controlled, double blind trial was used. (...)

How to obtain the confidence interval from a P value
BMJ 2011; 343:d2090 (8 August)
Confidence intervals (CIs) are widely used in reporting statistical analyses of research data, and are usually considered to be more informative than P values from significance tests.1 2 Some published articles, however, report estimated effects and P values, but do not give CIs (a practice BMJ now strongly discourages). Here we show how to obtain the confidence interval when only the observed effect and the P value were reported.

The method is outlined in the box below in which we have distinguished two cases. (...)

Relative risks and statistical significance
BMJ 2010;341:c4265 (11 August)
Statistical Question (...)

P Values vs Estimates of Association With Confidence Intervals
Arch Pediatr Adolesc Med. 2010;164(2):193-196 (February)
Since 1988, the International Committee of Medical Journal Editors has used this language in their guidelines for authors: "When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals). Avoid relying solely on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information."1-2 Hundreds of biomedical journals, including the Archives,3 endorse these guidelines. What concerns do editors have about P values and hypothesis testing? (...)

Relative vs. absolute measures of benefit and risk: what's the difference?
Acta Psychiatrica Scandinavica 2009;121(2):94-102
Objective: When appraising evidence clinicians are confronted with two types of comparisons: ratios, such as relative risk, and absolute differences, such as number needed to treat (NNT) or number needed to harm (NNH).

Method: A review of the definition, calculation and interpretation of relative measures such as relative risk, odds ratio and the hazard ratio, and how they are different from absolute measures such as NNT and NNH.

Results: Relative and absolute measures provide different perspectives. Ratios can be misleading and exaggerate clinical differences, but NNT can appear to trivialize the risk of potentially important adverse events.

Conclusion: There is a need to understand both relative and absolute differences in order to make informed decisions. (...)

Migraine and risk of stroke
BMJ 2009;339:b4844 (17 November)
Misleading relative risks?

The absolute risk of stroke in women with migraine is low: 17-19 per 100 000 woman years.1 This roughly equates to one per 5000 women years. The risk increases twofold in migraine with aura, seemingly to two per 5000.

This seems low.

Is the use of relative risk misleading? Are we justified in treating patients with migraine "aggressively for modifiable cardiovascular risk factors"? (...)

Relativa tal viktigare än absoluta
lakemedelsvarlden.se 27.8.2009
När människor fattar beslut om de ska börja en förebyggande läkemedelsbehandling är det mer avgörande med den relativa riskminskningen än den absoluta. Det visar en studie på norska och nordamerikanska patienter. (...)

Det är känt från tidigare studier att patienter som får riskreduktion presenterat i relativa tal, till exempel ”behandlingen minskar risken att drabbas av sjukdom med 50 procent” i högre grad är positiva till den än de som får samma data presenterat i absoluta tal ”risken sjönk från 4 till 2 procent”. (...)

New group aims to detect misuse of statistics by government and media (Ny gruppe har som målsetting å påvise statens og medienes misbruk av statistikk)
BMJ 2009;338:b2469 (18 June)
Published 2009, doi:10.1136/bmj.b2469
A new group that aims to detect and highlight the misuse of statistics was launched on 18 June to help promote the public’s confidence in statistical information.

Straight Statistics, which is supported by a grant from the Nuffield Foundation, will encourage the appropriate use of statistical data by a range of establishments, including the government and the media. It will report its findings on its website (www.straightstatistics.org) and promote its work through reports and conferences.

Together with the charity Sense about Science, which promotes good science among the public, the group is also producing a booklet, Making Sense of Statistics, which will be available in September. It is also supporting the establishment of an all party parliamentary group on statistics. (...)

Statistical question
Study design
BMJ 2009;338:b2381 (17 June)
A clinical trial investigated the effectiveness of topical versus oral ibuprofen for chronic knee pain in people over 50. In designing a trial to decide the best treatment approach, which answer best describes how confounding could be minimised?

a) Double blind trial
b) Intention to treat analyses
c) Matching by age and sex
d) Randomisation of research participants (...)

Hvor "farlige" fødsler?
aftenposten.no 8.8.2009
Dag Moster er barnelege, overlege ved Haukeland universitetssykehus og postdoc-stipendiat ved Universitetet i Bergen
Rolv Terje Lie er professor ved Universitetet i Bergen.
Trond Markestad er barnelege, dr.med. og leder i Rådet for legeetikk
aftenposten.no 8.8.2008
Det er korrekt at noen for tidlig fødte kan få problemer senere i livet. Men de aller fleste for tidlig fødte klarer seg svært godt som voksne. (...)

Et eksempel som kan illustrere hva relativ risiko betyr, er at sjansen for å vinne i Lotto øker 10 ganger hvis en kjøper 10 rekker i stedet for én. Likevel er den reelle sjansen for å vinne fortsatt liten.

Tilsvarende fikk ca. 1 av 1000 barn født til termin og, tross alt, bare 9 av 100 født mer enn tre måneder før termin cerebral parese i vår studie. Så selv om det var 79 ganger så høy risiko var det fortsatt 91 % som ikke hadde cerebral parese av de minste premature. I tallene for risiko er det også mulig at samme barn har flere diagnoser, for eksempel både cerebral parese og psykisk utviklingshemning. Betydningen av funksjonsvansker kan også illustreres ved at 11 av 100 barn som var født mer enn tre måneder før tiden mottok uførestønad mot 2 av 100 født til termin. 89 % av de aller minste premature mottok altså ikke uførestønad. (...)

Ingen grunn til bekymring.
Det vil si at økt overlevelse har ført til at langt flere for tidlig fødte barn overlever i dag uten alvorlige funksjonshemninger. (...)

Ubrukelig undersøkelse
Vegard Nilsen - Overlege, Sørlandet sykehus Kristiansand
dagbladet.no 21.6.2008
(...)Et kjent eksempel fra medisinens verden er kvinners bruk av østrogen. En rekke observasjonsundersøkelser fra ulike deler av verden har vist at kvinner som bruker østrogen får mindre hjertesykdom enn kvinner som ikke bruker det. Dette har gjort at mange leger har gitt dette til sine kvinnelige pasienter og mange kvinner har bedt om å få det av sin lege. Er dette god medisin? For å finne ut av slikt bruker medisinsk vitenskap det som kalles «randomisert kontrollert studie» (RKS). Da ble det samlet en stor gruppe kvinner som ved loddtrekning ble delt i to grupper. Gruppene var like m.t.p. røyking og en rekke andre faktorer som vi vet har betydning på sykdom/død. Kun bruk eller ikke bruk av østrogen var det som skilte dem, halvparten fikk østrogen og de andre «narreøstrogen». Konklusjonen ble det motsatte av hva observasjonsundersøkelsene hadde vist. Bruk av østrogen økte faren for hjertesykdom. Forklaringen er at østrogenbrukende kvinner lever sunnere: de røyker mindre, trener mer og spiser sunnere kost. Den statistiske justeringen til tross, observasjonsundersøkelsen hadde lurt oss. (...)

How to interpret figures in reports of clinical trials
BMJ 2008;336:1166-1169 (24 May)
A picture may be worth a thousand words but in medical research, caution

(...) Summary points
Clinical trials contain four main types of figure: flow diagrams, Kaplan-Meier plots, forest plots, and repeated measures plots
Many published figures have deficiencies in presentation or content
Examples highlight good practice and pitfalls to avoid when interpreting figures (...)

Statistisk signifikans og klinisk relevans
Tidsskr Nor Legeforen 2008; 128:279 (31.1.2008)
Statistikk er et viktig hjelpemiddel i vitenskapelige studier, men brukes for ofte som erstatning for klinisk vurdering av resultatene

I desember 2005 skjedde det noe uventet i det europeiske legemiddelverket EMEA (European Medical Agency). EMEAs komité for humane legemidler (CHMP) avviste en søknad fra Novartis om markedsføringstillatelse for legemidlet tegaserod (1). Saken fikk ingen oppmerksomhet i Norge, men den er av stor betydning for fortolkningen av vitenskapelige studier. (...)

Survey: How Good Are You at Interpreting Conflicting Research?
medpagetoday.com 14.9.2007
A recent study indicated that internal medicine residents are ill-prepared to understand -- and translate into daily practice -- the statistics presented in most published research. (See: Medicine Residents Have Poor Grasp of Biostatistics in Clinical Studies)

Yet today's emphasis on evidence-based medicine demands that clinicians be able to interpret often-conflicting studies and modify their practice accordingly.
Two studies published this week in the Journal of the American Medical Association point up the dilemma. (See: Ups and Downs of Thiazolinediones for Diabetes Assessed by Dueling Meta-Analyses)

These meta-analyses are just the latest chapter in a drug safety controversy over rosiglitazone that has been playing out since May, when an earlier Cleveland Clinic meta-analysis grabbed headlines. (...)

Readers beware (Lesere vær på vakt)
BMJ 2007;334 (14 April)
Editor's Choice
Ikke tro alt du leser. Det er budskapet i flere artikler i denne ukes BMJ. (Don't believe everything you read. That's the message from several articles in this week's BMJ.)

Neill Adhikari and colleagues systematically reviewed the results of 12 clinical trials of nitric oxide in the treatment of acute respiratory distress syndrome (doi: 10.1136/bmj.39139.716794.55). A selective vasodilator, nitric oxide has been widely used in intensive care units because of its demonstrated beneficial effects on oxygenization in critically ill patients. But this meta-analysis of small trials totaling more than 1200 patients found no significant effect on hospital mortality and an increased risk of renal dysfunction. In an accompanying editorial, Niall Ferguson discusses the theoretical advantages of nitric oxide in catastrophic respiratory failure (doi: 10.1136/bmj.39168.568692.BE).

Unfortunately this seems to be a case when physiological improvements do not lead to better clinical outcomes, which Ferguson calls a "recurring theme in critical care." (...)

Journals omit absolute risks
BMJ 2006;333 (16 December)
Absolute risks should be routinely included in abstracts, adjacent to any reported risk ratio, to allow readers to discern the meaning of ratio measures. In a structured review of the accessibility of absolute risk data in six leading journals, including the BMJ, Schwartz and colleagues (10.1136/bmj.38985.564317.7C) examined 222 articles with study designs that allow absolute risks to be calculated. They found 68% of articles failed to report absolute risks in the abstract, and half of these did not report them anywhere in the article. (...)

Websidene er designet og tilrettelagt av Hein Tore Tønnesen © 2009