Om leger og forskeres risikovurderinger

Er relative risici og odds-ratioer i resumeer troværdige?
Sekundærpublikation (Ugeskr Læger 2006;168(33):2678))

Absolutt risiko, vennligst (BMJ 2008;336 (19 January))

Om å lese publiserte resultater Faktisk er de fleste leger ikke kvalifisert til kritisk å vurdere en artikkel. De er aldri blitt trenet til å gjøre det. I stedet må de akseptere bedømmelsen til redaksjonen og dens fagfellegranskere — inntil en av de sjeldne beist skriver og påpeker at en studie er vitenskapelig meningsløs. (BMJ 2004;328 (19 June))

I stedet må de akseptere bedømmelsen til redaksjonen og dens fagfellegranskere — inntil en av de sjeldne beist skriver og påpeker at en studie er vitenskapelig meningsløs. (BMJ 2004;328 (19 June))

- Relativ og absolutt nytteverdi

Norges offentlige utredninger (NOU)
Piller, prioritering og politikk HOD - NOU 1997: 7)
(pdf)
odin.dep.no/hod 30.1.1997
(...) 5.6 EFFEKT - NØKKELBEGREP MED ULIKE DIMENSJONER
Det er ofte vanskelig å vurdere effekter av legemidler. Det er spesielt vanskelig å analysere konsekvensene av legemidler som hovedsakelig brukes til langvarig forebygging og lavrisikointervensjon. (...)

(...) Ofte oppgis effekten av et legemiddel i form av relativ risikoreduksjon. For eksempel innebærer en reduksjon i dødelighet i observasjonsperioden fra 4 til 2 pst en relativ dødelighetsreduksjon på hele 50 pst, selv om den absolutte reduksjonen kun er på 2 pst. Det er viktig å være bevisst på forskjellen mellom disse begrepene. I markedsføringen av legemidler har relativ risiko vært mye brukt. Det er imidlertid ønskelig at informasjon om risikoreduksjoner oppgis både i absolutte og relative tall. Ofte vil det også være klargjørende å anskueliggjøre effekten av behandling gjennom beregninger av hvor mange pasienter det er nødvendig å behandle for å unngå sykdom hos ett individ, på engelsk kalt «number needed to treat». En reduksjon i dødelighet fra 3 til 2 pst i løpet av en viss periode vil f.eks. innebære at man har spart ett liv for hver gruppe på 100 pasienter som er behandlet i perioden. Hos de øvrige 99 pasientene har behandlingen kun medført en utgift og eventuelt gitt bivirkninger. Videre er det nødvendig å vurdere i hvilken grad en behandling forhindrer eller kun utsetter en medisinsk hendelse. (...)

(Anm: Hvordan lese/fortolke studieresultater (statistiske resultater) (mintankesmie.no).)

(Anm: Arvelig uføretrygd? Forskning: Medier må være mer edruelige i sin omgang med forskningsresultater. (aftenposten.no 9.7.2013).)

(Anm: How statistics can be misleading - Mark Liddell (ed.ted.com).)

- Sunshine Policies (retningslinjer for åpenhet om interessekonflikter) og mørke skygger over Europa: Offentliggjøring av legemiddelindustriens utbetalinger til helsepersonell i ni europeiske land. (- Er åpenheten om individuelle data obligatorisk og komplett? Flertallet av de frivillige retningslinjer inkluderer en "opt-out" (frameldelse)-klausul i form av et krav om individuelt samtykke, hvilket undergraver betydningen av en åpenhetspolitikk.)

(Anm: Sunshine Policies (retningslinjer for åpenhet om interessekonflikter) og mørke skygger over Europa: Offentliggjøring av legemiddelindustriens utbetalinger til helsepersonell i ni europeiske land. (Sunshine Policies and Murky Shadows in Europe: Disclosure of Pharmaceutical Industry Payments to Health Professionals in Nine European Countries. (...) Er åpenheten om individuelle data obligatorisk og komplette? Flertallet av de frivillige retningslinjer inkluderer en "opt-out" (frameldelse)-klausul, gjennom et krav om individuelt samtykke, hvilket undergraver betydningen av en åpenhetspolitikk. (The majority of the voluntary codes include an “opt-out” clause, through a requirement for individual consent, that undermines the meaning of a transparency policy.) (...) Disclosure rules must follow EFPIA guidelines, but exceptions are allowed when these provisions are in conflict with national laws or regulations. Int J Health Policy Manag 2018 (ePublished: 14 March 2018).)

(Anm: Habilitet (integritet) (mintankesmie.no).)

(Anm: Media (mediekritikk) (mintankesmie.no).)

(Anm: Interessekonflikter, bestikkelser og korrupsjon (mintankesmie.no).)

- Er relative risici og odds-ratioer i resumeer troværdige?

Er relative risici og odds-ratioer i resumeer troværdige?
Sekundærpublikation
Ugeskr Læger 2006;168(33):2678
Det første resultat i 520 resumeer, hvori man angav relative risici eller odds-ratioer, var statistisk signifikant i 70% af de randomi-serede forsøg, 84% af kohortestudierne og 84% af case-kontrol-studierne. Mange resultater kom fra subgruppeanalyser eller sekundære analyser, eller biasede udvalg af resultater. Fordelingen af p-værdier i intervallet 0,04-0,06 var ekstremt skæv for randomiserede forsøg, men de fleste signifikante resultater var forkerte, meget tvivlsomme eller kunne diskuteres. Skævheden var endnu større i observationelle studier. Signifikante resultater i resumeer bør tolkes meget varsomt. (...)

(Anm: Statlig legemiddelkontroll (Statens legemiddelverk etc.) (mintankesmie.no).)

(Anm: Statlig hvitvasking av legemiddelinformasjon (Tidsskr Nor Legeforen 2010; 130:368 (25.2.2010).)

(Anm: Forskning bliver farlig, når de negative resultater glemmes. (…) Nyt dansk studie viser problemet. (...) For få negative resultater leder til falske konklusioner. (…) Manglende negative resultater har kostet liv. (…) Vores model viser, at vi er nødt til at få publiceret mindst 20 procent af de negative resultater, der produceres inden for hvert forskningsfelt, hvis vi skal undgå at lave falske antagelser om videnskabelig fakta. (videnskab.dk 5.1.2017).)

(Anm: Legemiddelindustriens fortjeneste var nesten det dobbelte av utgifter til forskning og utvikling (FoU-utgifter) i 2013, 2014 og 2015. (Pharmaceutical Industry Profits Are Nearly Double R&D Costs in 2013, 2014 and 2015) (…) En primær unnskyldning som legemiddelindustrien bruker for «prisøkning» er de høye kostnadene for forskning og utvikling (FoU) som disse firmaene betaler for å få nye legemidler på markedet. (citizen.org 27.3.2017).)

- Dette skjoldet av patenter beskytter verdens bestselgende legemiddel.

(Anm: Dette skjoldet av patenter beskytter verdens bestselgende legemiddel. (- Produktet med 16 milliarder dollar i årsomsetning. (...) - Det har dessuten vært tilgjengelig i nærmere 15 år. (…) Den virkelige utfordringen var den tilsynelatende ugjennomtrengelige festningen av patenter som AbbVie metodisk har bygget rundt sin verdsatte pengemaskin. (…) Humira, som står for mer enn 60 prosent av AbbVies inntekter har en listepris på mer enn 50 000 dollar per pasient. (bloomberg.com 7.9.2017).)

- Motarbeidet AbbVie konkurranse urettmessig ved å skape en "patent-fortykning" for legemidlet Humira?

(Anm: Did AbbVie unfairly thwart competition by creating a ‘patent thicket’ around its Humira drug? In a little noticed order, a federal judge recently raised the intriguing possibility that a so-called patent thicket — a large number of patents that a drug maker obtains to thwart rivals — might stifle competition if the patents were established as the result of some misbehavior. The order was issued last month in a lawsuit filed by AbbVie (ABBV), which is seeking to prevent Boehringer Ingelheim from marketing a biosimilar version of its Humira rheumatoid arthritis treatment. The medicine generated nearly $12.4 billion in sales last year in the U.S. alone for AbbVie and is protected by dozens of patents, many of which do not expire until 2022. (statnews.com 26.7.2018).)

(Anm: Myten om mediers åpenhet. Hvorfor er virkelig fordomsfri og frisinnet debatt uvanlig? Hvorfor så få nye, uavhengige meningsytrere? Hvorfor møter mediene dem dels med motstand, dels med taushet? (aftenposten.no 7.9.2006).)

(Anm: Er det en reproduserbarhetskrise i vitenskapelig forskning? (Is there a reproducibility crisis in science?) (…) Nyere studier, som undersøkte en rekke publiserte legemiddelstudier, klarte å gjenskape resultatene for mindre enn 25 % av dem - og tilsvarende resultater er blitt funnet i andre vitenskapelige disipliner. Hvordan bekjemper vi denne krisen for vitenskapelig ikke-reproduserbarhet? (ed.ted.com).)

(Anm: Spinn i randomiserte kontrollerte studier (RCT) på angstlegemidler (antidepressiva) med et positivt opprinnelig resultat: en sammenligning av bekymringer uttrykt av den amerikanske legemiddelkontrollen FDA og den publiserte litteratur. (Spin in RCTs of anxiety medication with a positive primary outcome: a comparison of concerns expressed by the US FDA and in the published literature.) BMJ Open. 2017 Mar 29;7(3):e012886.)

(Anm: LEGEMIDDELPENGER – FDA er avhengig av industrifinansiering; penger kommer «festet med strikk» (DRUG MONEY. FDA Depends on Industry Funding; Money Comes with “Strings Attached”) (pogo.org 1.12.2016).)

(Anm: LEGEMIDDELPENGER - I FDA-møter er "pasientstemmene" ofte finansiert av legemiddelfirmaer (DRUG MONEY - In FDA Meetings, "Voice" of the Patient Often Funded by Drug Companies) (pogo.org 3.12.2016).)

(Anm: Recommendations to improve adverse event reporting in clinical trial publications: a joint pharmaceutical industry/journal editor perspective. BMJ 2016;355:i5078 (Published 03 October 2016).)

(Anm: - Hadde medisinerne på et tidligere tidspunkt hatt et evolusjonært perspektiv på sin medisinering, ville vi ikke vært i den kritiske situasjon vi er kommet i med hensyn til resistens. (aftenposten.no 22.8.2016).)

- Relative vs. absolute measures of benefit and risk: what's the difference?

Relative vs. absolute measures of benefit and risk: what's the difference?
Acta Psychiatrica Scandinavica 2009;121(2):94-102
Objective: When appraising evidence clinicians are confronted with two types of comparisons: ratios, such as relative risk, and absolute differences, such as number needed to treat (NNT) or number needed to harm (NNH).

Method: A review of the definition, calculation and interpretation of relative measures such as relative risk, odds ratio and the hazard ratio, and how they are different from absolute measures such as NNT and NNH.

Results: Relative and absolute measures provide different perspectives. Ratios can be misleading and exaggerate clinical differences, but NNT can appear to trivialize the risk of potentially important adverse events.

Conclusion: There is a need to understand both relative and absolute differences in order to make informed decisions. (...)

Hvordan lese vitenskapelige artikler

Making raw data more widely available (Å gjøre rådata mer alminnelig tilgjengelig)
BMJ 2011; 342:d2323 (4 May)
New initiative by the Wellcome Trust sets out some guiding principles

Medical investigators routinely refuse to share data from medical studies, seeming to regard such data as private property rather than a public resource for the benefit of medical science and future generations of patients. One survey found that 75% of pharmaceutical researchers were opposed in principle to making raw data available.1 Two studies have found that only a minority of researchers (10% and 25%) share data when publishing in journals with explicit policies that raw data must be made available.2 3 Even in genomics research, where the principle that microarray data should be deposited in a publicly accessible database is widely accepted, many published studies do not have an associated data set publicly available.4 5

The benefits of sharing raw data from medical studies have been widely discussed.6 7 8 9 Data sharing ensures reproducibility, allows testing of secondary hypotheses, facilitates development of new statistical methods, provides a resource for teaching, aids design of new studies, simplifies data acquisition for meta-analysis, and helps prevent fraud and selective reporting. (...)

(Anm: Medisinske tidsskrifter og uavhengighet etc. (mintankesmie.no).)

- Er leger forskere? (- I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere.)

(Anm: Er leger forskere? (...) De fleste leger følger velkjente mønstre og regler, improviserer ofte rundt disse regler. I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere. (Doctors are not scientists) (Editor's Choice (Redaktørens valg) BMJ 2004;328 (19 June).)

(Anm: For mange retningslinjer for behandlinger er skrevet av eksperter med finansielle konflikter, ifølge studie. (Too many treatment guidelines are written by experts with financial conflicts, study finds). (statnews.com 22.8.2016).)

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. (Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

- Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre.

(Anm: Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre (Editorials. Making patient relevant clinical research a reality. Researchers, funders, and publishers all have work to do.) BMJ 2016;355:i6627 (Published 23 December 2016).)

- Absolutt risiko, vennligst

Absolute risk please (Absolutt risiko, vennligst)
Editor's Choice (Fiona Godlee, editor, BMJ)
BMJ 2008;336 (19 January)
The BMJ has a noble tradition of fighting the trend to medicalise risk factors (BMJ 2002;324:886-91; doi: 10.1136/bmj.324.7342.886). This week we hear more about whether we should be treating women who have "pre-osteoporosis," otherwise known as osteopenia—bone mineral densities that are slightly below normal. These women are at low risk of fracture but are considered by some to be "at risk of being at risk." They comprise more than half of the world’s postmenopausal women.

Pablo Alonso-Coello and colleagues examine four post hoc analyses of trials of osteoporosis drugs that claim to support drug treatment for osteopenia (p 126; doi 10.1136/bmj.39435.656250.AD). They find that the benefits of treatment in these low risk women are overstated and the harms underplayed. They urge clinicians to base treatment decisions on absolute rather than relative risk. It’s a lesson worth repeating: "impressive sounding reductions in relative risk can mask much smaller reductions in absolute risk." (...)

Hvordan lese vitenskapelige artikler
Tidsskr Nor Lægeforen 2007; 127: 2291 (6.9.2007)
David Bowers Allan House David Owens
Understanding clinical papers - 2. utg. 232 s, tab, ill. Chichester: Wiley, 2006. Pris GBP 23 - ISBN 978-0-470-09130-2 (...)

Forfatternes hovedgrep er å bruke utdrag fra en rekke vitenskapelige artikler og å utstyre dem med snakkebobler og piler som peker inn på tekst, tabeller og figurer. I tillegg gis kortfattede og instruktive forklaringer i den løpende teksten. Dette er klinisk undervisning i praksis - pek og forklar - med den forskjell at pasientene er byttet ut med artikkelutdrag. (...)

Dette er imidlertid ingen lærebok i medisinsk statistikk, epidemiologi eller forskningsmetode. Den gir ingen grunnleggende forståelse for begreper og metoder, men lesere som får med seg alt som står her, vil stå godt rustet til å gi seg i kast med den vitenskapelige litteraturen. (...)

(Anm: Medisinske tidsskrifter og uavhengighet etc. (mintankesmie.no).)

- Hvordan vise likhet? Hvordan kan man dokumentere at to behandlinger har like god effekt? Det kan man faktisk ikke, men man kan vise at forskjellen i effekt er så liten at den ikke antas å ha klinisk betydning.

(Anm: Hvordan vise likhet? Hvordan kan man dokumentere at to behandlinger har like god effekt? Det kan man faktisk ikke, men man kan vise at forskjellen i effekt er så liten at den ikke antas å ha klinisk betydning. I mange kontrollerte kliniske studier er forskningshypotesen at en ny behandling har bedre effekt enn standardbehandling, men slik er det ikke alltid. Noen ganger ønsker man i stedet å vise at en behandlingsstrategi ikke er dårligere enn en annen, for eksempel at en kortvarig antibiotikakur gir like god terapeutisk effekt som en lengre. Hypoteser I medisinsk forskning er det vanlig å teste hypoteser og beregne p-verdier. Den såkalte nullhypotesen er den hypotesen man ønsker å motbevise. Hvis målet er å vise forskjell mellom to behandlinger, er nullhypotesen at det ikke er forskjell. P-verdien leder enten til å forkaste eller ikke forkaste nullhypotesen. En relativt vanlig misforståelse er at en høy p-verdi (> 5 %) kan tolkes som et uttrykk for at det ikke er forskjell i effekten av to behandlinger. Det er ikke en korrekt anvendelse av en p-verdi (1), og det er ikke slik man dokumenterer likhet (2). Dersom man kunne hevde at to behandlinger var like gode, kun basert på en høy p-verdi, ville det innebære at man kunne «dokumentere likhet» ved hjelp av små studier med så få pasienter at det ville være tilnærmet umulig å avdekke forskjell i effekt. At en nullhypotese ikke kan forkastes betyr på ingen måte at man har vist at den er sann. Tidsskr Nor Legeforen 2017 (Publisert: 28. november 2017).)

- Er leger forskere? (- I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere.)

(Anm: Er leger forskere? (...) De fleste leger følger velkjente mønstre og regler, improviserer ofte rundt disse regler. I sin arbeidsmetodikk er de mer lik jazzmusikere enn forskere. (Doctors are not scientists) (Editor's Choice (Redaktørens valg) BMJ 2004;328 (19 June).)

(Anm: For mange retningslinjer for behandlinger er skrevet av eksperter med finansielle konflikter, ifølge studie. (Too many treatment guidelines are written by experts with financial conflicts, study finds). (statnews.com 22.8.2016).)

(Anm: Legemiddelkonsulenter forteller leger lite om sideeffekter, ifølge studie. (Drug Reps Tell Docs Little of Side Effects: Survey) (Journal of General Internal Medicine 2013 (April).)

- Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre.

(Anm: Lederartikler. Å gjøre pasientrelevant klinisk forskning til en realitet. Forskere, bidragsytere (sponsorer; finansiører) og utgivere har alle et arbeid å gjøre (Editorials. Making patient relevant clinical research a reality. Researchers, funders, and publishers all have work to do.) BMJ 2016;355:i6627 (Published 23 December 2016).)

- Spin avslørt i mer enn halvparten av konklusjoner i rapportering fra negative forsøk

Industry-paid studies likely to favor company drug (Studier betalt av industrien favoriserer høyst sannsynlig firmaets legemiddel)
reuters.com 2.8.2010
(Reuters Health) - Når legemiddelfirmaene finansierer studier på sine egne produkter er det mye mer sannsynlig at resultatene er positive enn når staten tar regningen, uttalte amerikanske forskere mandag. (- When drugmakers fund studies of their own products, the results are much more likely to be positive than when the government picks up the bill, US researchers said Monday.)

De fant at omtrent 85 prosent av industristøttede studier rapporterte positive resultater, sammenliknet med bare halvparten av de med statlig finansiering. Blant de nesten 550 studier av vanlige legemidler som forskerne undersøkte, var trefjerdedeler av de som hadde blitt publisert i medisinske tidsskrifter støttet av industrien. (They found that about 85 percent of industry-backed studies reported positive outcomes, compared to only half of those with federal funding. Among the nearly 550 studies of common drugs the researchers examined, three-quarters of those that had been published in medical journals had industry backing)

(Anm: Outcome Reporting Among Drug Trials Registered in ClinicalTrials.gov. Ann Intern Med 2010;153:158-166 (August 3).)

Spin found in more than half of abstract conclusions in reports of negative trials (Spin avslørt i mer enn halvparten av konklusjoner i rapportering fra negative forsøk)
BMJ 2010;340:c2873 (2 June) (British Medical Journal)
Short Cuts - All you need to read in the other general journals
JAMA 2010;303:2058-64[Abstract/Full Text]
Hvor ofte fremstilles negative forsøk som positive, og hvordan gjøres det? En studie forsøkte å besvare disse spørsmålene ved å granske alle rapporter av parallelle gruppeforsøk med ikke-signifikante resultater for opprinnelige sluttresultater, som ble publisert i desember 2006 og indeksert i PubMed. I de 72 identifiserte arbeider, 49 (68 %) abstrakter og 44 (61 %) hovedtekster, fant man minst én fordreid presentasjon eller "spin," som ble definert som spesifikke rapporteringsstrategier, uten hensyn til motivet, med det formål å presentere den eksperimentelle behandlingen som nyttig til tross for en ikke-statistisk forskjell i det opprinnelige sluttresultatet, eller målsetning om å lede leseren bort fra ikke-signifikante resultater. (How often are negative trials made to look positive, and how is this done? A study tried to answer these questions by examining all reports of parallel group trials with non-significant results on primary outcomes, which were published in December of 2006 and indexed in PubMed. In the 72 identified papers, 49 (68%) abstracts and 44 (61%) main texts were found to have at least one distorted presentation or "spin," which was defined as the use of specific reporting strategies, regardless of the motive, with the aim of presenting the experimental treatment as beneficial despite a statistically non-significant difference for the primary outcome, or the aim of distracting the reader from statistically non-significant results.)

In 13 articles a spin was found in the title. In abstracts, 27 (38%) results sections and 42 (58%) conclusion sections had at least one spin. In the main texts, this was 21 (29%), 31 (43%), and 36 (50%) for the results, discussion, and conclusions sections, respectively. (...)

Spin kan være tilsiktede forsøk på å villede leseren eller det kan være et resultat av manglende kunnskap eller ikke bevisst bias. (...) (Spins may be a deliberate attempt to mislead the reader or they may be the result of poor knowledge or an unconscious bias.)

(Anm: Bias [baies] -en, - skjevhet i vitenskapelig undersøkelse el. resultat pga. mangelfull systematikk i innsamlingen av data. Etym.: eng., fr. biais helning, tendens. Kilde: ordnett.no.)

(Anm: Bias; (...) valg og vurderinger som på systematisk måte avviker fra det som er faktisk korrekt. Kilde: Store norske leksikon.)

(Anm: Legemiddeletterlevelse (Tas legemidler som foreskrevet?) (Adherence to Medication.) (…) Legemidler virker ikke på pasienter som ikke tar dem. (Drugs don't work in patients who don't take them.)  (NEJM 2005;353:487-497(August 4).)

(Anm: Reporting and Interpretation of Randomized Controlled Trials With Statistically Nonsignificant Results for Primary Outcomes. JAMA. 2010;303(20):2058-2064. (May 26).)

(Anm: Medisinske tidsskrifter og uavhengighet etc. (mintankesmie.no).)

Feilaktige sammenligningende metaanalyser av psykoterapi og farmakoterapi

Flawed Meta-Analyses Comparing Psychotherapy With Pharmacotherapy (Feilaktige sammenligningende Metaanalyser av psykoterapi og farmakoterapi)
Am J Psychiatry 2000;157:1204-11
(...) KONKLUSJONER: Tallrike typer studier eksemplifiserer behovet for å utvise forsiktighet når det gjelder å evaluere konklusjoner i metaanalyser uten først kritisk å ha gransket de studier som er inkludert. Vurderinger av den relative effekt fra ulike behandlinger er ikke velbegrunnet når de nesten utelukkende indirekte er basert på en mangedobling av dårlig utførte sammenligninger. Metaanalyser basert på feilaktige studier eller studier som mangler bevisførsel er likeså utilstrekkelig hva kritikk av retningslinjene for behandling angår. Noen av dataene er ikke tilstrekkelige til å understøtte en adekvat meta-analyse. (...) (CONCLUSIONS: Numerous types of studies exemplify the need for caution in evaluating meta-analytic conclusions without first critically examining the included studies. Estimates of the relative efficacy of different treatments are not well founded when based almost exclusively on indirect, multiply confounded comparisons. Meta-analyses based on flawed studies or studies that lack demonstrated assay sensitivity are also inadequate for the criticism of treatment guidelines. Some bodies of data are inadequate to support a proper meta-analysis.)

Metaanalyser av forsøk som sammenligner antidepressiva med aktive placebo

Meta-analysis of trials comparing antidepressants with active placebos (Metaanalyser av forsøk som sammenligner antidepressiva med aktive placeboer)
Br J Psychiatry 1998;172:227-31
(...) KONKLUSJONER: Metaanalyser er svært sensitive for beslutninger om eksklusjoner. Tidligere generelle metaanalyser har funnet kombinerte effektstørrelser i området 0,4 - 0,8. De mer konservative vurderinger som er gjort her tyder på at ublindet effekt kunne blåse opp effekter for antidepressiva i forsøk som bruker uvirksom placebo. (...) (CONCLUSIONS: Meta-analysis is very sensitive to decisions about exclusions. Previous general meta-analyses have found combined effect sizes in the range 0.4-0.8. The more conservative estimates produced here suggest that unblinding effects may inflate the efficacy of antidepressants in trials using inert placebos.)

Legemiddel versus placebo

The Powerful Placebo: From Ancient Priest to Modern Physician (Den sterke placebo: Fra fortidens prest til moderne lege)
Arthur K. Shapiro, M.D & Elaine Shapiro PH. D. 1997 (ISBN 0-8018-55691-I)
(...) En alvorlig reservasjon angående gyldigheten av disse og andre kontrollerte legemiddelstudier er at uvirksom placebo er brukt i stedet for aktiv placebo som etterlikner sideeffekter av det eksperimentelle legemidlet som blir evaluert (Blumenthal et al 1974). (A serious reservation about the validity of these and other controlled studies of drugs is that inert placebos were used instead of active placebo that mimic the side effects of the experimental drug being evaluated (Blumenthal et al 1974)). (...)

Et stadig voksende materiale viser at når aktiv placebo blir brukt i kontrollerte studier for antidepressiva og andre legemidler, er det aktive legemidlet knapt bedre enn placebo, hvis det, i det hele tatt, er bedre enn placebo. (...) (A growing literature demonstrates that if active placebo controls are used in studies of antidepressant and other drugs, the active drug is only slightly, if at all, better than placebo.)

Diverse artikler

Converting an odds ratio to a range of plausible relative risks for better communication of research findings
BMJ 2014;348:f7450 (Published 24 January 2014)
Odds ratios are a necessary evil in medical research; although used as a measure of effect size from logistic regressions and case-control studies, they are poorly understood. This paper provides practical advice for authors and readers on converting odds ratios to relative risks (...)

Riktig definisjon av p-verdi?
Tidsskr Nor Legeforen 2013; 133:500 (5.3.2013)
I en leder i Tidsskriftet i nr. 1/2013 hevder Eva Skovlund at en p-verdi vil gi svar på følgende spørsmål: «Hva er sannsynligheten for at det resultatet vi observerer (eller et enda «skjevere» resultat) har oppstått på grunn av tilfeldighet?» (1). Dette stemmer ikke, p-verdien sier ingenting om sannsynligheten for at et resultat er tilfeldig eller ikke.

En p-verdi gir derimot svar på spørsmålet: Hva er sannsynligheten for å få en testverdi som er minst like stor som den vi faktisk observerte, gitt at nullhypotesen er sann.

Skovlund E. Spør først, regn siden. Tidsskr Nor Legeforen 2013; 133: 10. [PubMed] (...)

E. Skovlund svarer:
Tidsskr Nor Legeforen 2013; 133:500 – 1 (5.3.2013)
Det var ikke helt uventet av enkelte ville reagere på min formulering. Samuelsens definisjon er selvfølgelig den formelt korrekte. Bakgrunnen for mitt valg er følgende: I medisinske artikler omhandler hovedtyngden av rapporterte p-verdier en sammenlikning av to grupper, og nullhypotesen er nesten uten unntak at sant gjennomsnitt eller andel er lik i de to gruppene. I denne sammenhengen er min formulering dekkende. Det lave presisjonsnivået er valgt med hensikt. Den formelle definisjonen finner man i alle lærebøker i statistikk. (...)

Sample size: how many participants are needed in a trial?
BMJ 2013;346:f1041 (15 February 2013)
Researchers investigated the effectiveness of a home based early intervention on children’s body mass index (BMI) at age 2 years. A randomised controlled superiority trial was used. The intervention consisted of eight home visits from specially trained community nurses in the first 24 months after birth; this was in addition to the usual childhood nursing service from community health service nurses. The control group received the usual childhood nursing service alone. Participants were first time mothers and their infants. The primary outcome was children’s BMI at age 2.1 (...)

Leger feiltolker screening
Tidsskr Nor Legeforen 2012; 132:1221 (29.5.2012)
Leger anbefaler ofte screeningtester, men mange vet ikke hvordan resultater fra slike tester skal forstås.

Screening er å teste friske personer for sykdom, for eksempel kreft. Screeningstudier kan være vanskelige å tolke, blant annet på grunn av overdiagnostikk og forskyvning av diagnosetidspunkt ved screening (lead-time bias).

413 amerikanske primærleger ble forelagt to scenarioer om effekten av to hypotetiske screeningtester: en som forbedret femårsoverlevelsen og ga tidligere diagnostikk av kreft (irrelevante resultater), en annen som reduserte kreftdødeligheten (relevante resultater), men ga økt kreftforekomst (1). Legene var mer begeistret for den første screeningtesten (som viste at femårsoverlevelsen økte fra 68 % til 99 %) enn for den andre (som reduserte kreftdødeligheten fra 2,0 til 1,6 per 1 000 personer). 69 % av legene ville anbefale den første testen, bare 23 % den andre (p < 0,001). Nesten halvparten av legene mente - feilaktig - at påvisning av flere krefttilfeller ved screening var bevis for at screening redder liv.

- Disse resultatene er nokså nedslående, sier professor Michael Bretthauer ved Oslo universitetssykehus, Rikshospitalet. Han leder en stor internasjonal screeningstudie om tykktarmskreft. - Studien viser at selv ikke leger forstår fordeler og begrensninger ved screeningtester.

Tidlig diagnostikk av kreft fremstår intuitivt som positivt for både leger og allmennhet. Ved omtale av screeningtester bør bare absolutte screeninggevinster med redusert dødelighet brukes, ikke overlevelse og tall om tidlig diagnostisert sykdom. Forskere og medisinskvitenskapelige tidsskrifter har en viktig oppgave i å spre riktig informasjon om screening og forskningsmetoder, sier Bretthauer.

(Anm: Do physicians understand cancer screening statistics? A national survey of primary care physicians in the United States. Ann Intern Med. 2012 Mar 6;156(5):340-9.)

Do physicians understand cancer screening statistics? A national survey of primary care physicians in the United States
Ann Intern Med. 2012 Mar 6;156(5):340-9
BACKGROUND: Unlike reduced mortality rates, improved survival rates and increased early detection do not prove that cancer screening tests save lives. Nevertheless, these 2 statistics are often used to promote screening.

OBJECTIVE: To learn whether primary care physicians understand which statistics provide evidence about whether screening saves lives.

DESIGN: Parallel-group, randomized trial (randomization controlled for order effect only), conducted by Internet survey. (ClinicalTrials.gov registration number: NCT00981019)

SETTING: National sample of U.S. primary care physicians from a research panel maintained by Harris Interactive (79% cooperation rate).

PARTICIPANTS: 297 physicians who practiced both inpatient and outpatient medicine were surveyed in 2010, and 115 physicians who practiced exclusively outpatient medicine were surveyed in 2011.

INTERVENTION: Physicians received scenarios about the effect of 2 hypothetical screening tests: The effect was described as improved 5-year survival and increased early detection in one scenario and as decreased cancer mortality and increased incidence in the other.

MEASUREMENTS: Physicians' recommendation of screening and perception of its benefit in the scenarios and general knowledge of screening statistics.

RESULTS: Primary care physicians were more enthusiastic about the screening test supported by irrelevant evidence (5-year survival increased from 68% to 99%) than about the test supported by relevant evidence (cancer mortality reduced from 2 to 1.6 in 1000 persons). When presented with irrelevant evidence, 69% of physicians recommended the test, compared with 23% when presented with relevant evidence (P < 0.001). When asked general knowledge questions about screening statistics, many physicians did not distinguish between irrelevant and relevant screening evidence; 76% versus 81%, respectively, stated that each of these statistics proves that screening saves lives (P = 0.39). About one half (47%) of the physicians incorrectly said that finding more cases of cancer in screened as opposed to unscreened populations "proves that screening saves lives."

LIMITATION: Physicians' recommendations for screening were based on hypothetical scenarios, not actual practice.

CONCLUSION: Most primary care physicians mistakenly interpreted improved survival and increased detection with screening as evidence that screening saves lives. Few correctly recognized that only reduced mortality in a randomized trial constitutes evidence of the benefit of screening. (...)

Statistical Question
Confidence intervals: predicting uncertainty
(Konfidensintervaller: forutsigelse av usikkerhet)
BMJ 2012;344:e3147 (9 May)
Researchers evaluated the effectiveness of standardised consultations for patients with osteoarthritis of the knee.1 Standardised consultations involved three goal oriented visits, which comprised education about osteoarthritis and treatment management, as well as information on physical exercises and weight loss. A cluster randomised controlled trial was used. Control treatment was usual care. Participants were recruited from primary care. Inclusion criteria included age 45-75 years and a diagnosis by a rheumatologist of osteoarthritis of the knee according to the American College of Rheumatology clinical and radiological definition. Main outcome measures included change in body weight at four months from baseline. (...)

Statistical Question
What are odds?

BMJ BMJ 2012;344:e2853 (25 April 2012)
Researchers investigated the association between genitourinary infections that occur from the month before conception to the end of the first trimester and gastroschisis. A case-control study design was used. The mothers of 505 offspring with gastroschisis were identified as cases and mothers of 4924 healthy liveborn infants as controls. Women self reported urinary tract infections and sexually transmitted infections.(...)

How to obtain the confidence interval from a P value
BMJ 2011; 343:d2090 (8 August)
Confidence intervals (CIs) are widely used in reporting statistical analyses of research data, and are usually considered to be more informative than P values from significance tests.1 2 Some published articles, however, report estimated effects and P values, but do not give CIs (a practice BMJ now strongly discourages). Here we show how to obtain the confidence interval when only the observed effect and the P value were reported.

The method is outlined in the box below in which we have distinguished two cases. (...)

Relative risks and statistical significance
BMJ 2010;341:c4265 (11 August)
Statistical Question (...)

Statistical significance and confidence intervals
Statistical question
BMJ 2009;339:b3401 (2 September)
A prospective population based cohort study investigated the association between occupation and pregnancy outcome for mothers who had missed antenatal visits. The mean birth weight was 3371 g (95% confidence interval 3274 to 3469) and 3227 g (3140 to 3315 g) for babies born to mothers in non-manual and manual jobs, respectively.

On the basis of the above information, which of the following can be deduced for mothers who missed antenatal visits? (...)

New group aims to detect misuse of statistics by government and media (Ny gruppe har som målsetting å påvise statens og medienes misbruk av statistikk)
BMJ 2009;338:b2469 (18 June)
A new group that aims to detect and highlight the misuse of statistics was launched on 18 June to help promote the public’s confidence in statistical information.

Straight Statistics, which is supported by a grant from the Nuffield Foundation, will encourage the appropriate use of statistical data by a range of establishments, including the government and the media. It will report its findings on its website (www.straightstatistics.org) and promote its work through reports and conferences.

Together with the charity Sense about Science, which promotes good science among the public, the group is also producing a booklet, Making Sense of Statistics, which will be available in September. It is also supporting the establishment of an all party parliamentary group on statistics. (...)

Statistical question
Study design
BMJ 2009;338:b2381 (17 June)
A clinical trial investigated the effectiveness of topical versus oral ibuprofen for chronic knee pain in people over 50. In designing a trial to decide the best treatment approach, which answer best describes how confounding could be minimised?

a) Double blind trial
b) Intention to treat analyses
c) Matching by age and sex
d) Randomisation of research participants (...)

Resting heart rate as predictor
What about absolute risks?

BMJ 2009;338:b1197 (23 March)
It is a fundamental principle in public health that you should never quote a relative risk without also giving the absolute risk.1 Failure to follow this simple precept results in the weekly health scares that engage the popular press, when an increased relative risk is taken as a threat to the individual. (...)

In other words, in those deemed to be at a higher risk, out of 250 women only one extra woman would have an event in about 8 years. This is not what the public think of as a predictor. Those in the top fifth should not be unduly concerned. (...)

Picking studies
guardian.co.uk 22.1.2009
There are more than 30,000 medical journals and hundreds of thousands of research articles published every year. How can anyone keep up with them? And more importantly how can you tell if the research is good or not?

Each research study is only one piece of a jigsaw that may take years to finish. Rarely does any one piece of research answer either a doctor's, or your, question. (...)

Hvor "farlige" fødsler?
Dag Moster er barnelege, overlege ved Haukeland universitetssykehus og postdoc-stipendiat ved Universitetet i Bergen
Rolv Terje Lie er professor ved Universitetet i Bergen.
Trond Markestad er barnelege, dr.med. og leder i Rådet for legeetikk
aftenposten.no 8.8.2008
Det er korrekt at noen for tidlig fødte kan få problemer senere i livet. Men de aller fleste for tidlig fødte klarer seg svært godt som voksne. (...)

Et eksempel som kan illustrere hva relativ risiko betyr, er at sjansen for å vinne i Lotto øker 10 ganger hvis en kjøper 10 rekker i stedet for én. Likevel er den reelle sjansen for å vinne fortsatt liten.

Tilsvarende fikk ca. 1 av 1000 barn født til termin og, tross alt, bare 9 av 100 født mer enn tre måneder før termin cerebral parese i vår studie. Så selv om det var 79 ganger så høy risiko var det fortsatt 91 % som ikke hadde cerebral parese av de minste premature. I tallene for risiko er det også mulig at samme barn har flere diagnoser, for eksempel både cerebral parese og psykisk utviklingshemning. Betydningen av funksjonsvansker kan også illustreres ved at 11 av 100 barn som var født mer enn tre måneder før tiden mottok uførestønad mot 2 av 100 født til termin. 89 % av de aller minste premature mottok altså ikke uførestønad. (...)

Ingen grunn til bekymring.
Det vil si at økt overlevelse har ført til at langt flere for tidlig fødte barn overlever i dag uten alvorlige funksjonshemninger. (...)

Websidene er designet og tilrettelagt av Hein Tore Tønnesen © 2009