Hogyan hazudjunk grafikonnal?
Bergengóciában és Piréziában sem ismeretlen a statisztikai trükközés fogalma. Most eltanulhatjuk tőlük, hogyan vezessük félre olvasótáborunkat egy-egy jól megválasztott illusztrációval! A valósággal való mindennemű egyezés nem biztos, hogy a véletlen műve…
Szórakoztató módszertani sorozatunkban most olyan téma következik, aminek a mindennapi életben is nagy hasznát vesszük. Hogyan szoktak a médiában látható grafikonok szerkesztői picit vagy éppen nagyot csalni, és hogyan kaphatjuk rajta őket?
A félrevezető grafikonokat általában védi a szerzői jog, így nem tudjuk csak úgy bemásolgatni ide őket. Ezért kedves olvasóinknak valós példák helyett ezúttal be kell érniük saját készítésű krikszkrakszainkkal, amelyeknek azért van egy hatalmas előnye: pont az látszik rajtuk, amit mutatni szeretnénk. Lesznek nyelvvel kapcsolatos példák is, meg olyanok is, amelyeket inkább máshoz kötünk: a gazdasági kimutatásokhoz, vagy éppen a természeti katasztrófákhoz. Az adatokat hasraütéssel hoztuk létre, ezúton is elnézést kérünk Bergengócia és Pirézia lakosaitól!
A rejtélyes függőleges
Kezdjünk egy oszlopdiagrammal! A lehető legegyszerűbb módszer, ha lehagyják a függőleges tengelyről a számokat. Elég primitív eljárás, de néha azért találkozhatunk vele.
Ennél egy fokkal rafináltabb, ha az y tengelyen vannak számok, de nem nulláról kezdődnek. Ezzel a trükkel nagyon gyakran találkozhatunk a napisajtóban. Jobb esetben van valamilyen képi jelzése annak, hogy finoman megvágták a grafikont, rosszabb esetben nincs, úgyhogy mindig nézzük meg, mi van a tengelyre írva! Illusztrációnkon első látásra úgy tűnik, mintha fél év alatt a többszörösére növekedett volna a havonta sikeresen letett piréz nyelvvizsgák száma, de igazából csak 400-ról nőtt 510-re.
Szárnyaló gazdaság
Kicsit hasonló, ha a negatív értékeket próbálják pozitívként feltüntetni. Az ábra Bergengócia „gazdasági növekedés”-ét mutatja 2025 és 2050 között, de ha jobban megnézzük, az emelkedő tendencia ellenére tényleges növekedésről csak az utolsó két pontban beszélhetünk. A függőleges tengelyen ugyanis a nulla meglehetősen magasan található, és ezt a grafikon szerkesztője – Bergengócia pénzügyminisztere? – semmilyen módon sem jelzi.
Ha mi ellenben őszinték szeretnénk lenni, húzzunk a nullánál egy vízszintes vonalat, így az olvasó biztosan észreveszi, hogy nem a megszokott helyén található!
Ugye észrevettük, hogy a fentebbi „gazdasági növekedés”-nél sem derült ki, pontosan minek a százalékos változásáról van szó? A nemzeti összterméknek, vagy valami másnak? Bergengócia pénzügyminisztere nem köti az orrunkra a választ, pedig ettől
függhet, hogy a javuló tendencia jelent-e valamit. Ha a negatív értékvalóban annyit tesz, hogy csökkent a gazdaság teljesítménye – pl. kevesebb volt az ipari termelés –, az félrevezetőbb, mintha például csak annyit jelentene, hogy importra szorult az ország, azzal szemben, hogy (pozitív érték esetén) maga tudott exportálni. Az utóbbi esetben beszélhetünk a helyzet javulásáról, az előbbiben nem.
Ebben a példában azt is megfigyelhettük, hogy a grafikon címével is lehet csalni. Sőt az sem szép dolog, ha a tengelyeken látható mennyiségek és a grafikon elnevezése köszönő viszonyban sincsenek egymással. Ez a típusú félrevezetés különösen pergő tempójú előadásokra jellemző: az előadó arra játszik, hogy úgysem lesz senkinek sem ideje alaposabban megnézni a fóliákat.
Hasonlóképpen lehet azzal is trükközni – vigyázat, természettudományokban kevésbé működik –, hogy a tengelyeken feltüntetett változóknak megfoghatatlan nevet adunk. „Elégedettség”? És azt hogyan mértük? Ki tudja! Ilyen módon teljesen légbőlkapott eredményeket is tudományos köntösbe öltöztethetünk.
1, 10, 100, 1000...
A nyugati kultúrkörben az emberek a számegyenest egyenlő közönként osztják be, hacsak mást nem mondanak nekik. Éppen ezért arra is fel kell hívni a figyelmet, ha valamelyik, általában a függőleges tengely másfajta beosztású. A leggyakrabban a (tízes alapú) logaritmikus beosztással találkozhatunk, de lehet, hogy a grafikon ezt elfedi! Például a földrengések erősségét jelző Richter-skála logaritmikus: ha eggyel növeljük az értékét, az egy nagyságrenddel nagyobb földmozgást jelez. Tehát egy kilences erősségű földrengés tízszer nagyobb mozgással jár, mint egy nyolcas erősségű, és százszor (10*10-szer) nagyobbal, mint egy hetes erősségű. Ha a függőleges tengelyen a Richter-skála szerinti értékeket tüntetjük fel, akkor az emberek úgy gondolhatják, hogy jóval kisebb a különbség közöttük, mint amekkora ténylegesen.
Hogy érthetőbb legyen a dolog, tekintsük meg a következő képet!
Pirézia a Piréz-törésvonalon fekszik, így meglehetősen gyakran mozog a föld. Nemrégiben bergengóc állami támogatással mérőállomást létesítettek. A fenti grafikonon látható minden évben az akkor mért legnagyobb földrengés. Kilenc évvel a mérőállomás megépítése után következett be a Nagy Piréz Katasztrófa, ami a földdel tette egyenlővé az ország fővárosát. Bergengócia lakosai nem értették, hogyan következhetett ez be, elvégre az ábrán is látszik, hogy Piréziában gyakoriak a földrengések, tehát lehetett volna számítani rá. Igen ám, csakhogy a grafikon pont a lényeget rejti el: a 9. évben bekövetkezett rengés százszor nagyobb volt, mint a korábbi legerősebb!
Érdekes, hogy vannak arról kísérleti adatok (angol nyelvű cikk), hogy a nyugati matematikában nem jártas, de számolni tudó emberek nem lineárisan, hanem logaritmikusan osztják be a számegyenest.
Ez a rész nem érdekes?
A következő típusú csúsztatást sajnos nagyon nehéz leleplezni, ha nincsenek a birtokunkban az eredeti adatok. A profi félrevezető egyszerűen kiválasztja azt a részt az adatsorból, ami alátámasztja a mondanivalóját, a többiről pedig lelkesen elfeledkezik.
Olvasóként mindenesetre kezdjünk el gyanakodni, ha a vízszintes tengelyen a kezdeti és a végpontok nem kerek számok, vagy nem megszokott időtartamokat fognak át (például egy évet, fél évet, stb.), és a szövegben nincsen elmagyarázva, miért pont ezt a szakaszt választotta ki a szerző. Lehet, hogy egész évben mért, de csak áprilistól augusztusig mutatja a kívánt eredményt a grafikon:
Nem tudod? Nem számítasz!
Hasonló, de egy fokkal könnyebben észrevehető trükk, ha a közvélemény-kutatásban adott „Nem tudom” vagy „Egyik sem” válaszokat egyszerűen lehagyják az ábráról. Mi ezt leggyakrabban a párttámogatottsági adatoknál szoktuk látni, de más témában is működhet. Mindig figyeljünk arra, hogy „a teljes mintán belül” vagy „a biztos válaszadók körében” mutatják az eredményt: az utóbbi esetben nem tudhatjuk, mennyien vannak azok, akiknek egyik alternatíva sem tetszett, vagy egyszerűen nem akarnak válaszolni. Még akár az is előállhat, hogy ebben az utóbbi csoportban többen vannak, mint az összes többiben összesen!
A szemléltetés kedvéért a következő kérdést tettük fel a bergengóc utca emberének: „Ön szerint a piréz nyelv bonyolultabb, vagy a bergengóc?” A következő válaszokat kaptuk:
Nyugodtan mondhatjuk, hogy a piréz nyelvet a biztos válaszadók (40 fő) háromnegyede (30 fő) bonyolultabbnak találja. Viszont eredetileg összesen 100 embert kérdeztünk meg, és ebből 60-an (majdnem kétharmadnyian) egyáltalán nem tudtak válaszolni! Valószínűleg ők tanultak valamennyi nyelvészetet, és ezért tudják, hogy az anyanyelvként beszélt nyelvek között nincsenek egyszerűbbek és bonyolultabbak.
Ez az eljárás olyan szempontból jogos, hogy egy választáson is csak azoknak a voksai számítanak, akik részt vettek benne (kivéve természetesen, ha olyan kevesen mennek el, hogy a választás érvénytelennek bizonyul). Viszont elfedi azt a nagyon fontos jelenséget, hogy mennyien vannak azok, akik mindenből kiábrándultak. Sőt, a politikusok is gyakran hajlamosak összemosni a voksoláson részt vetteket a teljes népességgel, ha ezzel a saját támogatottságukat hangsúlyozhatják. Persze lehet mondani, hogy a hallgatás beleegyezés...
Még, még, még és még
A korlátozott terjedelem miatt nem tudtunk minden lehetséges trükköt bemutatni. Például kördiagrammal is lehet hazudni: a mi kedvencünk, amikor a körszeletek összege még csak megközelítőleg sem 100%-ot ad ki. Tegyük a kezünket a szívünkre, mikor adtuk össze utoljára a százalékokat?
Arra azért talán rámutattunk, hogy nem árt egy kis óvatosság, amikor a híreket olvassuk. Sorozatunk pedig legközelebb más témával folytatódik, de igény szerint visszatérhetünk még a rafinált csalásokra is...
Felhasznált irodalom, további olvasnivalók
Huff, D. (1954): How to Lie with Statistics. Norton: New York.
Sleeper, A. (2006): How to Lie with Statistical Graphics.
Még több hazugság haladóknak (angolul)
Bergengócia a statisztikusok országa
A kockás papír textúra angelandspot DeviantArt felhasználó alkotása, a ceruza Gimp brush pedig elmerucr-é.
„Ugye észrevettük, hogy a fentebbi »gazdasági növekedés«-nél sem derült ki, pontosan minek a százalékos változásáról van szó? A nemzeti összterméknek, vagy valami másnak? (...) Ha a negatív értékvalóban annyit tesz, hogy csökkent a gazdaság teljesítménye – pl. kevesebb volt az ipari termelés –, az félrevezetőbb, mintha például csak annyit jelentene, hogy importra szorult az ország, azzal szemben, hogy (pozitív érték esetén) maga tudott exportálni."
Annyiban valóban helytálló az észrevétel, hogy a gazdasági növekedés alatt érthetik a bruttó hazai össztermék (GDP) vagy akár a bruttó nemzeti jövedelem (GNI) százalékos változását is, méghozzá általában a reál (konstans árakon számított) GDP/GNI alapján. Esetleg az felmerülhet, hogy ezeket egy főre vetítik, bár azt külön jelezni szokták.
Azt viszont, hogy "importra szorult" vagy "exportálni tudott" az ország, közgazdászok, komolyan vehető gazdaságstatisztikusok még véletlenül sem szokták önmagában "gazdasági növekedésnek" aposztrofálni. Ezt tudniillik éppen az ún. külkereskedelmi mérleg egyenlege mutatja, pozitív érték esetén a nettó export (= export − import) pozitív, egyébként negatív.
____________________
„A szemléltetés kedvéért a következő kérdést tettük fel a bergengóc utca emberének: »Ön szerint a piréz nyelv bonyolultabb, vagy a bergengóc?« (...) Nyugodtan mondhatjuk, hogy a piréz nyelvet a biztos válaszadók (40 fő) háromnegyede (30 fő) bonyolultabbnak találja. Viszont eredetileg összesen 100 embert kérdeztünk meg, és ebből 60-an (majdnem kétharmadnyian) egyáltalán nem tudtak válaszolni! Valószínűleg ők tanultak valamennyi nyelvészetet, és ezért tudják, hogy az anyanyelvként beszélt nyelvek között nincsenek egyszerűbbek és bonyolultabbak."
A tanulság önmagában érthető lenne, de ha így teszi fel valaki a kérdést a bergengóciai utca emberének, akkor a nem nyelvész végzettségű bergengóciai nyilván olyan dolgokat is figyelembe venne, amely alapján (számára) a kérdés eldönthető, még ha szorosan véve nem is a (beszélt) nyelv bonyolultságát mutatja. Pl. azt, hogy az illető nyelv lejegyzésére milyen írásjeleket, írásjegyeket stb. használnak; ez alapján mondhatja, hogy a kínai (piréz) bonyolult, mert a napi sajtó és a regények olvasásához 1000 karakter felismerését kell megtanulnia. Illetve az is közrejátszhatna, hogy az általa beszélt (bergengóc) nyelvről több ismerete lenne, mint az általa nem vagy csak kevésbé ismert pirézről, és a "nem tudom" válasz erre az ismerethiányra is utalhatna.
Üdvösnek tartom, h a mai matematikaoktatásba gyakorlati ismeretek is bekerültek, de sajnálatos, h a mai matematikatanárok ezt mennyire hanyagolják. Az egységes matematika érettségi feladatgyűjteményben van egy külön feladatcsoport "Grafikus manipulációk" (II. kötet, 93.-99.o.) címmel, és a cikk tartalmához hasonló, nagyon jó, gondolatébresztő és a tisztánlátást segítő feladatok vannak.
Abszolút jó cikk. :) Kész öröm volt olvasni.
Mint ahogy a szerző is leírta, nem tudtak minden trükköt bemutatni, úgyhogy én a kördiagrammosat kiegészíteném egy röviddel.
Nem olyan feltűnő, mint a bemutatottak, de úgy is lehet csalni, hogy elfektetik a kördiagramot - ahogy a rajzon is látható -, de nem csak úgy találomra, hanem olyan módon, hogy a kihangsúlyozandó rész kerüljön az előtérbe, vagy az legyen hátul, amelyik adatot el szeretnénk bagatellizálni. Tehát nem mindegy, hogy hogyan forgatják el a diagramot.
Vannak még olyanok is, amelyek már a szakmaiságot is megsértik vagy súrolják annak határait. Az egyik ilyen, amikor növekvő pénzügyi trendet ábrázolnak és jó kis magyarázatokat fűznek hozzá, hogy ennyire jó meg annyira jó, de a valóság az, hogy ha minden adatot elosztanának az inflációval, akkor a trend elég gyászos képet mutat.
Vagy oszlopdiagramnál az egyiket kiszélesítik, míg a másikat arányosan ábrázolják. Ez például egyértelmű szakmai hiba, ugyanis nem árt tudni, hogy az ábrázolásra szigorú szabályok vonatkoznak, például arra is, hogy egy oszlopdiagramban mekkora lehet az oszlopok területe (és hogy hogyan kell kiszámolni, ami bonyolultabb alakzatoknál lehet érdekes).
xkcd.com/833/
Hehe, ez jó írás, bár a legalapvetőbb félrevezető eszköz a beszéd.:-)
@tdk.112: Ez a cikk egy sorozat része. www.nyest.hu/hirek/kereses/Kutat%C3%A1sm%C3%B3dszertan
Nagyon jó cikk! Ha lehet, én még szívesen olvasnék hasonló trükkökről.
@siposdr: az a rengés során felszabaduló energiára vonatkozik (legalábbis úgy tudom), én pedig az elmozdulás nagyságáról írtam, a kettő nem ugyanaz. Persze lehet mondani, hogy az előbbi fontosabb, mint az utóbbi; igazából csak egy szemléletes példát szerettem volna túlbonyolítás nélkül, és az az előbbivel szerintem kevésbé működik.
Úgy vélem, a Richter-skála esete nem pontosan lett említve. Valóban logaritmikus skáláról van szó, azonban információim szerint két fokozat között nem tízszeres a különbség, hanem négyzetgyök 1000 (mintegy 31,6), azaz két fokozat között van 1000-szeres különbség.