Mennyire jók a közvélemény-kutatók? A Five-Thirty-Eight adathalmazának elemzése
Elemezzük a tiszteletreméltó politikai előrejelző honlap, a Five-Thirty-Eight közvélemény-kutatói rangsorának adathalmazát.
![](https://miro.medium.com/max/60/1*cwh6lSh8a3MFmuAUkyIYhA.png?q=20)
Ez egy választási év, és a választások (mind az általános elnökválasztás, mind a képviselőházi/szenátusi választások) körüli közvélemény-kutatások egyre forróbbak. Ez egyre izgalmasabb lesz az elkövetkező napokban, tweetekkel, ellen-tweetekkel, közösségi média harcokkal és véget nem érő pundizással a televízióban.
Tudjuk, hogy nem minden közvélemény-kutatás egyforma minőségű. Hogyan lehet tehát értelmet adni mindennek? Hogyan ismerjük fel a megbízható közvélemény-kutatókat az adatok és az analitika segítségével?
![](https://miro.medium.com/max/60/1*5jqxDtgnKWSdLZAvnTdfLQ.jpeg?q=20)
A politikai (és néhány más kérdésben, például sport, társadalmi jelenségek, közgazdaságtan stb.) előrejelző elemzések világában a Five-Thirty-Eight félelmetes név.
A honlap 2008 eleje óta közöl – jellemzően statisztikai adatokat létrehozó vagy elemző – cikkeket az aktuálpolitika és a politikai hírek legkülönbözőbb témáiról. A Nate Silver rocksztár adattudós és statisztikus által vezetett weboldal különösen a 2012-es elnökválasztás körül vált ismertté és szerzett széles körű hírnevet, amikor modellje mind az 50 állam és a District of Columbia győztesét helyesen jósolta meg.
![](https://miro.medium.com/max/60/1*Aq8PWR-dvc1eQy-IIVDHSA.png?q=20)
És mielőtt gúnyolódnál, és azt mondanád: “De mi van a 2016-os választásokkal?”, jól teszed, ha elolvasod ezt a cikket arról, hogy Donald Trump megválasztása a statisztikai modellezés normális hibahatárán belül volt.
A politikailag kíváncsibb olvasóknak itt van egy egész zsáknyi cikkük a 2016-os választásokról.
Az adattudományok művelőinek meg kell kedvelniük a Five-Thirty-Eight-ot, mert nem riadnak vissza attól, hogy előrejelző modelljeiket erősen szakkifejezésekkel magyarázzák (legalábbis a laikusok számára elég bonyolultan).
![](https://miro.medium.com/max/60/1*qs-ct5nFtcoIrmWbzbWYEw.png?q=20)
Itt a híres t-eloszlás átvételéről beszélnek, míg a legtöbb más közvélemény-kutató aggregátor talán csak a mindenütt jelenlévő normális eloszlással elégszik meg.
A kifinomult statisztikai modellezési technikák használatán túlmenően azonban a Silver vezette csapat egy egyedülálló módszertannal – a közvélemény-kutatói minősítéssel – büszkélkedik, hogy modelljeik rendkívül pontosak és megbízhatóak maradjanak.
Ebben a cikkben elemezzük az ilyen minősítési módszerekre vonatkozó adataikat.
A Five-Thirty-Eight nem zárkózik el attól, hogy előrejelző modelljeit rendkívül technikai (legalábbis a laikusok számára elég bonyolult) kifejezésekkel magyarázza.
Közvéleménykutatói minősítés és rangsorolás
A közvéleménykutatók sokasága működik az országban. Ezek olvasása és minőségének felmérése rendkívül megterhelő és törékeny lehet. A honlap szerint: “A közvélemény-kutatások olvasása veszélyes lehet az egészségre. A tünetek közé tartozik a cseresznyeválogatás, a túlzott magabiztosság, az ócska számoknak való bedőlés és az elhamarkodott ítélkezés. Szerencsére van rá gyógymódunk”. (forrás)
Vannak közvélemény-kutatások. Aztán vannak közvélemény-kutatások a közvélemény-kutatásokról. Aztán vannak a közvélemény-kutatások súlyozott közvélemény-kutatásai. Mindenekelőtt vannak közvélemény-kutatások közvélemény-kutatásai, amelyek súlyai statisztikailag modellezett és dinamikusan változó súlyokkal rendelkeznek.”
Az ismerősnek tűnik más híres rangsorolási módszertan, amelyről adattudósként már hallott? Az Amazon termékrangsorolása vagy a Netflix filmes rangsorolása? Valószínűleg igen.
Lényegében a Five-Thirty-Eight ezt a minősítési/rangsorolási rendszert használja a közvélemény-kutatási eredmények súlyozására (a magasan rangsorolt közvélemény-kutatók eredményei nagyobb jelentőséget kapnak és így tovább). Emellett aktívan nyomon követik az egyes közvélemény-kutatók eredményei mögött álló pontosságot és módszertant, és egész évben módosítják a rangsorukat.
Vannak közvélemény-kutatások. Aztán vannak közvélemény-kutatások a közvélemény-kutatásokról. Aztán vannak a közvélemény-kutatások súlyozott felmérései. Mindenekelőtt vannak közvélemény-kutatások közvélemény-kutatásai, amelyek súlyai statisztikailag modellezett és dinamikusan változó súlyokkal rendelkeznek.”
Érdekes, hogy a rangsorolási módszertanuk nem feltétlenül a nagyobb mintával rendelkező közvélemény-kutatót minősíti jobbnak. A következő képernyőkép a honlapjukról jól szemlélteti ezt. Bár az olyan közvélemény-kutatók, mint a Rasmussen Reports és a HarrisX nagyobb mintamérettel rendelkeznek, valójában a Marist College az, amelyik A+ minősítést kap szerényebb mintamérettel.
![](https://miro.medium.com/max/60/1*jtvXJtKh6CDTLh5XTBD6Ew.png?q=20)
Szerencsére a közvélemény-kutatói rangsoradataikat (szinte minden más adatkészletükkel együtt) nyílt forráskódúvá is teszik itt a Githubon. Ha pedig csak egy szépen kinéző táblázat érdekel, itt van.
Természetes, hogy adattudósként mélyebben bele akarsz nézni a nyers adatokba, és megérteni olyan dolgokat, mint,
- hogyan korrelál a numerikus rangsoruk a közvélemény-kutatók pontosságával
- van-e pártos elfogultságuk az egyes közvélemény-kutatók kiválasztásában (a legtöbb esetben a demokrata vagy a republikánus irányultságúak közé sorolhatók)
- kik a legjobban rangsorolt közvélemény-kutatók? Sok közvélemény-kutatást végeznek, vagy szelektívek?
Az ilyen meglátások megszerzése érdekében megpróbáltuk elemezni az adathalmazt. Ássuk bele magunkat a kódba és az eredményekbe, rendben?
Az elemzés
A Jupyter Notebookot itt találod a Github repómban.
A forrás
Kezdésként az adatokat közvetlenül a Githubjukról húzhatjuk be egy Pandas DataFrame-be, az alábbiak szerint,
![](https://miro.medium.com/max/60/1*nrvlqZI7oveKr8nAeevYlg.png?q=20)
Az adatállományban 23 oszlop van. Így néznek ki,
![](https://miro.medium.com/max/60/1*U39MT_j-K3904s1PJXjeDg.png?q=20)
Egy kis átalakítás és tisztítás
Észrevesszük, hogy egy oszlopban van némi extra szóköz. Néhány másiknak is szüksége lehet némi kivonatolásra és adattípus-konverzióra.
![](https://miro.medium.com/max/60/1*425dckhpi6GavqW-wIBPKw.png?q=20)
![](https://miro.medium.com/max/60/1*NKuwe2w1TYq5fOlxoqUSHg.png?q=20)
![](https://miro.medium.com/max/60/1*EOd5gmuhPjmdTdEKT4LjOw.png?q=20)
A kivonás alkalmazása után, az új DataFrame további oszlopokkal rendelkezik, ami alkalmasabbá teszi szűrésre és statisztikai modellezésre.
![](https://miro.medium.com/max/60/1*iXDwEqNE8xuoWTLPhxP8eA.png?q=20)
A “538 Grade” oszlop vizsgálata és kvantálása
Az “538 Grades” oszlopok tartalmazzák az adatállomány lényegét – a közvélemény-kutató betűjeles osztályzatát. Akárcsak egy rendes vizsgán, az A+ jobb, mint az A, és az A jobb, mint a B+. Ha a betűs osztályzatok számát ábrázoljuk, összesen 15 fokozatot figyelhetünk meg, A+-tól F-ig.
![](https://miro.medium.com/max/60/1*YDAQnupZkkvqkH0a1L_5PA.png?q=20)
Ahelyett, hogy ennyi kategorikus fokozattal dolgoznánk, érdemes ezeket kevés számú numerikus osztályzattal kombinálni – 4 az A+/A/A-, 3 a B-kre stb.
![](https://miro.medium.com/max/60/1*Rke5eNOIsPebx-ykcdrdMQ.png?q=20)
Boxplotok
A vizuális analitikában a boxplotokkal kezdhetjük.
Tegyük fel, hogy meg akarjuk vizsgálni, melyik szavazási módszer teljesít jobban az előrejelzési hiba szempontjából. Az adatkészletben van egy “Egyszerű átlagos hiba” nevű oszlop, amely a következőképpen van definiálva: “A cég átlagos hibája, amelyet a közvélemény-kutatási eredmény és a tényleges eredmény közötti különbségként számítunk ki a verseny első két helyezettjét elválasztó különbségre.”
![](https://miro.medium.com/max/60/1*iamYOzmIZlaufj5MzUbVbg.png?q=20)
Ezután érdekelhet minket annak ellenőrzése, hogy a bizonyos pártpolitikai elfogultsággal rendelkező közvélemény-kutatók sikeresebbek-e a választások helyes megítélésében, mint mások.
![](https://miro.medium.com/max/60/1*6wC4sSx6exFVTDE6fHSYCQ.png?q=20)
Észrevettél valami érdekeset fent? Ha progresszív, liberális gondolkodású ember vagy, akkor minden valószínűség szerint a Demokrata Párt párthoz tartozol. De átlagosan a republikánus beállítottságú közvélemény-kutatók pontosabban és kisebb ingadozással mondják meg a választásokat. Jobb, ha vigyázol ezekre a közvélemény-kutatókra!
Az adatkészlet egy másik érdekes oszlopa az “NCPP/AAPOR/Roper”. Ez “azt jelzi, hogy a közvélemény-kutató cég tagja volt-e a National Council on Public Pollsnak, aláírója volt-e az American Association for Public Opinion Research átláthatósági kezdeményezésének, vagy hozzájárult-e a Roper Center for Public Opinion Research adatarchívumához. A tagság gyakorlatilag a szilárdabb közvélemény-kutatási módszertanhoz való ragaszkodást jelzi” (forrás).
Hogyan lehet megítélni a fent említett állítás érvényességét? Az adatkészletben van egy “Advanced Plus-Minus” nevű oszlop, amely “egy olyan pontszám, amely összehasonlítja egy közvélemény-kutató eredményét más, ugyanazokat a versenyeket felmérő közvélemény-kutató cégekkel, és amely a legújabb eredményeket nagyobb súllyal súlyozza. A negatív pontszámok kedvezőek és átlagon felüli minőséget jeleznek” (forrás).
Itt egy boxplot e két paraméter között. Nemcsak az NCCP/AAPOR/Roperhez köthető közvélemény-kutatók mutatnak alacsonyabb hibapontot, hanem jelentősen alacsonyabb variabilitást is. Előrejelzéseik stabilnak és robusztusnak tűnnek.
![](https://miro.medium.com/max/60/1*BIZtXfgKRO-3OHy6VN5LQg.png?q=20)
Ha Ön progresszív, liberálisan gondolkodó ember, minden valószínűség szerint a Demokrata Párthoz pártolhatja magát. De átlagosan a republikánus irányultságú közvélemény-kutatók pontosabban és kisebb ingadozással nevezik meg a választásokat.
Scatter- és regressziós ábrák
A paraméterek közötti összefüggés megértéséhez megnézhetjük a regressziós illesztéssel készült szórásdiagramokat. Ezen ábrák létrehozásához a Seaborn és a Scipy Python könyvtárakat és egy testreszabott függvényt használunk.
Például a “Helyesen hívott futamok” és a “Prediktív plusz-mínusz” összefüggésbe hozható. A Five-Thirty-Eight szerint a “Predictive Plus-Minus” “egy előrejelzés arról, hogy a közvélemény-kutató mennyire lesz pontos a jövőbeli választásokon. Ezt úgy számítják ki, hogy a közvélemény-kutató Advanced Plus-Minus pontszámát visszavezetik egy átlaghoz, amely a módszertani minőségre vonatkozó mutatóinkon alapul”. (forrás)
![](https://miro.medium.com/max/60/1*8EVbLbl49JLzccRt_RSM5A.png?q=20)
Vagy megnézhetjük, hogy az általunk meghatározott “Numerikus fokozat” hogyan korrelál a közvélemény-kutatási hibák átlagával. A negatív tendencia azt jelzi, hogy a magasabb numerikus osztályzat alacsonyabb közvélemény-kutatási hibával jár együtt.
![](https://miro.medium.com/max/60/1*w1IkRQa2IGP-UEhk-DKMMA.png?q=20)
Azt is ellenőrizhetjük, hogy a “# of Polls for Bias Analysis” segít-e az egyes közvélemény-kutatókhoz rendelt “Partisan Bias Degree” csökkentésében. Lefelé mutató összefüggést figyelhetünk meg, ami azt jelzi, hogy a nagyszámú közvélemény-kutatás rendelkezésre állása valóban segít csökkenteni a pártos elfogultság mértékét. Az összefüggés azonban erősen nemlineárisnak tűnik, és egy logaritmikus skálázás jobb lett volna a görbe illesztéséhez.
![](https://miro.medium.com/max/60/1*maI2s_SbrtQxBBmY4x3J3g.png?q=20)
Az aktívabb közvélemény-kutatókban jobban megbízhatunk? Ábrázoljuk a közvélemény-kutatók számának hisztogramját, és azt látjuk, hogy az egy negatív hatványtörvényt követ. Kiszűrhetjük a nagyon alacsony és nagyon magas számú közvélemény-kutatással rendelkező közvélemény-kutatókat, és létrehozhatunk egy egyéni szórásdiagramot. Megfigyelhetjük azonban, hogy a közvélemény-kutatások száma és a prediktív plusz-mínusz pontszám között szinte nem is létezik korreláció. A nagyszámú közvélemény-kutatás tehát nem feltétlenül vezet magas közvélemény-kutatási minőséghez és előrejelző erőhöz.