Sissejuhatus
Selle modelleerimisprojekti eesmärk oli ennustada 2024. aasta valimiste tulemust rahvatervise, demograafiliste ja ajalooliste andmete abil. See ainulaadne lähenemisviis tugineb ennustajatele, mis on avalikkuse toetuse näitajaks Demokraatlikule Parteile teatud elanikkonna hulgas. USA-s seisame silmitsi binaarse valikuga – demokraat või vabariiklane – ja meie valimise otsustavad iga osariigi valimiskogu hääled. Seetõttu oli ennustatud vastuse mõõdik lihtsalt võidumarginaal osariigis.
Valimiskogu tõttu on valimiste ennustamine sisuliselt käputäie osariikide ennustamine. Enamikul osariikidel on usaldusväärne ajalugu ühe või teise partei suure võidumarginaali kohta, samas kui vähestel mitte. Andmed ja mudel on täpsed niivõrd, kuivõrd need ennustavad neid osariike täpselt. Hiljutiste riiklike valimiste väiksema valimimahu ja hiljutiste andmepunktide olulisuse tõttu mudelis ei ole see võimeline andma väga täpseid ennustusi osariikide kohta, millel on väike võidumarginaal. Seetõttu sõltub selle mudeli edu selle võimest tuvastada, millistel kõikuvatel osariikidel võib olla demokraatidele (või vabariiklastele) suurem toetus kui praegu küsitlustes tuvastatakse.
Taust ja eeldused
Viimase kahe presidendivalimiste tsükli jooksul oleme näinud avaliku sektori küsitluste olulist läbikukkumist. 2016. aastal ei suutnud peaaegu ükski suurem küsitlus- ja meediaväljaanne tuvastada demokraatide ja sõltumatute seas valitseva avalikkuse toetuse ulatust, mis viis Trumpi võiduni võtmetähtsusega kõikuvates osariikides ja roostevööndis. 2020. aastal alahindasid küsitlusagentuurid taas Trumpi toetust võtmeosariikides. Sellest ajast alates on usaldus meedia võime vastu uurida ja tõde välja selgitada veelgi vähenenud.
See analüüs püüab leida ennustajaid, mis peegeldavad avalikkuse poliitiliste eelistuste täpsemat seisu, mis ei sõltu küsitlustööstuse eelarvamustest. Covid-19 pandeemia hüperpolariseeritud olemuse ja Covid-19 vaktsiini toetuse selgete piiride tõttu on avalikkuse toetus igal aastal Covid-19 vaktsiini „uue“ versiooni suhtes tugevas korrelatsioonis Demokraatliku Partei toetusega. Kuna igal aastal toimub uus Covid-19 vaktsiin, eeldatakse, et jätkuv toetus näitab demokraatide häälelojaalsust. Muud näitajad, näiteks siserände määr ja posti teel hääletamise taotlused, on viimase nelja aasta jooksul demokraatide toetusega tugevas korrelatsioonis.
Lisaks on kontrollivate või ennustavate muutujatena kasutatud rahvatervise allikatest pärinevaid rahvastikuandmeid, sealhulgas suremust, sündimust ja vaimset tervist. Mõned demograafilised ja rahvastikudünaamikad on seotud vabariiklaste ja teiste demokraatide poole kalduvate osariikidega ning need seosed on lähiajaloos aja jooksul püsinud. Teistel näitajatel, näiteks rändesaldo, on tugevad seosed, kuid need on uuemad ja neid mõjutas Covid-19 pandeemia, mille jooksul paljud suletud sinised osariigid kogesid netokahjumit ja punased avatud osariigid netovõitu. Nüüdseks iga-aastase Covid-19 vaktsiini populaarsus väheneb aasta-aastalt ning andmeid on kohandatud suhtelise populaarsuse mõõtmiseks, kusjuures osariigid, kus üldine vaktsineerituse määr on keskmisest suurem, peegeldavad Demokraatliku Partei suuremat toetust.
Üldiselt püüab see analüüs kombineerida nii pikaajalisi kui ka uuemaid trende, et hinnata Demokraatliku Partei praegust toetuse taset. Kuna mudelit tuleb treenida ainult andmetega, mis on kättesaadavad ainult valimistele eelnevatel kuudel (Covid-Vax) ja nädalatel (eelhääletuse taotlused), ei suuda see tuvastada mingeid viimase hetke nihkeid.
Nagu George Box ütles: „Kõik mudelid on valed, aga mõned on kasulikud.“ Minu lootus selle analüüsi põhjal on, et see võib olla kasulik selliste signaalide tuvastamiseks, mida traditsioonilistes valimisküsitlustes ei pruugi esineda. Lisaks ennustustele (mis on enamasti lõbu pärast) olen lisanud ka kõikuvate riikide analüüsi, mis minu arvates võib valgustada viimase nelja aasta jooksul toimunud olulisi nihkeid.
Meetodid
Kuna valimiste kontekstis on selgitatavus ja tõlgendatavus kriitilise tähtsusega, olen jäänud lihtsate mudelite juurde. Üldistatud lineaarne modelleerimine, logistiline regressioon ja juhusliku metsa mudelid treeniti kõik 2020.–2022. aasta andmete põhjal. Tulemuseks ehk reaktsiooniks oli Demokraatliku Partei võidumarginaal. Logistilise mudeli puhul ennustati reaktsioonina selle osariigi binaarset võitu või kaotust. Kuna igal mudelil on oma tugevused ja nõrkused ning veamäärad, määrab võidu või kaotuse lõpliku liigituse häälteenamus. Olen oma koodi ja andmed üles laadinud githubja igaüks on teretulnud kritiseerima, parandama või tagasisidet andma.
Piirangud
Kuna otsustasin kasutada ennustajana osariikide Covid-19 vaktsiinide arvu, piirab see ajatelge ja kogutavaid andmeid. Seetõttu eeldan, et mudel kaldub demokraatide poole. 50 osariigist viis jäid veavahemikku. Kõiki neid viit osariiki peetakse kõikuvateks osariikideks. Kategooriseerimise eesmärgil liigitatakse partei võitjaks ainult osariigid, mis jäävad selgelt minu mudeli vigadest väljapoole. Veavahemikku jäävad osariigid liigitatakse ebaühtlasteks.
Arutelu
Kuna USA-s on valimised binaarsed valikud, vaatleb analüüs ainult demokraatide ja vabariiklaste võrdlust ning ei suuda tuvastada muutusi vastaspartei valijate toetuses kandidaadile. See toob esile mudeli põhieelduse, et need valimised on endiselt peamiselt partei lojaalsuse küsimus üksikkandidaadi suhtes.
Demokraatliku kandidaadi Kamala Harrise puhul usun, et see oletus peab paika, kuna teda ei valitud eelvalimistel rahvahääletuse teel ning suur osa kampaaniast on olnud strateegiliselt kujundatud tegelaskuju loomine naisest, keda kuni viimase ajani suures osas ignoreeriti, põlati ja isegi pilgati. Näeme, et viimaste kuude jooksul pole debatid, atentaadikatsed ja muud olulised sündmused küsitluste trendidele lihtsalt mingit olulist mõju avaldanud.
Donald Trumpi puhul ma ei usu, et see eeldus paika peab. Trumpi tuntud isiksus on domineeriv ja kõikjalolev. Tema presidendiajast aastatel 2017–2021 ning jätkuvatest võitlustest kohtuasjade, atentaadikatsete ja meediahullusega räägib Trumpi võit tema enda kohta palju rohkem kui Vabariikliku Partei kohta. Demokraatlik Partei on masin ja Vabariiklik Partei kindlustas Trumpile toetuse alles vastumeelselt pärast aastaid kestnud sisevõitlust ja juhtide vahelist lõhestatust.
Kuna mudel kasutab nii 2020. aasta presidendivalimiste kui ka 2022. aasta senativalimiste andmeid, on see treenitud modelleerima parteide toetust, mis on selle loomupärane nõrkus. Hiljutised küsitlused on Trumpi kasuks kaldunud, kuid suuremad kõikuvad osariigid on viigiseisus. Jäädes truuks oma meetoditele ja käesoleva harjutuse eesmärgile, ei ole neid andmeid kaasatud.
Pöörleva riigi analüüs
Valimiste tulemuse määrab käputäis osariike. Praegu on tasavägine seis Arizonas, Nevadas, Wisconsinis, Michiganis, Põhja-Carolinas, Georgias ja Pennsylvanias piisav, et valimised kummagi poole kasuks kallutada. Nendest osariikidest liigitas mudel Michigani ja Pennsylvania ohutult kõikuvate demokraatide hulka. Ülejäänud osariigid jäid kõik mudeli veavahemikku ja seetõttu liigitati need ebaühtlasteks.
Selle analüüsi toimimise visuaalseks kontekstiks on siin mõned jaotused mõnede ennustajate kohta, mida üldiselt peetakse kõikuvateks olekuteks.
Siserände määrad: 2019–2023*
Üldiselt on netorände määra ja demokraatide võidumarginaali vahel negatiivne seos. Viimase nelja aasta jooksul on paljud sinised osariigid kaotanud inimesi, samas kui punased... osariigid on võitnudNendest kõikuvatest osariikidest on mõned kuberneride ja osariigi valitsuse osas „punased“ ning teised „sinised“. Kokkuvõttes on Pennsylvania ja Michigan ainsad kaks osariiki, mille rändemäärad on viimase nelja aasta jooksul olnud negatiivsed.
Posti teel hääletamise taotlused
Mõned osariigid, näiteks California, Colorado ja Nevada, on posti teel hääletamise osariigid. See tähendab, et igale registreeritud valijale saadetakse vaikimisi paberhääletussedel. Välja arvatud Utah (ja võimalik, et ka Nevada), on peaaegu kõik need osariigid sinised osariigid ja püsivalt sinised. Nevada on ainus kõikuv osariik, mis on posti teel hääletamise osariik, nagu näete, selle taotluste arv on jäänud samaks. Üldine trend enamiku teiste osariikide puhul, välja arvatud Arizona, on posti teel hääletamise taotluste arvu vähenemine.
Aastane Covid-19 vaktsiinide arv**
Kuna mudel kasutab iga-aastast Covid-vaktsiini hulka näitajana tugev ennustaja Kuigi Demokraatliku Partei toetus on küll kõrge, kuid üldine populaarsus langeb, kasutab mudel osariikide võrdlemiseks aasta jooksul suhtelist punktisummat. Lisaks Wisconsinile oli ülejäänud osariikides Covid-19 vaktsiinide osakaal aastatel 2021**, 2022 ja 2024 veidi alla keskmise.
*Siseriikliku rände määrad on vastavuses eelmise aastaga.
**Kuna Covid-19 vaktsiinid olid saadaval alles 2021. aastal, siis siduti 2021. aasta andmed 2020. aasta valimistulemuste andmetega. 2022. ja 2024. aasta andmed kajastavad selle aasta uue versiooni kasutuselevõttu.**
Et saada aimu ennustajate olulisusest mudeli jaoks, järjestab allolev diagramm iga mõõdiku vastavalt sellele, kui palju see mudeli ennustusi mõjutab. Nagu näete, on Covid-19 vaktsiinide tarbimine järjestatud otse „eelmise demokraatide võidu“ all.
Tulemused
Mudel eeldab, et Harris võidab kindlalt 260 valijameeste häält osariikides, mis ennustatakse olevat kindlalt demokraatlikud. Kui Pennsylvania ja Michigan on tõepoolest võistlemas, siis ainult 226 neist on kindlalt demokraatlikud.
Mudel ennustab, et Trump võidab kindlalt 219 valijameeste häält osariikides, mis on kindlalt vabariiklaste omad.
Pöördeosariigid Wisconsin, Georgia, Põhja-Carolina, Nevada ja Arizona on kõik jagamisjärgus ning esindavad 59 valijameeste häält. Kui Pennsylvania ja Michigan on jagamisjärgus, on jagamiseks saadaval 93 valijameeste häält.
Harrise võidutee
Harrise tee võiduni tundub lihtsaim. Suurema alghäälte arvuga „kotis“ saab ta endale paar kõikuvat osariiki. Pennsylvania ja Michigan on mudelis tema võitudena näidatud ning kui ta need võidab, vajab ta võidu kindlustamiseks vaid ühte Arizona, Põhja-Carolina, Wisconsini või Georgia osariiki. Kui ta võidab ühe Pennsylvaniast või Michiganist, peab ta kaotuse asendama 1-2 täiendava kõikuva osariigiga.
Trumpi tee võidule
Oluline on vaadata Trumpi teed mõtteviisiga „kõike võib juhtuda“. Ta on mõlemal varasemal valimistel ootusi ületanud. Enamik infoväravavalvureid, peavoolu eksperte ja valimisküsitluste läbiviijaid on minevikus eksinud.
219 punktiga peab Trump võitma kõik ülejäänud osariigid: Arizona, Georgia, Põhja-Carolina, Wisconsin ja Nevada. Kui Trump võidab Pennsylvania ja/või Michigani, muutub tema tee lihtsamaks, mis tähendab, et tal on vaja ikkagi 2-3 ülejäänud osariiki.
Heida pilk allolevale juhtpaneelile. Suhtle, et näha, kuidas kumbki kandidaat võiduni jõuab, võites loosimise teel olevad osariigid, ja vaata hajuvusdiagramme osariikide kaupa mõõdetud ennustuste kohta.
Minu isiklikud ennustused mudeli põhjal
Mul on Põhja-Carolina ja Georgia kohta rohkem sisetunnet, kuna olen seal aega veetnud, ja ma nimetan neid Trumpi osariikideks. Arizona, Nevada või Wisconsini kohta mul sellist sisetunnet pole. Seega suhtu sellesse teatava reservatsiooniga. Aga meetodile truuks jäädes nimetab minu mudel Harrise osariikideks Pennsylvaniat ja Michigani ning ma usun, et ta valib lisaks vähemalt 2-3 kõikuvat osariiki. Loodan, et ma eksin.
viited:
MIT valimislabor https://electionlab.mit.edu/data#data
USA faktid https://usafacts.org/economy/
UF valimislabor https://election.lab.ufl.edu/voter-turnout/
CDC https://data.cdc.gov/Vaccinations/Cumulative-Percentage-of-Adults-18-Years-and-Older/hm35-qkiu/about_data
Hääletamine ja registreerimine 2022. aasta novembri valimistel https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CDC https://data.cdc.gov/Vaccinations/COVID-19-Vaccinations-in-the-United-States-Jurisdi/unsk-b7fc/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Viis kolmkümmend kaheksa https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
KFF vaktsiinimonitor https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
UF valimislabor https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Riiklik tervishoiustatistika keskus https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Rahvaloendus.gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Riiklik tervishoiustatistika keskus https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Rahvaloendus - vaesus https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Rahvaloendus - rahvastiku muutus osariikide kaupa https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
USA valimisprojekt https://electproject.github.io/
Autori omast uuesti avaldatud Alamühik
-
Josh elab Nashville'is Tennessees ja on andmete visualiseerimise ekspert, kes keskendub hõlpsasti mõistetavate diagrammide ja andmepaneelide loomisele. Pandeemia ajal on ta pakkunud analüüse kohalike huvigruppide toetamiseks kontaktõppe ja muude ratsionaalsete, andmepõhiste koroonapoliitikate osas. Tal on taust arvutisüsteemide inseneri ja konsultatsiooni alal ning bakalaureusekraad helitehnika alal. Tema töid leiab tema alamkogust „Relevant Data“.
Vaata kõik postitused