Inleiding
Het doel van dit modelleringsproject was om de uitkomst van de verkiezingen van 2024 te voorspellen met behulp van volksgezondheids-, demografische en historische gegevens. De unieke aanpak is gebaseerd op voorspellers die een proxy zijn voor de publieke steun voor de Democratische Partij binnen een bevolking. In de VS worden we geconfronteerd met een binaire keuze, Democraat of Republikein, en onze verkiezingen worden beslist door de stemmen van de kiesmannen van elke staat. Daarom was de voorspelde responsmaatstaf simpelweg de overwinningsmarge binnen een staat.
Vanwege het kiescollege is het voorspellen van de verkiezingen in wezen een kwestie van het voorspellen van een handvol staten. De meeste staten hebben een betrouwbare geschiedenis van een grote overwinningsmarge voor de ene of de andere partij, terwijl een paar dat niet hebben. De gegevens en het model zullen nauwkeurig zijn in de mate dat ze deze staten nauwkeurig voorspellen. Vanwege de kleinere steekproefomvang van recente nationale verkiezingen en het belang van recente datapunten in het model, zal het niet in staat zijn om zeer nauwkeurige voorspellingen te produceren voor staten met kleine overwinningsmarges. Daarom zal het succes van dit model afhangen van het vermogen om te detecteren welke swing states meer steun voor Democraten (of Republikeinen) zouden kunnen hebben dan wat momenteel in de peilingen wordt gedetecteerd.
Achtergrond en veronderstellingen
Tijdens de laatste twee presidentsverkiezingscycli hebben we gezien dat publieke peilingen op grote manieren faalden. In 2016 slaagden bijna alle belangrijke peilingen en media er niet in de mate van publieke steun onder Democraten en onafhankelijken te detecteren die leidde tot Trumps overwinning in belangrijke swing states en de Rust Belt. In 2020 onderschatten peilingen opnieuw Trumps steun in belangrijke staten. Sindsdien is het vertrouwen in het vermogen van de media om onderzoek te doen en de waarheid te achterhalen verder uitgehold.
Deze analyse probeert voorspellers te vinden die een nauwkeurigere staat van de politieke voorkeur van het publiek weerspiegelen, die niet onderhevig zijn aan de zwakheden van de vooroordelen van de peilingsindustrie. Vanwege de hypergepolariseerde aard van de Covid-19-pandemie en de expliciet duidelijke lijnen waar de steun voor de Covid-19-prik daalde, is de publieke opname voor de "nieuwe" versie van een Covid-19-prik van elk jaar sterk gecorreleerd met de steun voor de Democratische Partij. Omdat er elk jaar een nieuwe Covid-19-prik is, wordt aangenomen dat de aanhoudende opname duidt op Democratische stemloyaliteit. Andere indicatoren, zoals de binnenlandse migratiegraad en verzoeken om per post te stemmen, zijn sterk gecorreleerd met de Democratische steun in de afgelopen vier jaar.
Bovendien zijn bevolkingsgegevens uit bronnen voor de volksgezondheid gebruikt als controlerende of voorspellende variabelen, waaronder sterftecijfer, geboortecijfer en geestelijke gezondheid. Sommige demografische en bevolkingsdynamieken worden geassocieerd met meer Republikeinse staten en andere met Democratisch georiënteerde staten, en deze relaties hebben in de recente geschiedenis standgehouden. Andere metingen, zoals het netto migratiepercentage, hebben sterke associaties, maar die zijn recenter en werden beïnvloed door de Covid-19-pandemie, waarbij veel afgesloten blauwe staten een netto verlies zagen en rode open staten een netto winst zagen. De populariteit van de nu jaarlijkse Covid-19-prik neemt jaar na jaar af en de gegevens zijn aangepast om de relatieve populariteit te meten, waarbij staten met een hogere algehele opname dan gemiddeld een hogere steun voor de Democratische Partij weerspiegelen.
Over het geheel genomen probeert deze analyse zowel langetermijntrends als recentere trends te combineren om het huidige niveau van steun voor de Democratische Partij te schatten. Omdat het model alleen moet worden getraind op gegevens die beschikbaar zijn gesteld in de maanden (Covid-Vax) en weken (aanvragen voor afwezige stembiljetten) voorafgaand aan de verkiezingen, kan het geen verschuivingen op het laatste moment detecteren.
Zoals George Box zei: "Alle modellen zijn fout, maar sommige zijn nuttig." Ik hoop dat deze analyse nuttig kan zijn om signalen te detecteren die mogelijk niet aanwezig zijn in traditionele verkiezingspeilingen. Naast voorspellingen (die vooral voor de lol zijn), heb ik ook een aantal swing state-analyses toegevoegd waarvan ik denk dat ze licht kunnen werpen op belangrijke verschuivingen die de afgelopen vier jaar hebben plaatsgevonden.
Methoden
Omdat uitlegbaarheid en interpretatie cruciaal zijn in de verkiezingscontext, heb ik me gehouden aan eenvoudige modellen. Generalized Linear Modeling, Logistic Regression en Random Forest-modellen werden allemaal getraind op gegevens uit 2020-2022. De uitkomst, of respons, was de marge van de overwinning van de Democratische Partij. Voor het logistieke model was de voorspelde respons een binaire winst of verlies voor die staat. Omdat elk model zijn eigen sterke en zwakke punten heeft, samen met zijn eigen foutpercentages, wordt de uiteindelijke classificatie van een winst of verlies bepaald door de meerderheidsstem. Ik heb mijn code en gegevens geüpload naar GitHuben iedereen is welkom om kritiek te leveren, correcties aan te brengen of feedback te geven.
Beperkingen
Vanwege mijn besluit om de opname van Covid-19-vaccins in staten als voorspeller te gebruiken, beperkt dit de tijdlijn en de gegevens die kunnen worden verzameld. Hierdoor verwacht ik dat het model een voorkeur zal hebben voor de Democraten. Van de 50 staten vielen er vijf binnen het foutenbereik. Al die vijf staten worden beschouwd als swing states. Voor categoriseringsdoeleinden worden alleen staten die duidelijk buiten de fouten van mijn modellen vallen, gecategoriseerd als een overwinning voor die partij. De staten binnen het foutenbereik worden gecategoriseerd als toss-ups.
Discussie
Omdat verkiezingen in de VS een binaire keuze zijn, kijkt de analyse alleen naar Democraten versus Republikeinen en kan geen verschuivingen in steun voor een kandidaat detecteren onder kiezers van de andere partij. Dit onthult een kernveronderstelling van het model, namelijk dat deze verkiezing nog steeds voornamelijk gaat over partijtrouw boven de individuele kandidaat.
Voor de Democratische kandidaat Kamala Harris geloof ik dat deze aanname klopt, aangezien ze niet via een volksstemming is gekozen tijdens de voorverkiezingen, en een groot deel van de campagne draaide om het creëren van een strategisch vormgegeven persona van een vrouw die tot voor kort grotendeels werd genegeerd, afgewezen en zelfs bespot. We kunnen zien dat de debatten, moordpogingen en andere belangrijke momenten van de afgelopen maanden gewoonweg geen groot effect hebben gehad op de peilingtrends.
Voor Donald Trump geloof ik niet dat deze aanname opgaat. Trumps bekende persona is dominant en alomtegenwoordig. Gezien zijn presidentschap van 2017-2021 en zijn voortdurende gevechten met rechtszaken, moordpogingen en media-obsessie, zegt Trumps overwinning veel meer over hem dan over de Republikeinse Partij. De Democratische Partij is een machine en de Republikeinse Partij heeft pas met tegenzin steun voor Trump verworven na jaren van onderlinge strijd en verdeeldheid onder haar leiders.
Omdat het model gegevens van zowel de presidentsverkiezingen in 2020 als de senaatsverkiezingen in 2022 gebruikt, is het getraind om partijsteun te modelleren, vandaar de inherente zwakte. Recente peilingen zijn in Trumps voordeel omgeslagen, maar hebben belangrijke swing states in dead heats. Om trouw te blijven aan mijn methoden en de bedoeling van deze oefening, is geen van die gegevens opgenomen.
Swing State-analyse
De uitslag van de verkiezingen wordt bepaald door een handvol staten. Momenteel zijn de nek-aan-nekraces in Arizona, Nevada, Wisconsin, Michigan, North Carolina, Georgia en Pennsylvania voldoende om de verkiezingen in het voordeel van een van beide staten te laten kantelen. Van die staten categoriseerde het model Michigan en Pennsylvania als veilig Democratisch. De overige staten vielen allemaal binnen de foutmarge van het model en werden daarom gecategoriseerd als toss-ups.
Om wat visuele context te bieden voor de werking van deze analyse, volgen hier enkele uitsplitsingen van enkele voorspellers voor de staten die over het algemeen als swing states worden beschouwd.
Binnenlandse migratiecijfers: 2019-2023*
Over het algemeen is er een negatieve relatie tussen het netto migratiepercentage en de Democratische overwinningsmarge. In de afgelopen 4 jaar hebben veel blauwe staten mensen verloren, terwijl rode Staten hebben gewonnen. Voor deze swing states zijn sommige “rood” met betrekking tot gouverneurs en staatsregering, en andere zijn “blauw.” Over het geheel genomen zijn Pennsylvania en Michigan de enige 2 die de afgelopen 4 jaar negatieve migratiecijfers hebben gehad.
Verzoeken om stembiljetten per post
Sommige staten, zoals Californië, Colorado en Nevada, zijn "All Mail"-staten. Dit betekent dat elke geregistreerde kiezer standaard een papieren stembiljet krijgt toegestuurd. Met uitzondering van Utah (en mogelijk Nevada) zijn bijna al deze staten blauwe staten en zijn ze solide blauw. Nevada is de enige swing state die een all-mail state is, zoals u kunt zien blijven de verzoeken gelijk. De algemene trend bij de meeste andere staten, behalve Arizona, is een afname van verzoeken om een stembiljet per post.
Jaarlijkse Covid-19-vaccinatie**
Omdat het model de jaarlijkse Covid-vaccinatie-opname als uitgangspunt neemt, sterke voorspeller van de Democratische Partij, maar de algehele populariteit neemt af, gebruikt het model relatieve scores om elke staat binnen het jaar met elkaar te vergelijken. Afgezien van Wisconsin hadden de overige staten een iets ondergemiddelde Covid-19-vaccinatie in 2021**, 2022 en 2024.
*De binnenlandse migratiecijfers zijn gelijk aan die van het voorgaande jaar.
**Omdat de Covid-19-vaccins pas in 2021 beschikbaar waren, werden de gegevens van 2021 gekoppeld aan de verkiezingsuitslaggegevens van 2020. Voor 2022 en 2024 weerspiegelen de gegevens de opname voor de nieuwe versie van dat jaar.
Om een idee te krijgen van hoe belangrijk de voorspellers zijn voor het model, rangschikt de onderstaande grafiek elke maatregel op basis van hoeveel het een van de voorspellingen van het model beïnvloedt. Zoals u kunt zien, staat de Covid-19-vaccinatie direct onder 'vorige Democratische overwinning'.
Resultaten
Het model laat Harris veilig 260 kiesmannen winnen van de staten waarvan het voorspelt dat ze veilig Democratisch zullen zijn. Als Pennsylvania en Michigan in feite in de race zijn, dan zijn slechts 226 daarvan veilig Democratisch.
Volgens het model zal Trump met zekerheid 219 kiesmannen winnen in de staten waarvan het voorspelt dat ze veilig Republikeins zullen zijn.
De swing states Wisconsin, Georgia, North Carolina, Nevada en Arizona zijn allemaal te winnen en vertegenwoordigen 59 kiesmannen. Als Pennsylvania en Michigan in de mix zitten, zijn dat 93 kiesmannen die te winnen zijn.
Harris's pad naar winst
Harris' pad naar de overwinning lijkt het gemakkelijkst. Met een hogere startstem "in the bag", kan ze een handvol swing states verzamelen. Pennsylvania en Michigan worden in het model als overwinningen voor haar weergegeven, en als ze ze wint, heeft ze simpelweg Arizona, North Carolina, Wisconsin of Georgia nodig om het veilig te stellen. Als ze Pennsylvania of Michigan wint, moet ze het verlies compenseren met 1-2 extra swing states.
Trumps pad naar de overwinning
Het is belangrijk om Trumps pad te bekijken met een 'alles kan gebeuren'-mentaliteit. Hij heeft de verwachtingen overtroffen in beide voorgaande verkiezingen. De meeste informatiepoortwachters, mainstream-deskundigen en opiniepeilers hebben het in het verleden mis gehad.
Met 219 in de tas moet Trump elke toss-up staat winnen: Arizona, Georgia, North Carolina, Wisconsin en Nevada. Als Trump Pennsylvania en/of Michigan wint, wordt zijn pad makkelijker, wat betekent dat hij nog steeds 2-3 van de resterende toss-ups nodig heeft.
Bekijk het Dashboard hieronder. Interactie om te zien hoe beide kandidaten de overwinning behalen door de toss-up staten te winnen, en bekijk scatterplots voor voorspellingen gemeten per staat.
Mijn persoonlijke voorspellingen op basis van het model
Ik heb meer intuïtie over North Carolina en Georgia, omdat ik daar tijd doorbreng, en ik noem die voor Trump. Ik heb die intuïtie niet voor Arizona, Nevada of Wisconsin. Dus neem dit met een korreltje zout. Maar trouw aan de methode, noemt mijn model Pennsylvania en Michigan voor Harris, en ik geloof dat zij minstens 2-3 extra swing states zal nemen. Ik hoop dat ik het mis heb.
Referenties:
MIT Verkiezingslab https://electionlab.mit.edu/data#data
VS feiten https://usafacts.org/economy/
UF Verkiezingslab https://election.lab.ufl.edu/voter-turnout/
Stemmen en registratie bij de verkiezingen van november 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Vijf en achtendertig https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
KFF-vaccinmonitor https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
UF Verkiezingslab https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Nationaal centrum voor gezondheidsstatistieken https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Nationaal centrum voor gezondheidsstatistieken https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Volkstelling - Armoede https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Census - Bevolkingsverandering per staat https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
Amerikaans verkiezingsproject https://electproject.github.io/
Heruitgegeven van de auteur subgroep
Uitgegeven onder a Creative Commons Naamsvermelding 4.0 Internationale licentie
Stel voor herdrukken de canonieke link terug naar het origineel Brownstone Instituut Artikel en auteur.