

这些民意调查是如何进行的
以下是《纽约时报》和锡耶纳学院(Siena College)进行的这些民意调查的关键内容:
?从10月24日至11月2日,采访者采访了七个战场州的7879名可能的选民,其中包括亚利桑那州的1025名选民、佐治亚州的1004名选民、密歇根州的998名选民、内华达州的1010名选民、北卡罗来纳州的1010名选民、宾夕法尼亚州的1527名选民和威斯康星州的1305名选民。
?泰晤士报/锡耶纳民意调查是通过电话进行的,使用英语和西班牙语进行现场采访。总的来说,超过98%的受访者是通过手机进行调查的。
?从登记选民名单中选择选民进行调查。这份名单包含了每个登记选民的人口特征信息,使我们能够确保我们达到每个政党、种族和地区的正确数量的选民。在这些民意调查中,采访者向32万多名选民打了大约85万个电话。
?为了进一步确保结果反映了整个投票人口,而不仅仅是那些愿意参加民意调查的人,我们给予来自调查受访者中代表性不足的人口群体的受访者更多的权重,比如没有大学学位的人。你可以在页面底部的“样本构成”下看到更多关于受访者特征和加权样本的信息。
?七个摇摆州的潜在选民的抽样误差幅度为正负1.3个百分点,每个州的民调误差幅度约为正负3.5个百分点。从理论上讲,这意味着结果应该在大多数时候反映总体人口的观点,尽管许多其他挑战会产生额外的误差来源。当计算两个值之间的差异时——比如候选人在一场比赛中的领先优势——误差幅度是两倍大。
2024年宾夕法尼亚州的《泰晤士报》/锡耶纳民意调查是与《费城问询报》(Philadelphia Inquirer)合作进行的,部分资金来自伦菲斯特新闻研究所(Lenfest Institute for Journalism)。该调查是独立于该研究所设计和实施的。
如果你想了解更多关于《泰晤士报》/锡耶纳民意调查是如何以及为什么进行的,你可以在这里看到常见问题的答案,并提交你自己的问题。
完整的方法
《纽约时报》和锡耶纳学院在10月24日至11月2日期间,通过手机和固定电话对7个关键州的7879名选民进行了调查,调查用英语和西班牙语进行。从10月24日到11月1日,乔治亚州的1004名选民和内华达州的1010名选民、亚利桑那州的1025名选民、北卡罗来纳州的1025名选民、威斯康辛州的1305名选民、宾夕法尼亚州的1527名选民和密歇根州的998名选民将于10月29日到11月2日进行投票。
对于每次民意调查,可能选民的抽样误差幅度在亚利桑那州为正负3.4个百分点,在佐治亚州为正负4.1个百分点,在密歇根州为正负3.7个百分点,在北卡罗来纳州为正负3.6个百分点,在内华达州为正负3.6个百分点,在宾夕法尼亚州为正负2.9个百分点,在威斯康星州为正负3.4个百分点。
样本
该调查是对登记选民进行的经回复率调整的分层抽样,样本来自无党派选民档案供应商L2维护的选民档案,并补充了Marketing Systems Group提供的与选民档案匹配的额外移动电话号码。《纽约时报》通过多个步骤选择了样本,以解释各州电话覆盖率的差异、无回应和电话号码生产率的显著差异。
为了调整非报道偏见,每个州的L2选民档案按州议会选区、政党、种族、性别、婚姻状况、家庭规模、投票率历史、年龄和住房所有权进行了分层。计算了每个阶层有电话号码的登记者的比例和平均预期回复率。平均预期回复率是基于先前Times/Siena调查的单位无反应模型。初始选择权重等于地层平均电话覆盖率和模型响应率的倒数。对于在L2文件中有多个电话号码的应答者,或者与L2和Marketing Systems Group的电话号码不同的应答者,将选择具有最高模型响应率的号码。
在威斯康辛州,历史上有很大一部分选民在选举日登记,我们从Marketing Systems Group获得了未登记选民的补充样本。《纽约时报》根据姓名、性别、年龄和所在地排除了与L2选民档案中登记的选民相符的记录。威斯康星州可能的选民包括来自该样本的304个访谈。
菲尔丁
样本按政党、种族和地区分层。Marketing Systems Group对样本进行了筛选,以确保手机号码是活跃的,锡耶纳学院研究所进行了民意调查,ReconMR、北佛罗里达大学民意研究实验室、罗厄诺克学院政策与民意研究所、南卡罗来纳州温斯洛普大学民意与政策研究中心和新罕布什尔大学调查中心也进行了额外的实地调查。采访者询问选民档案上的名字,如果预定的回答者不在,就结束采访。总的来说,超过98%的受访者是通过手机联系上的。
这些问题由ReconMR翻译成西班牙语。双语采访者以英语开始访谈,并被指示跟随受访者的领导,决定是用英语还是西班牙语进行调查。说西班牙语的单语受访者最初由说英语的采访者联系,后来由说西班牙语的采访者重新联系。总的来说,在自我报告的西班牙裔人中,12%的访谈(14%的加权样本)是用西班牙语进行的。
如果受访者在被问及用于加权的两个自我报告变量——年龄和教育程度——并回答了至少一个关于年龄、教育程度或总统选举候选人偏好的问题后,没有退出调查,那么访谈就被确定为完整,以纳入有关受访者将投票给谁的问题。
加权(登记选民)
《纽约时报》使用R中的调查包分多个步骤对该调查进行加权。
首先,对样本进行了调整,以适应不同阶层的不平等选择概率。
其次,对每个民意调查进行加权,以匹配登记选民特征的基于选民文件的参数。
使用了以下目标:
?政党(如果在该州有政党登记,则根据参加党派初选的情况进行分类,如果在该州有政党登记,则根据之前时代/锡耶纳民意调查中的投票选择模型进行分类),根据被调查者的种族是否被建模为白人或非白人(L2模型)
?2024年提前投票的有效记录(L2数据和《纽约时报》汇编的数据),包括威斯康星州以外的政党。
?种族或民族(L2模型)
?年龄(自我报告的年龄,如果被调查者拒绝,则按性别填写选民档案年龄)(L2数据)
?教育(自我报告的教育水平分为四类,加权后与纽约时报/锡耶纳民意调查、人口普查数据和L2选民档案得出的目标相匹配)
?按大学或非大学教育程度划分的白人/非白人种族(L2种族模型加权,以匹配基于纽约时报的目标,该目标来自乔治亚州以外的州的人口普查数据;L2种族加权模型,以匹配《纽约时报》根据格鲁吉亚人口普查数据生成的目标)
?婚姻状况(L2模型)
?住房所有权(L2模型)
?投票率历史(纽约时报基于L2数据的分类)
?2020年选举的投票方法(纽约时报基于L2数据的分类),在宾夕法尼亚州以外的州
?州地区(纽约时报分类)
?2020年总统初选的投票历史(L2数据),在北卡罗来纳州
?密歇根州人口普查区的受教育程度(纽约时报根据人口普查数据进行分类)。
最后,完成调查中所有问题的受访者样本的权重与整个样本的大选赛马问题(包括倾向于某种方式的选民)的结果相同。
加权(可能是选民)
《纽约时报》使用R调查包分多个步骤对该调查进行加权。
首先,对样本进行了调整,以适应不同阶层的不平等选择概率。
其次,根据2020年大选的投票率模型,对第一阶段的权重进行了调整,以考虑登记选民在2024年大选中投票的可能性。
第三,对样本进行加权,以匹配可能选民组成的目标。可能选民组成的目标是通过汇总L2选民档案中前面步骤中描述的个人层面的投票率估计而得出的。加权所用的类别与前面提到的登记选民相同。
第四,对最初的可能选民权重进行了调整,以纳入自我报告的投票意向。在2024年大选中提前投票记录有效的受访者获得了全部权重。对于其余的受访者,登记人在2024年选举中投票的最终概率中,有五分之四是基于登记人事先模拟的投票率,五分之一是基于自我报告的意图,这是基于之前的《泰晤士报》/锡耶纳民意调查,其中包括考虑到调查受访者比非受访者投票率更高的趋势的惩罚。最终的可能选民权重等于建模的选民权重乘以最终的投票率概率,再除以事前建模的投票率概率。
最后,完成调查中所有问题的受访者样本的权重与整个样本中大选赛马问题(包括leaners)的结果相同。
加权(未登记的威斯康辛选民)
威斯康辛州未登记选民的样本由时报分多个步骤使用R调查包进行加权。
首先,根据受访者自我报告的登记状态,以及他们之前是否在目前的地址报告过在威斯康星州投票,给他们一个未登记的基本概率。
其次,根据年龄、种族、教育程度、性别和地区,对样本进行加权,使其符合基于人口普查的目标,以确定威斯康星州未登记选民的人口特征。
第三,威斯康辛州未登记选民投票的可能性是基于他们自我报告的投票意向。
最后,根据对L2选民档案的分析,包括2016年和2020年选举后的投票历史和登记日期,对未登记的受访者进行加权,以代表4%的可能选民。
误差幅度反映了调查的设计效果,衡量由于调查设计和加权而造成的统计力损失。
在整个样本中,亚利桑那州可能的选民的设计效应为1.27,乔治亚州可能的选民为1.60,北卡罗来纳州可能的选民为1.37,内华达州可能的选民为1.37,密歇根州可能的选民为1.45,宾夕法尼亚州可能的选民为1.34,威斯康星州可能的选民为1.61。
在登记选民中,亚利桑那州的抽样误差幅度为正负3.4个百分点,其中包括1.24的设计效应;乔治亚州为正负3.5分,包括1.3的设计效应;北卡罗来纳的正负3.6分,包括1.37的设计效应;内华达州的正负3.4分,包括1.25的设计效应;密歇根州的正负3.5分,包括1.29的设计效应;在宾夕法尼亚州,正负2.8分,包括1.26的设计效应;在威斯康辛州,包括1.72的设计效应在内,正负3.6个百分点。
对于已完成的访谈样本,在可能的选民中,亚利桑那州的抽样误差幅度为正负3.6个百分点,包括1.28的设计效应;乔治亚州得分正负4.1分,包括1.61的设计效应;北卡罗来纳州的得分为正负3.7分,包括1.37的设计效应;内华达州的正负3.8分,包括1.42的设计效应;在密歇根州,正负3.9分,包括1.45的设计效应;宾夕法尼亚州的正负3分,包括1.37的设计效应;在威斯康辛州,包括1.36的设计效应在内,正负3.7分。
从历史上看,在大选前最后三周进行的调查中,时报/锡耶纳民意调查(The Times/Siena Poll)在第95百分位的误差为正负5.1个百分点。真实世界的误差包括抽样误差以外的误差来源,如无反应偏差、覆盖误差、未决定选民的后期转移和估计选民组成的错误。