第一节 调查问卷的回收与编辑
数据资料的处理过程是从回收第一份问卷开始的。按照事先调查方案的计划,尽量确保每份问卷都是有效问卷(所谓“有效”问卷,指的是在调查过程中按照正确的方式执行完成的问卷)。问卷回收以后,督导员必须按照调查的要求,仔细的检查问卷。检查问卷的目的在于将有错误填写,或者是挑出不完整或不规范的问卷,保证数据的准确性。所谓错误填写即出现了那些不合逻辑或根本不可能的结果,通过对调查员的复核,可以检查出哪些调查员没有按照调查的要求去访问,那么,该调查员完成的问卷可能存在很多问题。还有可能出现漏答了某些必须回答的问题,比如被访者的人口特征等基本情况,造成问卷回答不完整。
鉴于这些情况,不管是由于调查员造成的还是被访者的原因,通常有两种方式进行补救:对于出现漏答的问卷,通常要求调查员对受访者进行重访,以补充未答的问题;如果不便于重访或重访后的问卷还有问题,数目不是很多,可以当作缺失值计。如果数量非常大,这份问卷就只能当作废卷处理,并且按照被访对象的抽样条件,补作相关的样本。
问卷检查
问卷的检查一般是指对回收问卷的完整性和访问质量的检查,目的是要确定哪些问卷可以接受,哪些问卷要作废。检查的要点包括:
(1) 规定详细的检查规则,一份问卷哪些问题是必须填写完整的,哪些问题出现缺失时可以容忍等,使督导员明确检查问卷的每一项流程。
(2) 对于每份调查员交回来的问卷必须彻底地检查,以确认调查员或者被访者是否按照相关的要求完成了访问,并且完整的记录在问卷恰当的位置。
(3) 应该将问卷分成三种类型,一种是完成的问卷,一种是作废的问卷,第三种是有问题的问卷,但是通过追访还可以利用的问卷。
(4) 如果抽样中有配额的要求,那么应将完成的问卷中的配额指标进行统计分析,确定问卷是否完成配额的要求,以便及时的补充不足的样本。
(5) 通常有下面的情况的问卷是不能接受的:所回收的问卷明显不完整,缺了一页或者多页;问卷中有很多内容没有填答;问卷的模式说明调查员(被访者)没有理解或者遵循访问指南回答等;问卷的答案几乎没有什么变化,如在态度的选项上全部选择第x项的情况;问卷的被访者不符合抽样要求;问卷的回收日期超过了的访问的时限等。
问卷的校订
为了加强问卷的准确性,对那些初步接受的问卷还要进行进一步的检查和校订,在校订的过程中,通常会发现问卷中存在有字迹模糊、问题漏选的、前后回答不一致的、答案模棱两可的和跳答错误的问题。
问卷的某些问题答案可能出现字迹模糊的情况,特别是碰上无结构的开放式的问题时,因为调查员记录的不好,答案不容易识别。如果发现这样的问题,必须对受访者进行追访,将积极不清楚的地方填写清楚。
对于漏选的问题处理方法也是一样,出现漏选的题目因为各种原因,无法进行补充访问事后,普通的问题,而且数目不大的情况,通常作为缺失值处理;如果涉及到是受访对象的个人特征的问题,通常只能作为废卷处理。
问卷中有些问题的答案会出现不容易理解的模棱两可的情况,或者是使用了不是通用的缩写方式或词语,或者在该单选一项的问题中,圈选了两项等,都必须通过追访进行补救。另外就是回答时可能出现跳答错误的情况,这可能是因为被访对象没有很好的理解问题。如果出现这种情况,首先要核实被访对象是否符合抽样调查的条件(跳答题目往往是筛选条件),如果符合,进行追问补充,如果不符合条件,问卷只能作废,重新补充样本。
问卷的回收、检查与校订可能是非常繁琐、且工作时间很长的工作,但是却是保证数据处理过程中较少误差的重要的步骤。
问卷的编码
编码是指对一个问题的不同答案进行分组和确定数字代码的过程。大多数问卷的大多数问题都是封闭式的,在调查之前就已经完成了编码的过程,即每一组问题的不同答案的数字编码已经确定。
而开放式问题,因为不知道会得到什么答案,或者是希望得到比列出的封闭式的选项更详尽的答案,所以在调查结束后,必须对这些开放式的问题进行事后编码。开放题的事后编码的工作量很大,无法预知会出现多少个新的代码和答案,而且有些答案是非常类似的,必须决定是否合并成一类呢,还是分成不同的代码。具体地说明编码需要以下几个步骤:
(1) 每个需要编码的项目都必须有一份编码表,将问题和项目的代码详细的标注在编码表的顶端位置,由于事先不知道会有多少新的代码或答案出现,所以一定要预备足够的空间。
(2) 如果编码的工作由一个编码员完成,出现错误的可能性相对较小。但实际上,因为需要编码的问题可能很多,一个认识没有办法按时完成的,这就需要多个编码员。在这样的情况下,一定要注意多个编码员工作的协调。应该安排编码员在不同的时间,或者相同的时间相同的地点,使用同一个编码表。这样可以避免编码重复的情况。
(3) 研究人员应详细制定编码的守则,指导编码员如何识别答案,并且将其归类,以及如何分配编码等等,并同时对编码的过程进行监督和检查。编码员在编码的过程中可能有两种倾向:一种是事无巨细将出现的每一种答案够给与新的代码,结果代码的数量比预料的要多出很多;另一种情况是对答案的归类过于粗糙,可能丢弃了数据中有意义的差异。对于这两种情况都必须通过守则的规定,尽量避免。碰到无法确认的分类的时候,通常的做法是付与一个新的代码,如果需要合并,可以在将来的数据处理过程中完成。
(4) 可以对“不知道”、“无所谓”、“不清楚”、“缺失”事先规定,但是一定要注意规定的编码与实现对该问题的最大编码的预计的数量一致。
(5) 编码的字迹必须清楚,如果可能的话,及时的进行计算机的录入管理。