1
社会科学方法论
1.11.6.2 二、定性数据分析

二、定性数据分析

定性研究和定量研究有着不同的数据分析程序。定量数据分析遵循的是演绎逻辑:在研究开始之前提出研究假设,然后再收集数据来验证研究假设是否成立。与此相反,定性数据分析使用的是归纳逻辑:先收集数据,然后再对数据进行编码、分类和提炼,从中归纳出一般理论性解释。与定量研究先收集数据再分析数据不同,定性研究在收集数据的同时就要分析数据,这一过程一直要持续到研究结束为止。

定性数据主要涉及实地观察记录、访谈记录、相关文献、日记、杂志等文字资料。这些文字资料通常比较多,几万字、十几万字甚至更多资料并不是太难得,其中可能有许多不相关的数据,甚至有冗余的数据。数据分析的目的是从所收集的数据中获得认知和理解。定性数据分析是“对所收集的大量数据进行排序、结构化并赋予意义的过程。”(Marshall et al.,1995:111)定性分析的主要特点是将复杂的数据分解成组成部分,再通过编码、删减、分类和重构等程序来获得对数据更深入的理解、对问题更明确的认知,对假设进行反复检验。

在定性研究过程中,研究者就是研究工具。为了准确地理解数据,研究者就要尽量摒弃已有偏见、观点和假设对数据收集和分析可能带来的干扰。因此研究者要对自己的偏见、观点和假设进行“悬置(epoche)”,通过“悬置”来摆脱个人看法的影响,从而实现对数据的客观分析。定性数据有不同的分析手段,比如,可以使用看板或其他可视化数据展现方式。为了减轻数据分析的负担,可以采用复印、剪辑、索引卡片、流程图以及在页边空白处加批注等方式对数据进行加工处理,这种办法又称为“分析墙报”,可以同时把数据呈现给大家。定性数据也可以用电脑软件来处理。目前已有多款定性数据分析软件,主要有“Atlas.ti 7.0”“Nvivo 9.0”“QSRNUD.IST”和“Ethnograph 5.0”,这些软件可以代替大部分的手工操作,具有对数据的检索、分类、编码、注释、连接和显示等功能。编码是定性数据分析的第一步。定性数据编码不同于定量数据编码,在处理定量数据时,编码通常是一种处理数据的方法,而在定性数据分析中,编码是深化认知和形成理论性解释的起始步骤,也是数据分析的整合过程。这一过程受到研究问题引导,并启发新的问题。所谓定性数据编码是一种将意义单元赋予数据的标签,是研究者从繁芜复杂数据中寻找意义单元并在概念和主题上进行相互关联的程序。编码是研究者将数据单元化的一种努力,通常是逐字逐行进行的,意义单元可以是一个词、几个词、一个句子、几个句子或一整段话等。定性数据编码是一项极为烦琐和辛苦的工作,许多研究者面对堆积如山的资料,却有百思不得其解的困境。对研究新手来说,编码可能是研究过程中最困难的环节。编码有许多方法,施特劳斯和科宾(Strauss et al.,1990)在著名的扎根理论中提出了三种编码:把数据分解成单元的“开放性编码”,甄别不同类别之间关系的“主轴编码”,把类别整合成理论的“选择性编码”。

(一)持续比较策略

在完成了对数据的初步编码后,就要进一步挖掘数据的深层结构。在这个过程中,研究者使用了多种分析策略。其中最常见的分析策略是:持续比较和分析性归纳。持续比较策略是由格拉泽和施特劳斯(Glaser et al.,1967)首先提出的,后来由林肯和古巴(Lincoln et al.,1985)进行了完善。持续比较策略主要有以下四个步骤:

(1)根据比较对事物进行分类。这个步骤的重点是,对不同个体进行比较,发现它们的共同点,把它们归入同一个类别组。研究者在通读全部数据的基础上,按照数据初始编码的属性进行分类,标注出每个数据可能隶属的类别,并将每个个体放入到一个临时类别组中。在分配新个体时,要将新个体与先前放入的其他个体进行比较,再决定是否放入新个体。如果有的个体无法放入任何一个类别组,那么就要创建新的类别组。例如,研究者想要弄清人们购买“网上服务”的原因,研究者收集了几位受访者的访谈数据,并把数据转录在一张张卡片上。研究者发现第一张和第二张卡片都提到了“网上服务”上传的新闻快捷,研究者就把这两张卡片放在同一个类别组,取名为“新闻”。随后的卡片又提到了电子邮件,无法放在“新闻”组,只能单立出来。接下来的卡片上又提到了在线聊天,研究者认为在线聊天与电子邮件相似,于是就设立一个新的类别组,取名为“人际交流”。分类过程需要对所有数据进行归类,不断对类别进行调整和修正。

(2)对分类进行压缩和重组。在不断完善类别组的过程中,研究者要利用矩阵、图表、图形和网络对分类进行重组,厘清每个类别所解释的命题,不断完善命题,探究逐步显露出来的理论维度。这些命题有助于引导进一步收集数据,厘清研究者的概念性关联和概念性构想,并最终确定研究结果。例如,当研究者看完了包括“人际交流”类别在内的全部卡片后,可能会得出这样的命题:“人们购买网上服务是为了扩大朋友圈子”,对其他类别组也可以得出类似的说明或命题。

(3)确定各类别主题及其相互关系。第三个阶段是确定各类别组之间关系及其共同模式,这一阶段的目标是进一步对类别组进行重组和整合。研究者要对各类别组命题进行比较,寻求其中有意义的关联。有些命题可能非常强势而自成一类,而有些命题可能只限于某些方面的关联。再举网上服务的例子,研究者可能形成了多个扩展意向的命题。人们订购网上服务是为了增加购物机会、扩大挑选余地、拓展新闻来源。研究者据此可以将人们订购网上服务的根本原因归纳为:拓展个人的信息空间。

(4)将数据归纳成统一的理论框架。本步骤的目的是获得对事物的充分理解。持续比较过程的最后阶段需要完成研究总结报告。先前分析所获得的结果都被整合为对现象的连贯和系统的解释。研究者力图对研究中所获得的想法提出简明扼要的阐释。

(二)分析性归纳策略

与持续比较策略不同,分析性归纳策略整合了分析数据和构建假设这两个过程,主要包括以下步骤:

(1)确定一个感兴趣的选题并提出假设。

(2)研究某个案例来验证假设,如果假设不成立,就要提出新的假设。

(3)通过研究其他案例,使假设更加精确。

(4)用反面案例来进一步完善假设。

(5)不断重复第(4)步骤,直到充分验证了假设(Stainback et al.,1988)。

分析性归纳策略要求在研究之初就提出假设,所有对现象的解释都是以假设的面貌出现的。这个过程与持续性比较策略有很大的不同,后者对现象的解释源自最终研究结果。例如,研究者想要弄清人们收看家庭购物节目的原因。研究者被告知,人们想要买东西才去看这个节目。研究者无法肯定这种解释的准确性,就把这种解释当成一种假设,并用一些实例来进行验证。研究者首先对某位购物节目观众进行了访谈,他发现,尽管这位观众通过节目购买了几件商品,但是收看节目的真正原因是了解新产品。根据这个信息,研究者修正了最初提出的研究假设:人们收看家庭购物频道是为了买东西和了解新产品。研究者接着对另一位收看购物节目的观众进行了访谈,他的回答大致与研究假设相一致,但是还提供了其他原因:他收看节目主要是为了了解商品价格,把这个价格与商店里的价格进行比较。研究者于是再一次修改了研究假设:人们收看购物频道的原因主要与消费实践有关:为了购买产品、了解产品以及比较价格。在接下来的研究中,研究者继续寻找与新的假设有出入的案例。研究者发觉,他迄今访谈的对象都是高收入人士,低收入者收看购物频道或许有别的原因。研究者又对某位低收入者进行了访谈,发现该低收入者收看节目是出于“觉得观看别人卖东西非常有趣”。像前几次一样,这个回答也被吸纳到新的研究假设中。随后,研究者继续访谈不同背景的观众来检测新假设的效度,一旦有了新的解释就对研究假设进行修正,直到再也没有新的解释案例出现为止。