在当代社会研究中,内容分析成为社会科学家们普遍使用的重要工具。这种技术不仅可以应用于文本和沟通的各种形式,例如文字、图像以及音频或视频,还能通过系统性的方法揭示社会现象的模式。内容分析的优势在于其非侵入性,远比调查或模拟社会经验更为简便。无论是质性分析还是量化分析,在学术界都有其专属的实践和哲学。
「内容分析是一种研究技术,旨在客观、系统和量化地描述通讯的显性内容。」
进行内容分析时,研究者需要回答六个关键问题:分析哪些数据?这些数据是如何定义的?数据源自于哪个人群?相关的背景如何?分析的边界是什么?最终要测量的是什么?最简单的内容分析方式是计算文本的明确特征,如字词频率或文章的长度。然而,单单依赖字词频率的限制在于单词的意义往往依赖于上下文。关键字上下文(KWIC)技术试图通过上下文来解释单词,减少同义词或多义词带来的歧义。
量化内容分析强调对已编码频率的统计分析,通常以假设为起点,事先确定编码类别,这些编码类别与研究者的假设密切相关。这种分析通常是演绎式的,并且需要有严格的范畴。在对应于开放数据库DOCA,这个数据库收录、系统化并评估来自于沟通及政治科学研究领域的相关内容分析变数时,量化内容分析展示了其强大的应用潜力。
「量化分析过于简化复杂的通讯,使其更加可靠。」
质性分析则着重于潜在解释的细致入微,它不仅仅关注显性意义,同时强调研究过程中的变化与发现。通过质性内容分析,研究者能够更深入地研究文本中的潜在意义,基于这些发现,研究的方向可能会有所调整。
内容分析的数据收集工具是编码手册或编码计划。在质性内容分析中,编码手册在编码过程中不断完善,而量化内容分析的编码手册则需要在编码前就经过可靠性和有效性的预测试。编码手册中包括给予人类编码者的详细指令,清晰定义相应的概念或变数以及其指定的值。
随着计算机技术的进步,基于计算机的分析方法越来越受青睐。开放式问题的回答、报纸文章、政党纲领及医疗记录都能被进行系统性的文本数据分析。计算机辅助分析有助于减少处理大量电子数据集所需的时间,并减少多位编码者之间的一致性需求。尽管如此,人类编码者在分析中仍然不可或缺,因为他们往往能够挖掘文本中的微妙含义。
正确的编码程序对于从文本中做出有效推断至关重要,因此不同的人应该以相同的方式编码相同的文本,这就是测量可靠性的重要性。研究者建议在进行内容分析时,至少应使用两位独立的编码者。若未测量编码者之间的可靠性,那么数据的可靠性就无法得到保证。为了确保所有变数或测量的有效性,专家还应对编码指导、定义及示例进行审查并提出修改意见。
内容分析目前可应用于五种文本类型:书面文本(如书籍和论文)、口头文本(如演讲和戏剧表演)、图示文本(如画作和标志)、视听文本(如电视节目和电影)及超文本(互联网文本)。内容分析的历史可以追溯到19世纪末,初期主要以手工方式进行,通过计算报纸中某个主题的列数来进行分析。最近几年,随着大数据的兴起,尤其是社交媒体的发展,内容分析变得更加重要。
当然,内容分析的优缺点仍然存在,量化内容分析被批评为过于简单,而质性内容分析又被指责为缺乏系统性。那么,在这两种方法之间,什么样的内容分析方法能够最有效地揭示社会现象的本质和意义呢?