网络舆论与意见领袖

网络舆论领袖测量方法初探[1]

所谓舆论领袖就是在政治竞选投票过程中,经常给别人提供建议的人。舆论领袖现象最早被哥伦比亚大学应用社会研究所拉扎斯菲尔德(Lazarsfeld)、贝雷尔森(Berelson)等人于1940年在美国依利县有关政治选举研究中发现。[2]随着各个学科对舆论领袖现象的日益关注,西方产生了丰富的舆论领袖测量方法和理论成果。随着互联网在中国社会日益普及和网络言论影响力的加大,加强舆论领袖的舆论引导作用的论述逐渐增多。但是,这些文章的论述多停留在表面泛泛的议论和断言。由于缺乏明确的可操作性定义和测量方法,学者们尚难以对此进行科学实证的考察。本篇欲对20世纪90年代以来西方网络舆论领袖测量的两个重要研究取向做一简单评述,为国内开展相关研究提供参考。一个是将传统舆论领袖测量方法移植到网络,另一个是采取与传统舆论领袖测量截然不同的方法,即数据挖掘方法测量舆论领袖。前者可以称为“用传统方法研究现代问题”,后者可以称为“用现代方法研究现代问题”。

一 网络舆论领袖测量方法——移植取向

传统舆论领袖测量方法很多,罗杰斯(Rogers)将这些方法归类总结为:社会计量法(sociometric techniques)、关键人物访谈法(interviews with key informants)、观察法(observation)、自我报告法(self-designating techniques)。自我报告法实施起来简单、经济,可以用来进行大规模测量,因此为最常用的方法;量表在实际使用过程中也不断得到改善和更新。第一个舆论领袖测量量表由卡茨和拉扎斯菲尔德于1955年创建,称为Katz and Lazarsfeld量表,在迪凯特研究中首次使用。Katz and Lazarsfeld量表创建之后的50多年间,一系列量表相继提出,按照时间先后顺序依次为:1962年的Rogers & Cartano量表;1965年的Troldahl & van Dam量表;1970年的King & Summers量表;1978年的Levy量表;1986年的Childers量表;1994年的Flynn,Goldsmith & Eastman量表。因此,从1955年到1994年,是舆论领袖测量方法形成、发展和成熟的阶段。

与丰富的传统舆论领袖研究成果相比,网络舆论领袖研究成果当时颇为匮乏。相关研究倾向于使用量化手段来测量网络交易型社区舆论领袖,使用最多的方法为自我报告法,其次是社会计量法。

自我报告法即数据收集依赖受访者自己的判断和回答。用自我报告法测量舆论领袖经常采用量表。量表由一组问题构成,用以间接测量人们在某一态度或观念上的状况。因此舆论领袖测量量表就是一组测量人们关于舆论领袖心理素质的问题,通过累加所有问题回答得分而得出舆论领袖指数。社会计量法(也称社会网络分析法)是一种调查人们社会关系特征和群体特征的测量方法。这些特征不同于个人特征,它们必须通过人们之间的交往或互动关系来反映。社会计量法的实施程序一般如下。(1)根据调查内容设计一份简单的问卷,如询问“你和谁来往最密切?”“你认为谁最有威望?”等问题。(2)让被调查的群体中的每个成员都填写这份问卷。(3)将每个人编号,计算每个人被选择的次数及选择他人的次数。(4)根据统计数据绘制社会图(Sociogram)、社会矩阵(Sociomatrix)或进行指数分析。社会图、社会矩阵可以直观地了解人际交往的网络。指数可用来分析个人在群体中的地位、威望等,并能了解群体的凝聚力、组织管理、社会交往等方面的情况。社会计量法特别适用于小群体研究。

将传统自我报告法运用于网络舆论领袖研究的做法通常有三种:一为网下问卷调查人们上网时的情况;二为网上发布问卷进行调查;三为网上和网下调查相结合。问卷的测量题项沿用传统舆论领袖测量量表。研究思路大多根据舆论领袖指数将网上的人群二分为舆论领袖及跟随者,对比两类人群,描述舆论领袖的特征。例如,澳大利亚的芭芭拉·莱恩斯(Barbara Lyons)、肯尼斯·亨德森(Kenneth Henderson)在舆论领袖对电子商务的推动作用研究中,采用传统舆论领袖的定义来定义网络舆论领袖,运用Childers量表测量舆论领袖指数,[3]采取网下自填式问卷方式,将使用计算机中介交流技术的人群二分为舆论领袖及跟随者,并考察两类人群使用电子商务的差异。研究发现:采用传统舆论领袖量表测量网络舆论领袖的信度较佳(α=0.74),可以成功将网络使用者二分为网络舆论领袖与跟随者;二者在产品知识、产品卷入度、产品采纳行为、网上投入时间、网上讨论方面存在显著不同。[4]宋英洙(Youngju Sohn)在有关韩国品牌数码产品虚拟社区的研究中,采用Flynn,Goldsmith & Eastman量表[5]进行舆论领袖测量。该研究运用网上问卷和电子邮件邮寄问卷等方式调查了124名网民,请他们填答浏览韩国数码相机品牌社区时的一些行为和心理。该研究对网民网上、网下的心理和行为进行相关分析,发现网络舆论领袖在网上与现实生活中的表现有所不同,网络舆论领袖在现实生活中并不是一呼百应的舆论领袖。[6]

同样,运用社会计量法测量网络舆论领袖也不过是把研究的场域从现实世界搬到虚拟空间而已。在已有的运用社会计量法测量网络舆论领袖研究中,一般采用虚拟社区成员之间提名的方式进行测量。例如南希·贝姆(Nancy Baym)在对一个肥皂剧新闻组虚拟社区所做的研究中,要求社区成员在问卷调查中指出社区的舆论领袖。研究发现那些社区的“常客”、发帖多的社区成员很容易被其他社区成员以及社区边缘参与者(潜水者)认可为舆论领袖。[7]日本学者I.Kaneko采用社会网络法来分析一个邮件组成员之间的交往关系。通过分析电子邮件回复形成的社会网结构来界定有影响力的邮件和人物,分析这些具有影响力的人物在社区危机管理中的作用。[8]

将传统舆论领袖测量方法移植到网络面临一些问题。使用社会计量法的前提是群体成员彼此之间了解、熟悉,因此该方法适用于凝聚力较强、规模较小的群体,不适合对大范围群体的调查研究。庞大、漂移和隐秘的网络社区的用户之间缺乏足够的了解和互动,因此社会计量法运用于网络舆论领袖测量存在困难。自我报告法最大的问题在于回答的主观性,极有可能一些自认为是舆论领袖的人实际上并不是舆论领袖,或者一些实际上是舆论领袖的人却没有被包含在舆论领袖群体中。因此在某种程度上,自我报告法更多的是测量人们自认为的舆论领袖心理,而不是真正的舆论领袖。同时,现有网络舆论领袖研究样本多是自愿样本或便利样本,研究结论的适用面大打折扣。

二 革新取向网络舆论领袖测量方法——数据挖掘

基于文本(Text-based)的计算机中介交流(CMC)与面对面交流的根本不同在于交流双方并不见面,很多时候也不知对方为何许人,只是通过文本交流进行沟通和发展友谊。“线索消除论”(clues filtered out theory)认为CMC消除了很多面对面交流中的必要因素,比如面部表情、目光接触、肢体语言、语音语调;“社会环境线索缺乏假设”(lack of social context clues)认为CMC缺乏语言以外的社会环境线索(如年龄、性别、教育程度、收入、职业等),而这些是确定交流者个人特征及社会地位的重要因素。[9]在缺乏社会线索的虚拟空间,人们不能根据社会线索来确定社会身份,只能根据交流文本来寻找写作者的社会线索。李(Lea)和斯皮尔斯(Spears)指出计算机中介交流对交流对象个人情况了解的缺乏会导致人们倍加关注语言信息中所透露的个性特征。[10]因此基于文本交流的CMC研究的重点应该放到语言交流上。而革新取向测量舆论领袖的方法则是根据计算机中介交流的特点而研发的新方法,通常需要借助新技术、新手段。2002年以来,国外网络舆论领袖研究的最新方法是数据挖掘。

数据挖掘是20世纪80年代以后发展起来的新研究领域,在银行、证券、保险、电信、零售、交通、航空、石化、能源等领域得到广泛应用。随着计算机的普及和数据的大量积累,数据挖掘在电子商务、快速消费品行业甚至社会科学研究领域如语言文字研究中大显身手。

数据挖掘指从大量数据中抽取潜在的、有价值的知识(模型或规则)的过程,就好比在一堆矿石中寻找金子。数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。随着科技的发展,数据挖掘工作可以变得易于操作,就如同随着SPSS、SALS等大型统计分析软件的出现,社会科学的统计分析变得轻松有效一样。事实上,SPSS中的因子分析、聚类分析、回归分析都是数据挖掘技术。只不过数据挖掘与统计分析和分析报告相比,“分析报告给你后见之明(hindsight),统计分析给你先机(foresight),数据挖掘给你洞察力(insight)”[11]。分析报告为事后亡羊补牢之举;统计分析是对研究假设进行检验以发现事物发展规律;而数据挖掘则不需要研究者事先提出研究假设,其通过挖掘现有数据,抽取规则,从而预测趋势和行为,支持人们的决策。

清华大学毛波、尤雯雯以BBS类型虚拟社区中知识共享型版面为主要研究对象,根据社区成员所发表文章对社区整体知识形成和共享过程的贡献,利用数据挖掘技术,对虚拟社区中所发表的文章进行定量分析总结,提出了知识共享型虚拟社区的成员分类模型,将社区的成员归纳为领袖、呼应者、浏览者、共享者和学习者等5种类型,提出每种类型成员的活动特点。其成员分类模型在BBS类型虚拟社区的交易型版面和其他版面中也得到了验证,为今后深入研究虚拟社区成员的行为模式提供了必要的基础。[12]

日本学者松村真宏(Naohiro Matsumura)、恩泽幸雄(Yukio Ohsawa)、石塚满(Mitsuru Ishizuka)运用数据挖掘技术提出“影响力扩散模型”(Influence Diffusion Model,IDM),从文本内容和交往网络两个方面来测量网络角色类型,筛选出舆论领袖。该模型基于以下两个前提假设构建。(1)在基于文本的计算机中介交流环境下,人们通过发、回帖子来表达观点;论坛对话链(comment-chain)体现影响力的传递结构。(2)词语为组成帖子的基本单位,在基于文本的计算机中介交流环境中,论坛交流通过词语来表达和传播。该模型将影响力定义为词语在对话链中传播的程度,数据计算为有回复关系的上下游帖子的词语交集与下游帖子词语数的比值。该方法采用先进的网络数据采集技术(Pearl)下载网络论坛的交谈内容;在保持交谈内容结构(讨论串结构)基础上,将文本自动切分为词语集合,通过程序智能比对上下游帖子词语,最后由计算机根据算法自动给出论坛中每个发帖人的影响力。

图1为一个对话链的示意图。实线箭头表示帖子回复关系,虚线箭头表示影响力。

图1 IDM模型解释

在图1中,C1为主帖,C2、C3分别回复C1,C4则回复C2。C1帖包含A、B、C共3个词语,C2包含A、C、D共3个词语,C3包含B、F共2个词语,C4包含C、F共2个词语。C1、C2词语交集为A、C,因此帖子C1对C2影响力为2/3;C1与C3词语交集为B,C1对C3影响力为1/2;C1、C2、C4词语交集为C,C1对C4影响力为2/3×1/2。

帖子在论坛中的总影响力为帖子对论坛其他所有成员的影响力之和。发帖人的影响力等于其发帖影响力之和。作者用该模型分析了日本一些论坛和邮件列组,证明模型的解释力“出乎意料地大”[13]

三 启示

网络舆论领袖研究方法的“移植”和“创新”两个不同取向事实上存在于整个新媒体研究中;随着传播科技的发展,特别是网络媒体的出现和迅猛发展,传统研究方法和范式已经遇到挑战。

国际传播学界很早就关注新媒体,如1996年国际传播学界权威学术刊物《传播学杂志》出版新媒体专辑,2000年《新闻学与大众传播季刊》的春、秋季两期刊登网络传播研究方法文章,提醒学者注意互联网对传统大众传播研究方法的影响,机遇与挑战共存。[14]

机遇主要来自数据收集的便捷性。在数字化、网络化浪潮一浪高过一浪的背景下,“新产生的信息差不多都是与生俱来就数字化、网络化的,一切有意义的资料信息也在被重新数字化而且迟早会网络化。这对于社会科学来说,预示着极大幅度提高数据采集效率的潜力。庞大的上网人群也给社会科学家进行从未有过的广泛且高效的调查提供了天然的基础”[15]。大规模数据收集曾经是大众传播研究的瓶颈之一,而在线调查、在线内容分析等可以轻松实现数据收集工作;而且如果有合适的分析工具,数据的分析工作可以在收集的同时完成。

但互联网给传播研究者带来机遇,同时也带来挑战。挑战来自以下两方面:第一,研究的信度和效度;第二,网络传播衍生的新问题、新领域呼唤新方法。

信度和效度是评估研究质量的两个基本原则,网络研究也不例外。将传统舆论领袖测量方法移植到网络面临的主要问题就是抽样误差,即样本是否能够代表所有网民。由于目前无法建立完备的网民抽样框,目前的网民样本很多都是便利样本。以网上问卷为例,大多数研究的操作方法为在网站上投放问卷或电子邮件邮寄问卷。若把问卷放在网站上,由访问者自愿填写,面临的问题是:能否吸引足够多的人填写问卷;填写问卷的人是否符合对调查对象的要求;是否有人多次填写同一问卷。用E-mail发送问卷,必须掌握足够多的邮件地址,并应按随机原则挑选调查对象,否则不具有代表性。在抽样框无法确定的调查中,拒答率也难以确定。只有在抽样框和入选概率已知(即概率抽样调查)的情况下,才可以进行对拒答误差的测量或者评价。

由于缺乏足够的抽样框,有些网络调查公司创建固定网络调查小组作为调查对象,这不失为一种可行的办法。但这个方法也存在一定的问题。首先是小组成员流失率高,一般每年有30%~40%的成员流失。其次是威胁效度的因素:随着网络调查小组成员受调查经验的积累,他们对问题的回答可能与初次接触问题的被调查者存在差异,从而导致测量误差。因此,将传统研究方法移植到互联网,需要解决概率抽样这个社会科学研究进行科学推论的前提。

网络传播衍生的新问题、新领域呼唤新方法。随着社会信息化、网络化进程的进一步加快,大量的社会现实以“数据”的形式存在。面对海量数据,人们迫切需要一个“去伪存真,去粗取精”的分析工具,以帮助他们正确预测趋势,避免决策失误。数据挖掘正是顺应现实的需要而开发出来的新型分析工具,在商业领域已经发挥了重大作用。现在数据挖掘技术也同样可以在网络学术研究领域发挥重大作用。作为一个与传统媒体不同的新媒体,互联网提供了许多崭新领域供研究者挖掘和探索,如网络内容(网页、论坛帖子、博客文章等)、网络结构(超链接和社会网链接)和网络使用(网站访问记录和客户端访问记录)数据挖掘。[16]如前文介绍的清华大学经济管理系和日本东京大学工程系、图像序列研究所、信息管理系合作研究的影响力扩散模型就是采用数据挖掘方法来分析网页数据的规律。可以预见数据挖掘将会成为社会科学工作者的一项研究“利器”。


[1] 该文原发表于《新闻大学》2008年第2期,作者余红。

[2] Katz,E.,“The Two-step Flow of Communication:An Up-to-date Report of an Hypothesis,” Public Opinion Quarterly 21(1957):61-78.

[3] Childers量表通过以下7个问题了解人们的看法:你一般与你的朋友或邻居讨论______吗?在你与朋友或邻居讨论______时,请问你是较少还是较多提供信息?过去半年内,你和多少人讨论过______?你的朋友会向你询问有关______的新信息吗?在讨论某个新产品______时,你是倾向于接受朋友的建议还是说服别人接受你的意见?讨论新产品______时,是你经常告诉朋友们产品信息还是朋友告诉你产品的信息?总体而言,你经常/很少给别人提出建议吗?

[4] Lyons,B.,& Henderson,K.,“Opinion Leadership in a Computer-Mediated Environment,” Journal of Consumer Behaviour 5(2005):319.

[5] Flynn,Goldsmith & Eastman量表通过以下6个陈述了解人们的看法或态度。我对______的意见与他人不一致。当别人挑选______时,较少向我询问信息。别人很少向我询问有关______的意见。我周围的人根据我的意见决定是否购买______。我经常说服别人购买我喜欢的______。我经常影响别人对______的看法。

[6] Sohn,Y.,“Opinion Leaders and Seekers in Online Brand Communities:Centered on Korean Digital Camera Brand Communities,” Master Thesis:The Florida State University,Summer Semester(2005).

[7] Baym,N.K.,Tune in,Log on:Soaps,Fandom,and Online Community,Thousand Oaks,CA:Sage Publications,2000,pp.69-83.

[8] Kaneko,I.,“The Great Hanshin-Awaji Earthquake and Network Organization Theory,” Proc.Innovative Urban Community Development and Disaster Management(1996):233-241.

[9] Kieler,S.,“Computer Mediation of Conversation,” American Psychologist 39(1984):1123-1134.

[10] Lea,M.,& Spears,R.,“Love at First Byte?Building Personal Relationships over Computer Networks,” in Wood,J.T.,& Duck,S.,eds.,Understudied Relationships:Off the Beaten Track,Newbury Park,CA:Sage,1995,pp.197-233.

[11] Berry,M.,& Linoff,G.,Data Mining Techniques:For Marketing,Sales,and Customer Support,USA:John Wiley & Sons,1997.

[12] 毛波、尤雯雯:《虚拟社区成员分类模型》,《清华大学学报》(自然科学版)2006年第S1期。

[13] Matsumura,N.,Ohsawa,Y.,& Ishizuka,M.,“Influence Diffusion Model in Text-Based Communication,” in the Eleventh International World Wide Web Conference(2002).

[14] Stempel Ⅲ,G.H.,& Stewart,R.K.,“The Internet Provides both Opportunities and Challenges for Mass Communication Researchers,” Journalism and Mass Communication Quarterly 3(2000):541-548.McMillan,S.J.,“The Microscope and the Moving Target:The Challenge of Applying Content Analysis to the World Wide Web,” Journalism and Mass Communication Quarterly 1(2000):80-98.

[15] 李晓明、祝建华:《让社会科学插上信息技术的翅膀》,《中国计算机学会通讯》2006年第2期。

[16] Zhu,J.J.H.,“E-Social Science and Communication Research in Chinese Context,” presented at the International Conference on Digital Communication and Social Transformation,Hong Kong Baptist University,2006.