提高非市场评估有效性和可靠性的方法分析

时间:2022-08-10 07:05:14

提高非市场评估有效性和可靠性的方法分析

摘要:非市场评估法是定量化评估环境外部成本的重要技术。该方法主要通过问卷询问公众愿意为环境品质的改善所支付的金额(WTP)或者对于环境品质的恶化所接受的补偿(WTA), 从而推导环境物品的价值。由于问卷内容基于假想情景进行,因此,提高评估结果的有效性和可靠性一直是备受关注的问题。本文认为影响非市场评估有效性和可靠性的因素包括调查方式、问卷设计和个体偏好,并分析了提高有效性和可靠性的检验方法,提出了相关研究假设。

关键词:非市场评估 有效性 可靠性 调查方式 检验方法

中图分类号:F301 文献标识码:A

环境管制政策的有效制定,需要对环境外部成本进行定量化评估。传统的市场评估方法难以对环境成本进行评估,因为这样的市场并不存在。非市场评估方法在近些年得到快速发展,但是,基于假想市场的非市场评估法为环境外部成本难以定量化评价的困难情形下做出决策提供了基本措施,然而这种方法依赖被访问者直接回答得到价值评估结果,其有效性和可靠性问题在上世纪末开始一直存在争议。因此,许多关于非市场评估的研究集中在如何提高其有效性和可靠性问题领域。本文将基于这些已有的研究及相关理论分析,探索提高非市场评估有效性和可靠性的方法,并在此基础上提出相关研究假设,为进一步提高非市场评估有效性和可靠性提供理论借鉴。

一、影响可靠性和有效性的因素

可靠性和有效性被称为相关问题。可靠性指的是可重复性,有效性指的是反映真实情况的程度。影响可靠性和有效性的因素总体上可分为调查方式、问卷设计和偏好理论三个方面。

(一)调查方式

有研究显示,问卷发放途径、调查者、试点和预调查、信息处理、信息传达充分性等会影响可靠性和有效性[1]。

面对面发放问卷被认为是比较理想的方式,因为它不仅能使被访问者充分了解信息,而且在访问过程中能第一时间了解到被访问者的社会经济背景和态度方面的信息。然而网络、邮件和电话访问的方式在特殊情况下也会被采用[2] 。这些情况主要包括:在相同样本群中做重复实验以检验偏好的暂时稳定性(Schaafsmaa,2014),为了避免调查者对被访问者的影响,并且给被访问者充分的时间填写问卷(Brouwer,2012)。

为了保证问卷信息清楚、完整、科学地传达给被访问者,试点和预调查是问卷设计与发放的重要过渡环节,大量学者都支持访问前的预调查[4]。此外,预调查还有助于确定属性及属性水平[3]。参与预调查的被访问者人数并没有统一规定,可以根据调查目的进行确定。

发放问卷中的信息传递也是调查方式中需要考虑的一个重要问题。专业性的环境评估问题往往需要调查者对被访问者进行讲解,为被访问者的选择提供帮助。但榱吮苊庑畔⒋递和信息接收过程中产生的信息偏差,调查前应与被访问者进行有效沟通,以了解被访问者的真实意愿。此外,为使被访问者感知到的环境变化符合实际发生情况,采用照片、文字、插图、视频剪辑等方式来说明会比单一的文字说明好得多[5]。总之,调查人员在提供信息的过程中要回避个人偏好,而尽可能地引出被调查者的偏好。

最后,调查方式中还需要注意的问题是:应该对“不作答”情况进行正确处理,因为这将关系到调查信息掌握的充分性。

(二)问卷设计

环境价值评估的一个重大挑战就是信息提供,公众对复杂环境问题的信息缺乏科学知识,在探究了复杂性和认知负担与陈述性偏好法之间的联系后,Caussade(2005)等人发现5个设计维度会影响选择的前后一致性:选择情景的数量,替代选项的数量,属性数目,属性水平的数量,属性水平的范围。其中最受关注的就是选择情景的数量和每个选择集中替代选项的数量。替代选项数量越多,得到的价值信息量越大,然而对被访问者来讲选择难度会增大。另外,过多的选择会使人陷入选择困境,从而焦躁不安。因此,替代选项的数量一定会对被访问者的选择产生影响,从而影响可靠性和有效性。综上,本文根据行为经济学参照依赖理论提出两个假设:

假设1:每个选择集内的替代选项数量越多,结果的稳定性越差。

假设2:每个选择集中选项数量不同,所得WTP的结果也有显著差异。

现有研究中,选择情景的数量是比较有争议的设计维度,一些学者认为被访问者在选择过程中存在学习效应,因此选择情景数量增加会增加选择的一致性[7],但还有一些人认为选择情景增加会产生疲劳效应,因此不利于有效性和可靠性的提高[8]。选择情景数量和替代选项的数量在设计上应该相结合,如果这两个数量都过少,得到的数据信息不够充分,数量过多又会影响选择的有效性和可靠性。有关这个数量还没有得到进一步证实,目前非市场评估方法应用中选择问题的设置少至5 ~ 6个,多至上百个。选择情景个数差异还是很大。基于这一点,本文针对选择情景设计提出假设:

假设3:选择情景的个数在一定数量内学习效应大于疲劳效应,超出一定数量,疲劳效应大于学习效应。

(三)个体偏好

传统经济学有个基本假设:每一个消费者拥有一个特定的偏好,消费者基于偏好对商品做出主观价值判断。CVM在使用过程中也暗含相同假设:被访问者拥有偏好并基于偏好做出价值回应,并且这些偏好与标准经济学理论相一致。与其相对的观点是新兴的构建性处理方式(The emerging constructive processing approach),该观点假定偏好是基于选择任务和背景因素或偏好启发构建而成[8]。Browna(2008)等人得出表达偏好的过程帮助减少了偏好的不精确性的结论,证实了偏好构建理论。许多研究者认同偏好构建的理论,但认为构建的偏好会破坏陈述性偏好法的有效性和可靠性[5]。但是,也有些研究认为,选择经验增加会提高偏好的稳定性[2]。例如,Spash (2002)通过询问被访问者得出量化的结果:30%的被访问者偏好发生了改变,70%的被访问者偏好没有受到影响,因此得出结论,一些人在问卷的信息提供中偏好确实发生改变,但是大多数人的偏好是稳定的。综上,本文提出的第4个研究假设是:

假设4:虽然偏好随着选择经验的增加而改变,但是构建偏好是趋于稳定的。

而由构建偏好所得WTP的在短期内(一年及以内)的稳定性也相应地得到不同结果:Schaafsma (2014)在相同样本间做了时隔一年的重复实验,所得WTP变化不大;Liebe(2012)等人同样做了时隔将近一年的重复实验,发现所得的WTP在某些属性上面仍有显著差异。由于非市场评估法所选样本随机性较大,为检验该方法使用的一般性,不同样本间短时间间隔的重复实验和间隔一年的重复实验所得WTP的比较仍需进行。从已有研究结论中可以发现,信息提供对人的偏好影响并不大,在短期(一年期)内个人偏好所得的WTP也没有很大变化。因此本文提出第5个研究假设:

假设5:由构建偏好得到的WTP在短期内(一年及以内)具有稳定性和可靠性。

三、可靠性和有效性的检验方法

Kjr, T.(2005)指出,可靠性和有效性的检验类型有三种:一是内容有效性,指实验设计和属性选择等的合理恰当;二是标准或外部有效性,以真实市场的数据为标准的有效性;三是结构有效性,又分为收敛有效性和预期有效性。收敛有效性是非市场评估结果与其他方法所得的结果进行比较;预期有效性是将非市场评估结果与理论预期或者经验预期作比较。这三种类型中,由于内容有效性检验标准比较主观;标准有效性以真实市场数据作为评判准则,因此前两种在实践中很少被用到。结构有效性是基于模型数据结果进行分析,可实施性较强。

结构有效性检验具体包括:检验参数估计是否满足期待的理论特性;检验估计系数是否满足消费者选择理论(如偏好齐全,传递的,单调的,不饱满,凸函数性,连续性等);以及设置重复实验做稳定性检验[9]。设置重复实验做稳定性检验是最常见的方法。检验标准目前主要有两个:WTP的数据比较以及选择一致性检验。如Loehman (1982)选择相同样本进行一致性检验,可靠性的系数由两次实验所得数据的相关性表示。Schaafsma(2014) 进行两次时隔一年的相同实验,表明WTP没有显著差异,由此证明结果的有效性。

除了以上常用方法,自我蟾嬉彩羌煅橛行性的一种方法。例如Brouwer(2012)在问卷的最后问了关于问卷难易程度、理解清晰度等问题,被访问者对问卷的反应能在一定程度上检验可靠性和有效性。Brouwer(2012)提到了问卷回收率与可靠性的关系,即回收率水平也能够反应调查的可靠性。

三、结束语

影响可靠性和有效性的重要因素包括两大类:第一类是情景设计,包括:(1)选择难易程度设计。(2)优势选项设置。(3)选项间的效用差异。(4)选项的形式。(5)支付工具。第二类是个体偏好。在构建偏好的假设下,首先,恰当的情景设置有助于引出真实的偏好。其次,情景设置中有效利用偏好的学习效应而规避疲劳效应是提高非市场评估有效性和可靠性的关键。同时,提高可靠性和有效性的检验方法也有助于增强计算结果的可信性。最后,在对现有研究及相关理论文献的基础上,我们提出了5个研究假设。其中,有3个假设是第一次提出,有2个假设虽然现有文献已经涉及,但是对假设内容存在彼此矛盾的阐述,本文进行了确认。

参考文献:

[1] Loomis J B, Walsh R G. R ecreation Economic Decisions: Comparing Benefits and Costs (2nd) [M]. Venture Publishing Inc, 1997.

[2] Brouwer R . Constructed Preference Stability: A TestCretest[J]. Journal of Environmental Economics and Policy, 2012,1(1):70- 84.

[3] Schaafsmaa M, Brouwer R, Liekens I, et al. Temporal Stability of Preferences and Willingness to Pay for Natural Areas in Choice Experiments: A TestCretest[J]. R esource and Energy Economics, 2014, 38(85):243- 260.

[4] Luchini S, Watson V. Are Choice Experiments R eliable? Evidence from the Lab [J].Economics Letters, 2014, 124 (1):9- 13.

[5] Spash C L. Informing and Forming Preferences in Environmental Valuation: Coral R eef Biodiversity [J].Journal of Economic Psychology, 2002, 23(5):665- 687.

[6] Hensher D A. Measurement of the Valuation of Travel Time Savings[J].Journal of Transport Economics and Policy,2001, 35(1):71- 98.

[7] Bradley M, Daly A. Use of the Logit Scaling Approach to Test for R ank- order and Fatigue Effects in Stated Preference Data[J].Transportation, 1994, 21(2):167- 184.

[8] Swait J, Adamowicz W. The Influence of Task Complexity on Consumer Choice: A Latent Class Model of Decision Strategy Switching [J].Journal of Consumer R esearch,2002, 28(1)1,28(1):135- 48.

[9] Bateman I J, R ichard T C, Day B, et.al. Economic Valuation with Stated Preference Techniques [J]. Ecological Economics, 2004, 50(1C2):155- 156.

[10] Loehman E, De V H. Application of Stochastic Choice Modeling to Policy Analysis of Public Goods: A Case Study of Air Quality Improvements [J].The R eview of Economics and Statistics, 1982, 64 (3):474C480.

上一篇:基于大数据的广播电视技术转型研究 下一篇:经济新常态下我国人民币汇率影响因素实证分析