基于LARS―Lasso方法的碳足迹影响因素分析

时间:2022-06-01 04:41:40

基于LARS―Lasso方法的碳足迹影响因素分析

摘要:运用LARS算法实现Lasso过程,从12个因素中筛选出显著影响因素,并得到其权重及标准的参数估计模型。结果表明:能源结构是形成碳足迹的主要动因;人口数量、经济规模和能源强度是影响碳足迹的显著因素;城市化水平、人口结构、产业结构、碳足迹转移状况、清洁能源比重、公共交通发展水平是影响碳足迹的重要因素;经济发展速度、居民消费水平对碳足迹的影响尚不显著。

关键词:碳足迹;影响因素分析; Lasso;K折CV验证

中图分类号:F062.2文献标识码:A文章编号:1001-8409(2014)09-0124-05

Analysis of the Factors Influencing Carbon

Footprint Based on LARSLasso Method

TANG Jianrong, DENG Lin

(School of Business Jiangnan University,Jiangsu Wuxi 214122)

Abstract: This paper used LARS to realize the Lasso process to get the weight of each factors choose from 12 possible factors and the normal Lasso estimation model. The results show that:the energy structure is the main reason for the formation of carbon footprint; population, economy of scale and energy intensity are significant factors influencing the carbon footprint; city level, population structure, industrial structure, the metastasis of carbon footprint, the proportion of clean energy and the public transportation development level is an important factor affecting the carbon footprint of the influence; the rate of economic development and the consumption level of residents is not significant.

Key words: carbon footprint; analysis of influence factors; Lasso; K foldCV

引言

全球气候问题已经引起了国际社会的广泛关注,人类生产、消费、流通等活动所产生的碳足迹(Carbon Footprint)对气候和环境的影响愈见明显。碳足迹是人类生态足迹的重要内容,如果任其发展并因此阻断了经济增长和生态环境的天然联系,则会沉没我们的生态方舟,因此,重新构架全球经济的发展模式,科学测定人类碳足迹并分析其动因,进而形成一种以生态法则为导向、以有效控制碳足迹为目标的经济发展方式是一项重要且迫切的任务。

国内外关于碳足迹影响因素的分析主要基于STIRPAT和LMDI模型。朱勤等对STIRPAT模型进行扩展,应用岭回归方法分析人口、消费及技术因素对碳排放的影响,统计实证结果表明,扩展的STIRPAT模型对中国国情有较高的解释力,居民消费水平、人口城市化率、人口增长速度三个因素对我国碳排放总量的变化影响显著[1];杨建云运用LMDI模型,依据2001~2010年的数据,分析了能源结构、能源强度、劳动效率、人口数量对河南省碳排量的影响,结果显示,人均GDP提高、经济活动增加是导致河南省碳排量增加的首要因素[2]。

各种研究表明,影响因素的甄别筛选至关重要,全面纳入可能的影响因素,可以提高分析的准确性,但同时也会导致数据的高维化,从而引起多重共线性和数据分析难度加大。传统的统计回归方法无法处理数据的多重共线性问题,而变量选择方法对高维数据的处理分析缺乏准确性和高效性,对碳足迹的影响分析也显得苍白无力,因此本文运用Tibshirani提出的一种有偏估计方法Lasso(Least absolute shrinkage and selection operator)[3]对数据进行分析,该方法将模型系数的绝对值之和作为惩罚项来压缩模型系数,以尽可能小的误差将不显著因素的系数压缩为0,从而达到显著变量选择的目的,在此过程中,它可以同步实现对参数的估计,且其逐步回归过程可以很好地处理数据多重共线性。

通过评价指标文献的比较分析,结合指标的重要性、数据获取的科学性和全面性以及碳足迹影响的特点,选出12个碳足迹的可能影响因素,基于1996~2011年相关数据,运用LARS-Lasso算法实现变量选择过程,同时得到标准的Lasso参数估计模型,并据此分析显著因素对碳足迹的影响,为制定控制碳足迹的有效政策提供参考。

1LARS-Lasso算法

设X为自变量,Y为因变量,n次取样得到观测数据的标准化值为(X,Y),其中X为n×p矩阵(n>p),Y为n×1矩阵,X的第i个观测值Xi=(Xi1,Xi2,…,Xip)T,i∈[1,2…n]且各观测值相互独立,Y=(Y1,Y2,…,Yn)T。则Y对X的线性回归模型为:

yi=αi+βjxij+εi(1)

其中εi~N(0,σ2),=,对标准化的数据=0,因此α=0,进一步整理式(1)得到:

Y=βX+ε(2)

根据Lasso的定义,要筛选出显著性的变量,就要在式(2)基础上加上一定的约束条件,令约束范式表达式为:

式(3)中,t≥0,是一个调和参数(Tunning Parameter),Lasso过程就是通过不断调整t的值,使得整体回归系数变小,压缩不显著变量的系数,直至为0。

需要注意的是,假设0j为无约束最小二乘问题的解,那么当t>0j的时候,约束是没有意义的,因此把式(3)中约束条件两边同时除以0j,令s=t0j,s∈[0,1],则:

式(4)中的s是选择最终模型的标准参数[4]。

Lasso实质是二次规划的求解问题,Bradley Efron提出的LARS(Least Angle Regression,最小角回归)算法[5]可以很好地解决Lasso计算问题。对LARS方法进行一点变动,限定每次只有一个变量进入或剔出模型,从而得到LARS-Lasso的解路径,并通过确定式(4)中参数s择定最佳模型。采用Efron和TibShirani提出的交叉验证法(CV) [6]来确定参数s定义统计量:

2指标选择及数据来源

2.1指标选择

2.1.1碳足迹测定

本文将1996~2011年各一次能源消费总量折合成标准煤参考系数,计算累加的碳排放量,以此核算碳足迹(CFP),这里所述的一次能源只包括煤炭、石油、天然气三大主要能源,其核算公式[8]为:

表1数据显示:1996~1998年,碳足迹持续下降,1999年后碳足迹逐步增加, 2002~2007年碳足迹上升速度明显加快,此后增速有所减缓,但2011年又出现了显著增长。从碳足迹变化趋势可以看出,碳足迹变动趋势与中国社会、经济发展状况密切关联。

212驱动因素分析

很多学者对碳足迹的影响因素进行了归纳,本文在前人研究基础上,从以下4个方面考虑可能的影响因素。

(1)经济方面。包括经济发展速度、经济规模、产业结构、碳足迹转移程度。工业革命以来,第二产业主导世界经济迅速发展,经济规模不断扩大,随之产生的污染问题日趋严重,经济发展状况、产业结构对碳足迹的影响可见一斑;引入碳足迹转移程度分析是否存在“碳转移”,这在中国发展过程中,寻求经济发展和节能减排平衡点、维护自身发展权益有一定作用。

(2)人口方面。包括人口数量、人口结构、城市化水平、居民消费水平。生活消费能源在能源消费中占有很大比重,人是生活能源消费的主体,而且现实生活中,城市人口、劳动适龄人口的生活能源消费量远超农村人口、婴幼儿和老年人。因此人口数量、居民消费水平、城市化水平和人口结构会对碳足迹产生影响。

(3)能源方面。碳足迹主要来源于能源消耗过程,可见能源对碳足迹的影响不可忽视,本文从能源结构、清洁能源比重以及能源强度三个角度考虑其对碳足迹的影响。

(4)政府方面。减少碳足迹与政府政策指向和大力扶持紧密相关,本文用公共交通发展水平衡量政府对节能减排的扶持力度。

综合上述4个方面的分析,初步构造指标体系,如表2所示。

22数据来源

依据表2中各变量的描述,查阅1996~2012年《中国统计年鉴》国民经济核算、人口、对外经济贸易、能源、价格指数、城市概况、资源和环境等分类统计数据,对原始数据进行计算和整理,得到各自变量的具体数据。

3LARS-Lasso实证研究

31数据预处理

观测各自变量与因变量CFP之间的散点-拟合线图,结果表明:变量A1、A4、P1、P2、P4、T3与CFP有明显的线性关系,而变量A2、A3、P3、T1、T2、G2与CFP之间的线性关系有待考证。

根据式(1)定义,Lasso标准模型是线性的,为消除可能存在的非线性关系,本文对原始数据取对数,而LARS算法对数据默认的标准化处理可以进一步消除可能存在的异方差。

33参数的确定

本文运用K折CV验证确定改进的调和参数s,即将样本数据等分为K份,依次以第k份数据作为测试样本,用于计算CV残差,k=1,2,…,K,剩余K-1份数据作为训练样本,用于拟合模型。Lasso问题的CV验证,通常令K=10, CV图如图2所示。

图2横坐标为压缩系数即参数s,纵坐标为CV值,根据具体CV演算表得到minCV(s)=1943794×10-4时,s=076767677,观察图1可知s介于第11步和第12步之间。

Lasso模型的验证参数为R2和Cp,其中R2是Lasso回归模型的拟合系数,越接近1,模型的拟合优度越高,而Cp值是Lasso判定系数,其数值定义为:

34模型构建与分析

根据已确定的参数s、图1解路径和式(4),得到Lasso标准化回归模型的系数解(精确到小数点后四位)如表4所示。

根据表4数据,经济规模(A4)、居民消费水平(P3)的系数被压缩至0,从模型中剔除,其他10个变量均被选入,其中清洁能源比重与碳足迹呈负相关影响,其余变量均为正相关影响,据此得到Lasso标准模型为:

lCFP=0773×lnA1+0027×lnA2+0015×lnA3+1046×lnP1+0096×lnP2+0080×lnP4+1187×lnT1-0009×lnT2+0702×lnT3+0003×lnG2(10)

据此分析各变量对碳足迹的影响。

(1)能源结构是形成碳足迹的主要动因。石油能源是目前人类生产消费的物质基础,也是产生碳排放的罪魁祸首,而不同能源的能源效率和洁净程度有着天壤之别,煤炭能源效率和洁净程度最差,但煤炭是中国最大的能源矿种,其在中国能源消费的主导地位短期内不会有所改变,煤炭消费比重越高,能源结构越差,碳足迹就越大。

(2)人口数量、经济规模和能源强度是影响碳足迹的直接原因。人口数量的扩大必然会导致社会生产与消费的增加,能源消耗也会水涨船高,因此人口增长越快,碳足迹提升越快;工业革命以来,环境污染问题愈发严重,目前中国经济发展难以脱离工业,工业发展污染大,加之政府难以监管到位,经济规模越大,污染越严重,碳足迹亦随之提高;能源强度反映的是能源技术发展水平,能源强度越大,同等能耗产生的碳足迹也水涨船高。

城市化水平、人口结构是助长碳足迹的重要因素。城市人口和劳动适龄人口的生活能源消耗相对较大,一方面,其相对高碳的消费模式和生活方式会引起家庭碳足迹的增加;另一方面,城市规划不合理,管理缺乏统筹性,低碳建筑拘于纸上谈兵,造成城市碳足迹居高不下。

(4)产业结构、碳足迹转移状况对碳足迹有一定影响。第二产业的主体工业尤其是重工业对环境的污染显而易见,因此产业结构对碳足迹的正向影响是符合实际情况的。碳足迹转移状况对碳足迹影响系数为00153,是正相关关系,证明发达国家对中国确实存在碳转移。

(5)低碳能源、公共交通对碳足迹的影响不可忽略。积极发展低碳能源,逐步优化能源结构,可以有效减少碳足迹;清洁能源比重的系数较小,仅为-00093,这是因为近16年低碳能源消费比重较小(59%~86%),但随着消费比重逐步增加,其作用亦会水涨船高,因此必须高度重视;系数为00033,与研究预期背道而驰,一方面是因为当前国内公共交通工具大多是燃油车,能耗高、污染大;另一方面,公共交通发展远跟不上经济发展的脚步,居民生活水平不断提高,而公共交通却难以满足居民需求。尽管如此,通过推进公共交通工具电气化、改善公共交通网络等一系列政策,必定可以发挥其抑制碳足迹增长的效用。

(6)经济发展速度和居民消费水平对碳足迹的影响尚未显现。中国经济发展有着明显的区域化差异,发达区域对GDP贡献大,经济发展速度快,且基本形成第三产业主导经济发展的格局,因此经济发展速度对于碳足迹的影响较小。城市居民恩格尔系数近16年来最小值为357%,远高于发达国家水平,说明生活必需品是中国居民消费的主体,因此对碳足迹的影响不显著。

4碳减技术路径及政策建议

综上所述,可以从碳足迹的10个显著影响因素着手,兼顾两个尚不显著的影响因素,有力控制碳足迹增长。在发展过程中,要引导产业结构和能源结构的调整,推动新能源发展;不断改革能源利用技术,提高能源效率;大力发展循环经济,让“静脉”产业为经济发展注入新鲜活力;呼吁国际社会重视“碳泄漏”,保障自身发展权益;控制人口增长,鼓励低碳生活;重视绿色城市建设,提高节能设施覆盖率;合理运用政府政策,推动关键链管理。

(1)构建智慧增长战略。注重城市经济、社会、环境之间的和谐发展,强调已开发区域的整合利用和紧凑式发展,关注各利益主体的诉求与合作,成功实现我国智慧增长。伴随着人口膨胀、城市扩张,我国固有的矛盾以及发展中的问题也水涨船高,城市化是发展所需,低碳化是大势所趋,要注重培养大众消费思想低碳化,倡导全民生活方式节能化,合理控制人口增长速度,积极稳定推动城市发展,构建低碳新兴城市,实现城市整合利用和紧凑式发展;逐步实现国家能源消费从传统煤炭矿种为主向现代石油和天然气矿种为主的结构转变,提高能源利用率,扶持新能源技术开发,优化能源结构,协调发展智慧经济。

(2)重视碳足迹转移。工业制成品出口额对碳足迹的影响不容忽略,发达国家凭借其技术垄断,高污染的产业转移到发展中国家,中国成为发达国家最大的“碳转移”基地;我国要发展,同时也要吸取发达国家的经验,舍弃牺牲环境的不合理发展模式,引导国际贸易低碳化,呼吁国际社会关注发达国家对我国的“碳泄漏”实情,为自身发展争取更多的机会和权益。

(3)推动关键链管理。设计严格的排污机制,落实碳税、碳排放交易政策,架构合理的碳排放认证、审核机制,建立体制健全的碳排放交易市场,充分运用财政政策控制碳足迹的增长;合理规划环境污染治理,推行“预防为主,治理为辅,防治并举”的上下游产业链发展战略;大力推动公共交通发展,建立高效快捷的公共交通体系,促进公共交通工具电气化,倡导选用公共交通和零污染的交通工具。

(4)发展“非蔓延式经济”。发展与环境协调的非蔓延式经济,逐步淘汰落后的生产技术,制定严格的企业排污制度法规;推动资源回收利用的“静脉”产业发展,将“城市矿山”化废为宝,促进循环经济发展;大力发展服务业,有计划地减少国民经济对工业的依赖,需要注意的是,第二产业对于一个国家而言不可或缺,只有通过技术改革、合理规制来减少工业污染,才能标本兼治。

中国是一个发展中大国,发展是第一要务,合理协调经济、环境与社会之间的关系也刻不容缓。处于后哥本哈根时代,我们不仅要承担起减少碳足迹的责任,也要呼吁国际社会正视发达国家的“碳泄漏”问题,为自身发展争取到更多权益和空间;积极转变对外贸易形式,集中精力发展自身,突破“中国制造”瓶颈,努力打造“中国创造”国际新形象,从根本上减少自身资源消耗,从而控制碳足迹的增长。

参考文献:

[1]朱勤,彭希哲,陆志明,于娟.人口与消费对碳排放影响的分析模型与实证[J].中国人口资源与环境,2010.2:98-102.

[2]杨建云.基于LMDI方法的河南省碳排放分析[J].经济论坛,2012,8:21-24.

[3]Robert Tibshirani. Regression Shrinkage and Selection Via the Lasso[J].Journal of the Royal Statistical Society,1996,58(1) :267-288.

[4]周玮.变量选择中的LARS算法机器在国民经济中的应用[D].山东:山东大学,2011.

[5]Efron B, Hastie T, Johnstone I, et al.Least angle regression[J]. Annals of Statistics, 2004,32(2):407-499.

[6]Efron B, Tibshirani R.An Introduction to the Bootstrap[M].London:Chapman and Hall,1993.

[7]柯郑林.Lasso及其相关方法在多元线性回归模型中的应用[D].北京:北京交通大学,2011.

[8]李志强,刘春梅.碳足迹及其影响因素分析―基于中部六省的实证[J].中国软科学增刊(下),2010:228-235.

上一篇:新课程改革下提高英语语法教学的策略 下一篇:采用课程目标达成度开展基础化学教学评价的尝...