您的当前位置:首页基于广义线性模型的交通事故损失评估

基于广义线性模型的交通事故损失评估

来源:锐游网
基于广义线性模型交通事故损失影响因素研究

曾 娟

(武汉理工大学 汽车工程学院,湖北 武汉 430070)

摘 要:交通事故严重威胁人们的生命财产安全。交通事故严重性的评价指标包括交通事故发生频率和社会经济损失金额。采取必要的科学手段进行交通事故社会经济损失影响因素研究对于认识交通事故、识别交通事故的易发生群体具有非常重要的意义。本文综合考虑车龄、驾龄、车辆座位数等特征参数,利用广义线性模型分析技术,建立多元广义线性模型对以上影响因素与交通事故二者之间的内在关联性进行研究。结果表明:广义线性模型能对交通事故的风险因素进行风险分组,并明确易发生交通事故的群体。因此,可以把该系统应用于交通事故管理,确保驾驶的安全性和行驶的有效性。

关键词:广义线性模型 交通事故损失 风险分级 中图分类号:

交通事故严重威胁着人们的生命财产安全。《世界预防道路交通伤害报告》(以下简称《报告》)根据75个国家向世界卫生组织提交的死亡统计数据指出,全球每年大约有120万人死于道路交通事故。全球道路交通事故造成的直接经济损失约5180亿美元。道路交通事故造成的巨大人员伤亡和财产损失,引起了各国政府的高度重视,并投入大量人力、物力和财力来治理这种“文明社会病”,同时也广泛而深入的开展了交通事故规律的研究。

交通事故严重性的评价指标包括交通事故发生频率和社会经济损失额度。发达国家从20世纪50年代开始较为系统的研究交通事故损失,相继提出了一些有价值的理论和方法,在事故损失规律及其对社会经济的影响规律研究等方面积累了成功的经验

【1-5】

。中国国内学者于20世纪90年代在借鉴并

【6-8】

吸取国外已有先进理念和成功经验的基础上,对道路交通事故经济损失做了一些探索性研究工作,

对这方面的研究主要从宏观程面上研究交通事故的影响因素,无论在研究内容的深度和广度,还是研究方法的有效性及适用性等方面仍处于初级阶段,远未形成体系,对实际的指导作用不强。因此,针对中国目前严峻的道路交通安全形势,尽快开展交通事故社会经济损失评价的深入研究具有重大的现实意义。

1 交通事故社会经济损失评价研究的主要内容

交通安全评价领域的研究基本思路是采用数学建模的方法,将各个评价指标的关系进行量化处理,并得出最后的评价结果。交通安全评价模型的研究主要包括评价指标体系的构建和评价方法的选择。社会经济损失评价是交通安全评价的子领域。中国对交通事故经济损失的评价还没有形成完整的体系,对交通事故损失的评价和计量研究也仅处于起步阶段。目前的研究主要集中在以下领域:社会经济损失评价指标研究;社会经济损失评价方法研究。交通事故是“人-车-路”构成的系统,交通安全的影响因素包括人-车-路三方面。指标体系的构建基本上基于这三方面的影响因素。比较有代表性的提法有瑞典Ghazwan博士

【9】

、中国刘士奇

【10】

。总的来讲,对社会经济损失评价问题的研究主

1 收稿日期:2009-09-20 作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

要集中在宏观层面,从微观层面上分析社会经济损失问题的手段和方法有限。

笔者基于经济学和统计学理论,针对交通事故的社会经济损失评价问题展开深层次的理论分析和量化评价研究,运用广义线性模型对交通事故社会经济损失的影响因素的关联性进行分析,从微观角度探讨交通事故社会经济损失影响因素的内在关系。 2 广义线性模型理论基础

广义线性模型的结构由随机成分、系统成分和联结函数三部分组成,归纳如下:

(1)随机成分

随即成分(random component),即因变量Y或误差项的概率分布。因变量Y的每个观测值Yi 相互独立,且服从指数分布族中的某一种分布。可表示为

ybifyi;i,iexpiicyi,i (1)

a(i)其中,a(i),bi,cyi,i为某一事先确定的函数。 (2)系统成分

系统成分(systematic component),即自变量的线性组合,表示为

iX1xi12xi2pxip。

(3)联结函数

联结函数(link function)gx建立了随机成分与系统成分之间的特定关系,即

EYiig1i。 3 模型构建及分析过程

3.1 研究样本

本文试图利用保险公司保险赔付的数据,来分析交通事故社会经济损失的影响因素。客观上讲,保险赔付额度是社会经济损失的一部分,以保险赔付金额作为交通事故社会经济损失的额度是不准确的。本文选取了社会经济损失的一部分,通过局部数据来研究广义线性模型在社会经济损失影响因素相关性问题中的应用。

这次研究基于某保险公司某地区2007年度投保车辆损失险的各种类型车辆发生索赔行为的样本。两地区有效数据分别为7697份、19664份。索赔额以人民币的形式给出。按照车险经营的出险率15%(经验数据)推算,两地区合计27361份样本实际涵盖的样本总量(包括发生赔案和未出险的样本)达到182407份,符合广义线性模型建模的要求。

这份样本集涉及的机动车辆包括家庭自用型客车(A085)、非营业用客车(A084)、非营业用货车(H084)、营业用货车(H091)、营业用客车(A086)、摩托车(M0)、拖拉机(J0)、特种车(T0)等等。各类型样本数量见表1。

表1 抽样数据中各类型样本数一览表

2 收稿日期:2009-09-20

作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

A085 6422

A084 8782 H084 920 H091 4860 A086 5678 M0 205 J0 28 T0 456 其他 10 文章作者选取了家庭自用型客车即私家车样本进行分析,并将研究目标确定为索赔额风险因素的风险分级。 3.2模型的构建

设随机变量Yijk表示单元(i,j,k)的平均索赔额,权数nijk为单元(i,j,k)的实际索赔次数。这里

i,j,k分别代表年龄、车龄、车辆座位数三因素的各个水平(i1,...5;j1,...4;k1,...3)。建立广

义线性模型:

2,V)Yijk~ED(ijk,mijk (3) E(Yijk)ijkijk0ijkVarYijkV(ijk)nijk(i1,...5;j1,...4;k1,...3)运用SAS的GENMOD模块对上述广义线性模型求解

【11】

。分别采用正态分布(normal)、伽玛分布

(gamma)、逆高斯分布(inverse gaussian)进行拟合,联结函数取对数联结(log)。选取索赔次数N的对数作为偏移量。对gamma分布和igaussian分布模型进行type 3型检验。索赔额均值与参数之间关系式表示为:

log(i)log(Ni)0agei(1)1agei(2)2agei(3)3agei(4)4agei(5)5 caragei(1)1caragei(2)2caragei(3)3carage4(4)4seati(1)1seati(2)2seati(3)3其中:

1agej; 1 seatj 1 caragej ; agei(j) seati(j)caragei(j)agejseatj000caragej表2是三种分布假设下拟合优度比较。表3反映了gamma分布和igaussian分布模型type3型检验的结果。

表2 拟合优度比较 自由度 离 差 562772802.08 40.1509 0.0072 平均离差 3.4746 48.6013 43.0000 Pearson 卡方值 562772802.08 38.5714 0.0013 对数似然值 -447.6639 -408.7341 -393.2866 正态分布 33 伽玛分布 33 逆高斯分33 布 伽玛分布 表3 伽玛分布和逆高斯分布模型type3型检验结果比较

因素 自由度 卡方值 年龄 4 34.02 P 值 < 0.0001 3 收稿日期:2009-09-20

作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

逆高斯分布 车龄 座位数 年龄 车龄 座位数 3 2 4 3 2 33.31 41.62 7.09 —— —— <0 .0001 < 0.0001 0 .1312 —— —— 从表2结论看出,正态分布的离差过大,表示拟合优度很差;逆高斯分布离差最小,拟合优度最好。从表3进一步看出,gamma分布各主效应非常显著。而igaussian分布age效应未通过置信水平0.0001的显著性检验,从其参数估计的结果来看,大量回归系数也未能通过置信水平0.05的显著性检验,其中carage和seat两个效应甚至不能产生迭代结果。结合表2和表3的分析,gamma分布对风险的拟合是比较恰当的。

在gamma分布模型中加入交互作用项,并进行type 3型检验。第3型分析将生成针对这些效应的显著性的统计检验。结果显示,加入交互作用项后大量交互作用的回归系数均不能通过置信水平0.01的显著性检验,而且还有相当一部分系数不能通过迭代求得结果,这说明模型的拟合状况不佳。

综上所述,采用不含交互作用的伽玛分布拟合该组数据的索赔额分布比较合适。 4.3伽玛分布广义线性模型的参数估计及检验

选用gamma分布对数联结参数估计结果见表4。 因素 截距 年龄 年龄 年龄 年龄 年龄 车龄 车龄 车龄 车龄 座位数 座位数 座位数

从表4看出,取置信水平0.0001,大量结果都通过了检验,少数未通过检验但结果接近0.0001,可视为合理。只有age1和carage3结果偏大,反映年龄1,2无显著差异,车龄3,4无显著差异,即年龄25岁以下和25-30岁的人群应归纳为同一风险组,车龄2-6年和6年以上的人群应归纳为同一风险组。另外参数5、4和3自由度为零,其参数估计和标准误差没有输出,这是系统指定的,表明该参数的列和该参数之前对应的列线性相关。

以上分析结论如下:在分析索赔强度影响因素时,年龄、车龄、座位数这些主效应都是非常显著的;大部分风险级别的确定比较合理,年龄和车龄中有两处风险级别相对数需要改进。 4.4对模型的改进及结论分析

4 收稿日期:2009-09-20 作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

水平 1 2 3 4 5 1 2 3 4 A B C 表4 选用gamma分布对数联结参数估计表 自由度 估计值 标准差 1 10.4526 0.8220 1 -1.0253 0.5076 1 -1.6576 0.5212 1 -3.0689 0.5547 1 -3.4495 0.5352 0 0.0000 0.0000 1 -3.2346 0.4265 1 -1.1946 0.4756 1 -0.5498 0.4341 0 0.0000 0.0000 1 -4.2838 0.6175 1 -1.8640 0.6158 0 0.0000 0.0000 卡方值 161.72 4.08 10.12 30.16 41.54 —— 57.52 6.31 1.60 —— 48.13 9.16 —— P值 <0 .0001 0.0434 0.0015 <0 .0001 <0 .0001 —— <0 .0001 0.0120 0.2053 —— <0 .0001 0.0025 —— 针对以上结论出现的问题,对风险分组进行调整。调整一:对年龄变量风险分级进行调整。调整二:对年龄变量、车龄变量的风险分级同时调整。仍然选取gamma分布、对数联结的广义线性模型拟合。调整后的参数估计见表5。

因素 截距 年龄 年龄 年龄 年龄 车龄 车龄 车龄 座位数 座位数 座位数 表5 年龄、车龄变量同时调整后参数估计表 水平 自由度 估计值 标准差 1 9.7892 0.6244 1 1 -2.1946 0.4536 2 1 -3.0003 0.5081 3 1 -3.2025 0.5024 4 0 0.0000 0.0000 1 1 -2.0876 0.4010 2 1 -0.4109 0.3976 3 0 0.0000 0.0000 1 1 -4.5496 0.5631 2 1 -2.6448 0.5544 3 0 0.0000 0.0000 卡方值 245.77 23.41 34.87 40.64 —— 27.11 1.07 —— 65.28 22.76 —— P 值 <0 .0001 <0.0001 <0 .0001 <0 .0001 —— <0 .0001 0.0013 —— <0 .0001 <0 .0001 —— 对表5结果分析如下:年龄变量经过调整,很好的解决了风险级别的相关性问题,将25岁以下和25-30岁的人群归纳为同一个风险级别;而车龄变量调整后很好地解决了风险级别的相关性问题。

5 结论

至此,本文建立了车辆事故损失的多元广义线性模型,产生了各个变量对于车辆损失的风险等级系数,并经过统计显著性检验,改进了广义线性模型最终选择了个风险因素变量,给出了各个变量对于保险赔付金额的风险等级系数,可以估计出在多风险因素共同作用下车辆损失强度,为控制车辆事故损失风险建立了一个定量、相对较准确的损失评估模型。

文章的不足之处在于由于缺乏交通事故经济损失的数据,本文仅采用了保险赔付额代替经济损失的数据,数据结果自然不能直接用于交通事故分析,但这种风险分级的方可以用于识别社会经济损失的高危群体,对于改善交通安全的效率、减少重大、特大事故的发生具有积极的指导作用。 参考文献:

[1] Hills P.J, JonesLeeM W.Costs of traffic accidents and the valuations of accidents prevention in developing

countries[A].Highway Investment in Developing Countries /ICE Proceedings of the Conference Criteria for Highway Investment in Developing Countries[C]. London England Inst of Civi Engineers by Thom as Telford Ltd,1983:68-70 [2] Rune Elvk An analysis of official economic valuations of traffic accident fatalities in 20 motorized countries[R].Norway.

Institute of Transport Economic,1984:88-102

[3] Rune Elvik. Cost-benefit analysis of road safety measures applicability and controversies[J].Accident Analysis and

Prevention, 2001,33(1):9-17

[4] Rune Elvik. Which are the relevant costs and benefits of road safety measures designed for pedestrians and

cyclists[J].Accident Analysis and Prevention, 2000,(5):679-687

[5] Sytze A. Rienstra, PietRietveld, Joke E.Lindeijer economic evaluation of traffic safety measures for transport

ecmpanies[J].Accident Analysis and Prevention,2002,32(5):679-687

5 收稿日期:2009-09-20 作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

[6] 曹阳,刘小明,任福田. 道路交通事故伤亡经济损失的计量方法【J】.中国公路学报,1995,8:116-119

[7] 刘小明,崔震中,任福田. 道路交通事故死亡人员社会经济损失的宏观测算方法【J】.人类工效学,1995,1(2):22-24 [8] 刘小明,贺玉龙,任福田. 道路交通事故受害者生活质量的损失计量方法【J】.人类工效学,1996,2(3):15-17 [9] 韦华,张伟.中美两国汽车驾驶安全影响因素研究[J].中国安全科学学报,2004,14(9):24-28 [10] 刘士奇,王健平等.公路交通安全评价指标体系探 讨[J].北京交通大学学报.1994,18(4):582-586 [11] 高慧璇. SAS 系统SAS/STAT软件使用手册[M]. 中国统计出版社,1997.9:241-247

Research on Influencing Factors of Losses of Road Traffic Accident

Based on Generalized Linear Models

zeng juan

(Wuhan University of Technology, School of Automobile Engineering,

Hubei Wuhan 430070)

Abstract:Traffic accidents seriously threaten the safety of people and property. The research on influencing factors of socio-economic losses by scientific means is useful to know traffic accidents and identify the high risk group. In this paper ,based on an overall consideration of various factors such as age,vehicle age,seats,used GLM analysis technology, we research the relevance between refluencing factors and traffic accidents.The results indicated that GLM can classify the risk factors of traffic accidents ,and find the high risk group. Therefore,we can use research results for the traffic accidents managements,decrease the socio-economic losses of road traffic accident. Key words:Generalized Linear Model, Socio-economic losses of road traffic accident,risk classify

6 收稿日期:2009-09-20 作者简介:曾娟(1973- ),女,湖南桃江人,博士生,副教授 基金项目:博士生科研启动基金(471-38650589):基于交通事故深度调查的驾驶员风险分析;

企业横向项目(107-610905921-2):道路交通事故再现原理与方法研究

因篇幅问题不能全部显示,请点此查看更多更全内容

Top