车险费率数据的采集与整理
车险费率数据的采集需要设定一个损失的经验期,长度一般在3—5年。如果经验期过长,前期的数据可能会由于社会环境的变化(如通货膨胀、法律调整等)而对当前的情况失去参考价值。但是若经验期过短,数据的波动会非常明显,不能较好的反映实际情况,所以这样的车险费率也不能够贸然的采用。车险定价中所需要的数据包括保单的信息和赔案的信息,根据车辆用途、车龄、行驶区域等分类变量对原始数据进行分类时,需要判断同一类别的数据是否满足信度要求。在数据量较大的情况下,可以对车辆类别进行细致的分类达到精确的费率厘定,但是在数据量不足的情况下,分类过于细致就无法保证费率厘定的准确性。因此,在数据采集与整理步骤,应当尽可能地搜集充足的数据。风险级别的设定搜集到充足的数据后,需要按照风险因素选取的准则确定分类变量,进行划分风险等级,即确定风险级别相对数。确定风险级别时需要考虑两个问题:其一是不同的级别应当有显著的差异。其二是保证风险暴露单位的数目。通常情况下,将风险级别相对数接近的分组进行合并,同时保留风险级别差异较大的分组。另外,当该分组风险暴露单位的规模较小,不满足信度理论数据需求时,也应当将其并入相邻的级别。
车险费率厘定实务研究
在汽车保险实务中,连接函数的选择主要取决于对实际问题的理解和应用的方便性。在车险费率厘定研究中最常用的连接函数是对数连接,该种形式的连接函数结构比较简单,而且当前我国汽车保险实务广泛采用加法模型和乘法模型,对数连接函数很容易实现这种变换。估计索赔次数时,典型的模型是泊松乘法模型,即因变量服从泊松分布,连接函数为对数函数,Andrade(1989)42和Brockman(1992)43在估计汽车保险索赔频率时采用了该模型;估计索赔强度时,典型的模型是伽马乘法模型,即因变量服从伽玛分布,连接函数为对数函数,Mack(1991)44使用此种模型对汽车保险的索赔强度进行了估计。
但是在车险费率厘定中采用的样本数量较大,不会存在对卡方分布近似程度不够充分的情况。另外,皮尔逊卡方统计量与偏差统计量比较适用于处理离散型变量,虽然在车险费率厘定中,风险分级变量的选择有年龄、收入等连续性变量,但是在风险分级的过程中都将其进行了分组处理,所以车险费率厘定时采用的都是离散型变量,这两个拟合优度统计量比较适用于车险费率厘定领域的检验。车险费率厘定选取的风险分类变量经常存在多重共线性问题。采用广义线性模型进行费率厘定时,回归方程的系数显著性检验就可以发现这种问题,但解决这个问题却有难度。目前解决的办法有两种:其一,将交互作用项作为独立变量,采用逐步回归法通过删除冗余的变量来抵消多重共线性的影响,同时可以采用信息准则,对添加的交互作用项的数目进行控制;其二,是增加样本容量,当样本规模扩大以后,标准误差将减小,因而抵消了多重共线性的影响,但是此方法在实际研究中并不实用,因为数据量往往是不充足的。
考驾照网(KAOJIAZHAO.COM)