一、引言目前,伴随服务型政府的构建,公共服务与工商服务均日益注重实施满意度调查,但在实际的调查中,通常的拦截访问致使样本不存在连续性,而不同人群对服务的期望是不同的,因而当某人群对满意度评价差异较大时,运用通常的随机或PPS抽样,获得的数据对满意度对比研究会存在很大的风险,从而影响了研究的信度。另外,常见的研究满意度的模型通常都是普遍线性模型,未能基于消费者的客观态度的模式特征展开研究。2002年
一、引言
目前,伴随服务型政府的构建,公共服务与工商服务均日益注重实施满意度调查,但在实际的调查中,通常的拦截访问致使样本不存在连续性,而不同人群对服务的期望是不同的,因而当某人群对满意度评价差异较大时,运用通常的随机或PPS抽样,获得的数据对满意度对比研究会存在很大的风险,从而影响了研究的信度。另外,常见的研究满意度的模型通常都是普遍线性模型,未能基于消费者的客观态度的模式特征展开研究。
2002年丹尼尔•卡尼曼(Daniel Kahneman)的行为经济学的思想受到越来越多的重视,并被应用到各个领域中。卡尼曼的突出贡献在于将认知心理学方法用于分析人类的判断和行为,并成功提出了预期理论(prospect theory)。
预期理论的一个重要特点就是价值是由财富的变化决定的,而不是个体的最终财富。也就是说,在不确定的条件下,人们的偏好是由财富的增量而不是总量决定的,所以人们对于损失的敏感度要高于收益,这种现象称作损失规避(loss aversion)。因此,Kahneman和 Tversky 用价值函数(value function)取代了传统效用理论中的线性效用函数,价值函数表现在正的增量是凹的,表现在负的增量则是凸的。也就是,人们在盈利的情况下表现为风险厌恶者,而在已经损失的情况下表现为风险追求者,而不是一直都是风险厌恶者,从而将对人类行为的研究推到更为细致的层次。
而在市场中,受服务对象的满意程度作为其选择行为的一种重要指标,理应有类似的表现。可以想象受服务对象在获得的满足感超过期望的增量部分应该是存在着边际价值递减的,而在满足感低于期望的部分给其带来的痛苦程度应该超过同等数量满意情况超过期望所带来的满足感。因此,有必要将损失规避引入到满意度模型中,使其更能表现出受服务对象的真实意愿。
本研究以银行服务满意度调查为例。首先在样本的选取阶段,采用奈曼分配的思想,增加了对满意度评价差异较大的群体的样本数量,以增加数据的信度,同时在建模过程中,将行为经济学理论中的损失厌恶的概念和价值函数引入到满意度的衡量模型当中,改进满意度的传统衡量方法,更为细化地分析消费者的选择行为和决策因素。从结果可以看出,在对总体满意度带给顾客效用的贡献上,银行网点服务和业务办理是最为重要的渠道,而银行网银服务和银行金融理财产品则是对顾客效用影响最大的、最为重要的产品。这些最终结果都获得了该行业专家的认可。
二、方法与模型
1、调查方法的确定
在满意度调查中,如果能够根据以往调查的先验信息,运用奈曼分配的原理,即增加了对满意度评价差异较大群体的样本的数量,减少了由于拦截访问的随机性带来的差异,又可以通过数据分析时的加权处理,不影响满意度的总体结果和对比研究。
奈曼分配的统计原理为:
分层抽样样本均值的方差公式为:
奈曼分配的直观解释是:根据以往调查的结果,如果某类人群对满意度差异比较大,就应该适当增加该类人群的样本量以缩小抽样误差,而对于满意度差异比较小的人群,则可以适当减少样本量。
某银行客户满意度的调查就是根据奈曼分配,以以往的银行满意度调查项目人群特征为先验信息,最终确定北京、上海、广州三个城市共3251个样本量。
2、研究模型的建立
构造如下的价值函数
构造此函数的目的在于满意度调查主要针对不满意区域的改进,因此有必要对于不满意的区域进行相对不满意系数调整,以放大顾客的不满意水平 ,从而将顾客不满意区域细化,使之后的措施建议更加细致。
三、案例分析与结果
首先,对已同时调查了满意度和期望的项目,使用前述价值函数进行调整计算出该项目带给顾客的价值,
在此先将选入变量名陈列如下:
尽管考虑到几乎一定出现多重共线性(因为选取变量时,许多变量都是从概念上看已经具有很强的相关性),我们还是使用简单多元线性回归进行预分析,部分结果如下:
虽然仅有部分自变量的方差膨胀因子(VIF)大于10,且最大的只有17.37391,但大部分自变量在0.05的显著性水平下对因变量的影响均不显著,而回归方程却是高度显著的,这说明自变量对因变量的显著性影响被变量间的多重共线性隐藏了。此外,考虑本次简单多元回归选入变量多达90个,因此在考虑方差比例标准时应加以调整,认为比例超过0.011(=1/90)就可选入相关变量子集,粗略判断所有变量都应选入 。
由于多重共线性的产生,使我们不得不考虑多种处理方法。
首先使用逐步回归法,逐步回归方法是一种从大量可供选择的变量中,选择对建立回归模型起重要影响的变量的方法。将标准定为显著性水平0.05,筛选过程共经历12步,选入12个变量。拟合结果如下:
模型效果并不理想,选入变量不具有特别明显的代表性,但是变量仍有很好的参考价值,按其系数绝对值从小到大排列分别是业务操作方便性、银行网银服务、业务办理准确性、交易手续费、银行网点服务、业务办理、银行自助服务设施。
下面再采用岭回归的方法处理多重共线性,岭回归是用数学方法人为加入一个参数,不断调整进行有偏回归,以牺牲无偏性换取自变量系数的稳定性,在SAS中进行岭回归并观察其效果。运算得岭迹图。
其中的各线条标示各变量参数的估计值随加入参数k值变化而变化的情况。可见,各参数的估计值在k达到0.10-0.15时趋于稳定,并且 ,具有不错的拟合优度,取k=0.13故可观察此时各参数估计值,按系数大小降序排列依次是:
由此可以看出对总体满意度贡献大小的先后顺序。再考虑收入,在这里收入的回归系数为负值,因此可能收入越高对银行总体要求越高,从而更加不满意。
再观察前11个主要变量的系数大小:
由于这只是岭回归方法所得结论,因此在此先不进行解释,而继续观察使用其它方法的结果是否与之一致。
再考虑偏最小二乘的方法,最小二乘回归的准则是拟合值与实际值之差的平方和最小;而偏最小二乘回归的准则是拟合值与实际值之间的相关系数最大。从偏最小二乘法整体模型来看,与结构方程模型非常类似,但二者在具体估计方法上有差异。从基本估计方法上看,偏最小二乘法与前面的主成分回归很相似,二者都抽取了主成分,只是提取主成分的方法不同。
下面使用偏最小二程对模型进行回归,观察结果 。
可见提取的前15个因子已经包含自变量组超过70%的信息,故选取前15个因子进行回归,所得结果如下:
这里表示前11个变量(除X7外)对总体满意度都有正影响。
其中,由于网银服务、电话银行、投诉及解决、大堂经理、金融理财产品有多数人未回答,因此对其进行了适当的处理,即缺失值使用中位数代替,可能造成结果不准确,因此在确定其重要性时需要单独考虑。
最后,考虑主分量回归。主分量分析是将具有多重相关的变量集综合得出少数几个互不相关的综合变量(即主分量,为各个自变量的线性组合)的统计方法。使用主分量回归,观察与前几种方法相比结果有何异同。在进行主分量回归前,先对90个变量做适当的调整。将两两之间相关系数高于0.5的变量选出,发现它们存在较为鲜明的特点,即:相关度高的变量非常集中,且在问卷中位置非常接近,因此,为减少变量间这种相关关系,选取每“块”相关变量中的第一个作为代表变量,其余的则删去,由此经过调整后剩余60个变量。
首先进行主成分分析,得到60个主成份,取部分主分量包含原自变量组信息情况如下;
由数据结果可知,前26个主分量已包含原自变量信息的80%。由于主分量数量亦非常众多,且包含信息靠后的主分量贡献度相差并不大,因此,具体选择哪几个主分量有待商榷。这里使用进入和排除变量标准均为显著性水平等于0.05进行逐步回归 。
这些主成份包含了原变量信息的52.66%,模型的 ,即相关性已接近50%,对于如此大的截面数据是可以接受的 。观察此回归的拟合值:
借助各主分量的表达式计算由原变量表示的回归方程,将变量系数又大到小降序排列是:
这也同时体现出了其重要性排列情况,同时收入系数仍为负值表示收入越高对银行要求越苛刻。
而在仅考虑前11个主要渠道、产品的情况下,其中系数为正并按降序排列的情况如下:
从以上的分析可以看出,单就此不包含结构的模型来说,在对总体满意度带给顾客效用的贡献上,银行网点服务和业务办理是最为重要的渠道,而银行网银服务和银行金融理财产品则是对顾客效用影响最大的、最为重要的产品。而其余的重要因素则包括银行内外部环境、自助服务设施和服务等候等等。此外,在顾客不受到歧视性对待时,顾客的财富水平对顾客对银行的评价有负影响,这与人们的一般直觉是相匹配的。同时,回归方程的存在使我们若获得顾客在各方面对银行的具体评价后,能够推算出其对银行的总体评价。但由于变量数量的问题,使各主成份难以解释,因此还不能探讨隐藏于各因素背后共性的东西。
四、局限性与展望
由于本文所用数据存在极大数量的数据缺失,处理方法皆是使用中位数代替(这其中包括缺失大多数服务项目的期望值),因此对于模型结果会有较大影响。
本文并未对方程的因果结构进行探讨,而是对所有变量一视同仁,影响模型准确性。
对于数据缺失的问题,用中位数处理仍是一个最好的方法,当然也可考虑众数,当然,抽样调查时尽量避免不完整问卷
模型改进上,考虑结构不失为一种更好的方法,即将这些变量划分为不同的层次,再进行拟合分析,同时,由于分层之后变量数会有较大规模的下降,可以尝试对各个主成份的具体含义进行解释 ,或者建立因子模型后进行回归分析。以本文为例,可以将前11个自变量作为第一层次的自变量,而后89个自变量作为第二层次的自变量,划分为11个不同类别,一一对应前11个自变量,再对因变量和第一层次的自变量分别进行回归分析,会使结果更易解释,结构更加科学。