谁是最好的客户.docx
《谁是最好的客户.docx》由会员分享,可在线阅读,更多相关《谁是最好的客户.docx(16页珍藏版)》请在三一办公上搜索。
1、谁是最好的客户?使用SPSS从营销数据库中获得更多信息备注:这是一篇思路非常清晰的市场挖掘方面的文章,主要侧重于从统计的角度来看待数据挖掘,而不是侧重于从机器学习的角度。非常适合具有统计背景的人员迅速切入数据挖掘领域。美中不足的是没有给出具体的数据这样我们不能按图索骥地将文章中介绍的方法操作一遍。网上也流传一篇由SPSS北京办事处翻译的pdf版,但我觉得还是原来的英文版讲得详细点。欢迎前来交流营销和数据挖掘 MSN:mktexchage。摘要本文使用SPSS 的频数分析、描述性分析、缺失值分析、方差分析、卡方检验、交叉表、均值比较、相关分析、线性回归、决策树等统计方法及饼状图、条形图、箱图、散
2、点图、树形图等图表对一个客户数据案例进行分析,以发现不同客户群体的特征,为市场推广活动提供依据。关键词市场,细分,客户,统计,分析,比较谁是最好的客户?任何行业专业人士市场人员,销售经理,产品开发者和服务专家都乐意回答这个问题。 在当今激烈的市场中,开发,吸引和保留客户越来越困难同时也越来越昂贵。由于这些压力,更多的组织使用营销数据库最大化他们现有的客户价值。转换客户数据为知识和信息的行为是一个有力的手段和企业生存的一项必需的技能。 理解客户的固有特征可以给你有价值的发现。了解最有价值或至少有利润的客户,他们的购买方式,购买行为和人口统计特征是制订营销计划的关键。较好地理解客户是什么可以帮助你
3、开发忠诚的,有持续回报的客户,制订提升销售和交叉销售及营销定位计划。集思广益的决策也是广告,促销,直接邮寄活动和其他营销成功的基础。 有许多方式可以确定最佳客户的特征,也有许多方法可用来度量这些特征。本文说明使用SPSS实现客户分析的一种方法。 案例营销数据库中包含2000个客户和下列数据: n 首次成为公司客户的日期 n 购买历史n 不同促销方案的响应率n 家庭收入n 地区n 性别和其它人口统计数据 本文中我们从数据库中析取可控信息,使用各种数据分析技术,从初级的到高级的,目标是依据过去的销售额用人口统计数据来识别不同的细分客户群。即使最普通的过程产生的结果对怎样理解客户也可以产生深刻的含意
4、。不要低估这些方法。用灵活和有力的分析工具结合你的业务背景是从数据中获得有价值信息的最好方法。 首先探索:典型客户是什么样的? 我们通过从数据库中探索不同的变量来回答这样的问题: n 客户住在哪里?在三个销售区域中客户的分布如何? n 客户的平均收入是多少? n 成为公司客户的时间有多长? n 对不同的促销方案,客户平均响应是多少?有多少人响应第一促销方案? n 客户花费是多少? SPSS 提供了可以迅速回答以上问题的几种分析方法,频数和描述性分析过程可以提供对客户数据的初步印象。从图1 饼状图中可以看出,东部地区所占比例最大(34%),西部地区最小(19%),而有16.9%的数据未列出所属地
5、区。图 1 和表 1。SPSS自动形成的图表显示最多的客户(34%)生活在东部地区。频数和描述过程非常适合对数据进行原始整理,可能在分析中许多想法都要用这种方法实现。 分析客户住居在哪里帮助我们确定销售版图。频数过程提供分类变量计数和百分比表,同时可用条图,直方图和饼图表示数据。SPSS 自动地呈现这些表和图的结果。 从分析中我们可以认识到什么证明是重要的。饼图和表1显示最大的客户群(34%)生活在东部地区,最小的客户群(19%)生活在西部地区。并且有16.9%的客户在数据库中没有列出居住区域。 SPSS 用特殊的处理表示缺失数据。知道何时为什么信息缺失很有必要。例如,你可能想区别是因为它们没
6、有涉及而缺失还是因为它们难以获得而缺失。表1中,“百分数” 包括缺失数据,“有效百分数” 从计算中排出了缺失数据, 可以从表上迅速并行比较缺失数据怎样影响结果的。 要得到家庭收入的信息,我们需要几个基本的统计量作为最初描述统计量。如平均值,最小和最大值,或连续变量,如以美元为单位的收入和以年数为单位的年龄。描述过程为我们提供了一系列汇总统计量。从表2可以看到在2000个客户中家庭收入的平均值大约是 $61,000, 大部分收入范围在 $50,000和 $72,000之间。表2. 描述过程显示平均家庭收入大约是$61,000.要回答“成为公司客户的时间有多长?” 的问题,我们必须处理一个字段然后
7、计算每个时间周期的客户数。因为数据库包含第一次成为公司客户的日期,首先计算一个新变量:作为客户的时长。使用SPSS中提供的众多的时间函数,可以轻而易举地用年数转换成日期计算客户的时长。计算这个新变量后,用时长的频数表来表示客户存在时间。 表 3. 频数表显示51%的客户存在超过7年。从表 3 看出大约有29%的客户存在10年以上,差不多有过半数的客户在7年以上。接下来,我们要问“谁消费最多?”,最好的客户理所当然是最有利润的客户,或为组织花费最多的客户。 为了得到准确的客户生命周期价值,结合前期购买和客户行为建立预测模型预测未来购买。 本例中,我们开始用总订单金额代替每个客户。首先,建立一个新
8、变量,对数据库中每个订单金额(订单1的金额,订单2的金额等等)求和。因为总订单金额是连续变量,直方图是显示结果的最有效的方法。 图 2. 从直方图可以看出大部分客户消费低于$500,少数几个客户消费量比较大。 直方图的直条代表一个数据范围。在图2中大部分客户消费低于$500,少数几个客户消费量比较大。 每个客户平均消费量是$1,360 ,很少有客户消费量超过$7,000。当目前为止,我们知道典型的客户是: n 生活在东部n 家庭平均收入为$61,000n 有七年购物历史 n 在公司产品和服务上消费 $1,360 客户对不同的促销有怎样的响应? 进行促销分析是理解客户的另一个重要步骤。评估营销计
9、划和促销帮助分辨可以做什么可以不做什么。它准确地告诉我们何时及为什么某个计划成功,所以你可以拷贝你的成功经验和学习失败的经验。 要回答“每种促销有多少人响应?”和“不同的促销平均响应是多少?”的问题,可以对每种促销响应运行频数分析过程和对四种促销的订单运行描述分析过程。 表 4. 大约有45%,或890人对第一促销方案有响应。 在表4中,有890人,或大约45%的客户响应第一促销方案。对其它促销进行类似的分析,第二促销方案的响应率是39%,第三促销方案的响应率是37.4%,第四促销方案的响应率是17.4%。 这里出现一个新问题:在第四促销方案中唯一的特征是它较成功的获得客户响应的原因吗?换句话
10、说,这种结果有意义吗?购买历史(表5)信息显示第三促销方案的平均值是$294, 低于其它促销方案。这种差别是否有统计意义还需进一步分析来确定。 表 5. 购买历史分析显示第三促销方案的平均值是$294, 低于其它促销方案。 进一步分析:我们的客户怎样不同?怎样相似? 既然对客户和各种促销的成功有一个基本的理解,通过观察两个或多个变量立刻支持这种有力的分析。SPSS 帮助发现用别的方式难于发现的潜在关系。例如,已经知道客户在各区域分布和有多少客户响应第一促销方案。接下来要观察各区域响应第一促销方案的客户有多少。通过研究回答这些问题: n 每个地区客户生命周期平均是多少? n 各区域人们怎样响应第
11、一促销方案? SPSS很容易实现比较不同的分组数据。Crosstabs过程,Means过程, 分段条图和箱图都可以清晰地表示这些结果;当结果有统计意义时,可用卡方统计量,方差分析和CHAID识别。当你知道什么是有统计意义时,这就很重要了,因为你没有浪费你的努力。 下一步探索的问题是“每个区域客户平均生命周期是多少?”。一个强有力的统计图,箱图将均值和数据分布显示在一起。 图3箱图中很容易看出西部地区客户平均生命周期大于其它地区。 图 3. 箱图将均值和数据分布显示在一起。很容易看出西部地区客户平均生命周期大于其它地区。 均值比较提供联合分布的汇总统计。表6(包含与箱图相同的信息,但用表的形式)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 谁是 最好 客户

链接地址:https://www.31ppt.com/p-2030749.html