数据分析+数据挖掘告诉你:电商销售额与哪些因素有关?

血雨腥风的双十一混战才刚落大幕。做为B2C金融行业重头戏的混战,每家B2C和国际品牌王俊鹏在跃跃欲试,机动力爆棚。做为国际品牌方,想在B2C混战中拔得第十一名,所以,对顾客的洞悉就不可或缺。国际品牌方对顾客的买回犯罪行为介绍地越有条理,就越能有效地协助民营企业更有前瞻性地积极开展市场推广公益活动。

那时,他们就借助于历史文献Sakar, C.O., Polat, S.O., Katircioglu, M. et al. Neural Comput & Applic (2018) 中的这份申明样本统计数据,紧密结合JMP应用软件来对淘宝使用者买回犯罪行为做许多有意思的开拓性统计数据分析。

计算结论作者

计算结论的以获取,能透过下列邮箱浏览csv文档格式计算结论到邻近地区,并透过JMP关上:

http://archive.ics.uci.edu/ml/machine-learning-databases/00468/

也能间接借助JMP的页面加载机能,间接以获取页面端统计数据。(JMP操作方式:文档-> 从internet关上 ->页面)

统计数据如是说

该统计数据集包涵12,330 名淘宝使用者两年外在该中文网站的买回犯罪行为,和相关联的17个使用者特点历史记录和最后买卖结论。

17个特点历史记录,包括10个数值型特点,7个分类型特点。

@No.1 基本信息

管理类页面,管理类停留时间,信息类页面,信息类停留时间,产品类页面,产品类停留时间,表示使用者在不同类型页面上的关上数量及停留时间总和;

@No.2 跳出率

跳出率表示从某个特定路径进入中文网站页面,有多少百分比的使用者什么都没有做,就间接离开了中文网站,它既可做为衡量整个中文网站的度量,也可做为衡量页面的度量。

@No.3 退出率

退出率表示对某一个特定页面而言,从这个页面离开中文网站占所有访问到这个页面的百分比,一般做为衡量页面的度量;

@No.4 页面价值

页面价值表示使用者在完成买卖之前访问过的页面的平均值;

@No.5 特殊日

特殊日表示站点访问时间与特定特殊日子的间隔;

@No.6 其他

此外还包括使用者使用的操作方式系统、浏览器、区域、流量类型、访客类型,是否为周末和两年中的月份信息。

跳出率的好坏(高低)关系到网络营销的成功与否

客户仅仅查看单个页面后退出,让国际品牌方很难有机会说服顾客买回产品,毕竟他们只浏览了一页。让他们来查看下跳出率的情况吧。(JMP操作方式:分析-> 分布)

从图上能看出,90%客户的跳出率低于6%,所有使用者的平均跳出率只有2%,是不是很完美?请先不要着急高兴。它可能是不准确的,或许是中文网站的分析跟踪代码如何集成到站点出现了技术问题。因为根据以往经验,正常跳出率在 40%-60% 之间,低于 40% 是非常罕见的,高于 70% 是令人担忧的,并且是需要赶紧采取行动的。

当前跳出率超出预期范围并且看起来好得令人难以置信,应该是中文网站中的某个地方重复的分析代码造成的。

使用者数值型特点的多元探索

在做购物犯罪行为分析的时候,使用者的数值型特点可能维度很多,借助于JMP的多元分析方法,能快速发现各个维度之间的关系,并有可能实现降维操作方式,为后续的特点监控减少不必要的资源浪费(JMP操作方式:分析 -> 多元方法 ->多元)。

基于当前统计数据,使用者在各个不同类型页面上的关上数量和停留时间成正相关, 这个很好理解。跳出率和退出率因为计算公式相似也成明显正相关,此外,没有发现明显的数值特点相关。

使用者上网方式对销售的影响

透过下图卡方检验的统计结论,他们能捕捉到完成买卖与否与客户的操作方式系统、浏览器类型和流量类型之间的关系。(JMP操作方式:分析->以X拟合Y)

就操作方式系统而言,不同操作方式系统,使用者完成买卖的比例是不一样的。

透过图形也能看出,操作方式系统是2的时候略高,而1和3则偏低,这可能意味着中文网站页面对这些操作方式系统的支持不够友好,如果要提升这部分的收益转化,则需要做出相应的改进。同理,对浏览器类型和流量类型,他们也看到了他们对使用者完成买卖比例的统计学影响,说明中文网站在这方面也有改进空间。

新老客户和工作日/周末对销售的影响

借助于2.3部分卡方检验的方法,他们也能快速发现许多新老客户和工作日/周末对销售的规律,但这里尝试另一种统计数据表汇总的方法(JMP操作方式:分析-> 顾客研究 -> 分类)。

紧密结合上面的图形和统计数据,能清楚地看到:

老客户是中文网站访问的主力,说明中文网站在客户维系上做得很好;

但是他们也看到,不管是在平日(13.2% vs 26.1%)还是在周末(16.5% vs 21.9%),新客户的完成买卖的比例都要高于老客户,这说明中文网站能在老客户的转化率上做出些改进。

比如老客户在买回商品的时候能透过如是说新客户的方式来享受更大的折扣,这样既调动了老客户的买回热情,也为中文网站增加了更多的新客户。

多样分析结论的集中展示

如果想把各种分析图表以报表的形式集中展示, 能透过JMP的脚本机能,就能一键实现报表链接统计数据的实时更新,节省大量的重复性手动操作方式(JMP操作方式:文档 -> 新建 -> 应用程序)。

以上是许多开拓性统计数据分析的结论。下面,他们来进一步尝试用统计数据分析的方法对上面提到的使用者主要特点与买卖结论建立量化的统计模型。

透过决策树,筛选影响销售的关键特点

决策树是一种有监督学习方法,能够从一系列有特点和标签的统计数据中总结出决策规则,并用树状图的结构来呈现这些规则,结论解释方便,在各个金融行业和领域都有着广泛的应用(JMP操作方式:分析 -> 预测建模 -> 分割)。

从图中他们能观察决策树的各个阶段,从上到下显示影响买卖结论的最重要的特点。

其中最重要的是页面价值,页面价值低于0.067和高于0.067的成交比率分别为3.85%和56.4%,差距明显。后面还有些比较重要的特点参数也都一并列出,比如跳出率,月份和产品相关页面等,这些信息都是驱动买卖结论的重要因素,现在能快速被挑选展示出来,从而让国际品牌方有了一个更清晰的改进优化重点。

优中选优,更多统计数据分析方法的尝试

除了决策树,JMP还提供了诸如神经网络、随机森林、提升树和支持向量机等多种统计数据分析的方法,并且能轻松完成模型算法之间的比较,实现优中选优。

透过JMP Pro 16 全新的模型筛选来对多种统计数据分析方法一次性完成比较,在这之前,为了防止构建的模型过拟合,能先按照训练集,测试集,验证集 6:2:2的比例对计算结论进行拆分,生成验证列(JMP操作方式:分析->预测建模 ->生成验证列)。

如下图所示,一次输入特点参数和买卖结论,平台会同时构建多个算法模型,并自动筛选出当前的最佳建模方法为随机森林,模型在测试集上的表现,也就是对将来新统计数据的预测能力R方达到了0.6,预测准确性达到了90.7%。

精确的预测模型能协助国际品牌方尽早介绍每一个使用者可能的买卖结论,尤其是预测买卖失败的情况,提早做出应对和补救,比如打折,比如在客户退出页面前弹出挽留界面等(JMP操作方式:分析 -> 预测建模 ->模型筛选)。

看了那时的分析,是不是让你在以后的B2C混战中更有信心了呢?

对国际品牌方而言,提供个性化的产品与服务,并针对个别需求做出一对一的营销,是网络营销相对于传统营销的一个巨大优势。紧密结合JMP统计数据分析应用软件,透过对淘宝使用者消费犯罪行为的深入分析,能协助民营企业设计出更能满足目标顾客群需求的特色页面,并及时针对发现的潜在问题,做出相应的改进,从而为民营企业带来更大的收益。

如果你也想在JMP中自己动手试试看的话,可免费浏览JMP试用。

发布于 2022-09-12 18:09:35
收藏
分享
海报
150
上一篇:教授甚至把我叫去家里吃饭,我闲余时间都在图书馆度过的,因为怕对不起他们的恩情 下一篇:数科日报丨趣店将削减预制菜项目投入;T3出行接入华为Petal出行
目录