数据告诉你,商品该怎么卖!

人生苦短,我用python

电商平台获取到的用户购买、评价记录不仅显示除了该平台的销量、客户满意度的记录,同时进一步的分析能使平台更加精准的为客户服务,增加客户的满意度,从而达到利润的上升。如何合理的使用成千上万条看似杂乱无章的数据,让它成为我们手中在电商领域开疆拓土的利器呢?本文就通过下边的案例,粗浅的介绍一下。

数据分析步骤按照下图进行:

一、提出问题

本次分析的目的是:

1、分析出最受欢迎食品品牌;

2、分析出客户满意度和销量关系;

3、得出用户品论阅读率和销量关系。

二、理解数据

本次使用数据为亚马逊精美食品信息,包括10个字段:序号、产品id、用户id、用户名、有价值评论客户数、评论客户总数、评分、时间、评论摘要、评论;本次就是根据以上内容进行分析。

三、数据清洗

数据清洗分为以下七个步骤

1、根据提出的问题,对各字段内容进行理解,并梳理出字段间关系,然后将不需要的字段进行隐藏,以便数据处理过程更加顺畅。对本次数据各字段进行分析,对于时间、评论概述进行隐藏。

2、数据重命名,本次分析数据为亚马逊精品视频销售数据,字段名为英文,首先将其翻译为中文。

3、删除重复性数据,重复性数据对数据整体会有较大影响,分析之初应该将重复性数据进行删除,因为品论内容内容较为丰富,且评论字数较多,所以一般不会完全一致,本次使用评论内容作为筛查重复性数据字段。

本次共识别出610个重复性数据,并进行了删除。

4、缺失值处理,数据在收集过程可能出现部分值缺失,在这一步进行补充完整。对于各个字段按下图方式进行查找并补充。

本组数据未发现缺失值。若是存在,一般按一下规则进行补充。

(1)对比缺失内容,通过人工手动补全

(2)删除缺失的数据

(3)用平均值代替缺失值

(4)用统计模型计算出的值去代替缺失值

如果是同一字段、且缺失内容一致,查找出之后,在其中一个单元格进行输入,然后按Ctrl+enter键快速补全所有缺失单元格。

5、一致化处理,对于字段名称存在重复性内容或是单元格内容不统一、表达不明显的字段进行处理,存在结构不统一,需要使用分列功能,将格式进行统一。

具体步骤为:数值工作栏、分列,再按照数据结构进行分列,需要注意的是,分列前要将所分列的列复制、粘贴至数据最后一列,否则分列后会将分列之后的列覆盖掉。

本组数据原始数据对于评分一栏使用的是按1、2、3、4、5 进行打分,直观上不太明显,这里使用满意程度进行替换。

首先,按照分数高低和满意度进行对应;

然后使用Vlookup函数进行处理,如下图:

此处vlokup函数的查找范围改为绝对引用,相对引用情况下,超出单元格范围就会报错。

四、模型构建与可视化

对数据清洗完成后了,下一步就是找出数据间的关系;

1、销量占比数据:总商品数2553中,其中食品销量前十名占比17.78%,所以应该集中精力对销售占比靠前商品进行推广。

销量前10名商品

2、客户满意度和销量关系:

对销量前20的商品客户满意度进行描述统计分析,其中满意度平均值为75.5%,中位数为75.2%、众数为72.2%,三者基本数据很接近,则排名前二十在客户满意度低与平均值的商品需及时对客户进行回访,得到不满意原因,及时提升客户满意度。

排名前20商品客户满意度占比

排名前二十商品,满意度描述统计分析

3、认为客户评论有用商品和商品销量存在较大正相关或负相关关系,证明客户的评论会直接影响其他客户的购买情况,所以对于销量较差且评论较多商品,应及时根据客户评论做出相应调整。

五、结论

根据以上数据分析可知,

1、排名靠前的商品占销售总量的较大一部分,所以针对该部分商品应重点对待;

2、对于销量接近的商品,如果客户满意度达不到该阶段平均水平,应及时根据客户反馈评论对产品进行调整,从而达到销售额提升的目的;

3、应积极对待用户评论,用户评论会在很大程度上影响其他客户的购买情况,特别是用户评论和销量呈严重负相关产品。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();