第三届挑战赛A2-基于电商平台家电设备的消费者需求及产品数据挖掘分析

发布时间:2015-11-23 作者:BdRaces 浏览量:1320

摘要:

在传统的市场中,销售人员与消费者是面对面的。在整个销售的过程中,有经验的销售人员可以敏锐的捕捉到消费者对商品的需求及对各产品的比较,从而总结出出消费者的消费模式。而在电商环境下,交易并没有人与人的互动,有的只是消费者在电商平台下留下的消费痕迹。这些痕迹描述了消费者和他们的需求的联系。这就需要我们运用数据挖掘的手段去探究这些足迹与消费者需要和愿望之间的关系。究竟如何实现这两者之间的模式挖掘正是本文的目的。

本文的研究主要基于消费评论数据,首先运用ICTCLAS分词工具对中文文本进行分词;为实现计算机对中文词语的理解,我们运用word2vec将中文词语转化为对应的词向量。最后对词向量进行分类和聚类,其中小部分数据基于支持向量机的好评差评分类正确率高达95%,较好的实现了对评论数据的挖掘。

研究发现用户购买净水器的理由是净水器能够改善用户的水质,保障用户的身体健康。同时,由于购买净水器而不需要再购买瓶装水为用户节省了时间和金钱。安装的方便性是所有用户购买净水器时关注的焦点。服务,净水质量,以及产品的方便性也都是优先关注点。同时我们也发现不同购物平台上消费者的个性化需求,例如国美网站上的用户关心产品是否是正品;而苏宁上的用户则更为关注净水后的水质,而淘宝用户对卖家的发货及物流速度有比较高的期望。同时本文也对各大品牌进行了对比并提出了其主要卖点和需要加强的方面,3M产品在用户关注的各方面都有较好的表现,用户较多,品牌效应较强,且能提供规范的服务;沁园在产品外观上具有明显优势且有专门的服务专员,但产品安装上需要用户提取预定,同时净水过程中产生的废水较多。特浩恩在四个品牌中不具备较强的竞争力,特别是快递服务有待加强。道尔顿价格公道,服务热忱,回头客较多,但受众面小,需要加强宣传力度。

 关键词: 中文分词,词向量,支持向量机,K-均值聚类

 


                                                                                                           阅读全文