浅谈数据分析

-回复 -浏览
楼主 2019-01-09 13:25:21
举报 只看此人 收藏本贴 楼主

前略


最近有程序猿小伙伴卖萌说不知道什么叫数据分析,并且发现了对数据分析的一些误解。今天为大家科普下吧~当然,我也基本算个小白,有不对的地方欢迎补充。

首先,先说下现在大家经常接触到的数据分析。其实,数据分析只是数据处理的一部分,但是由于分析后会有结果的产生,所以普遍被大家认识到的就是数据分析。

其实关系应该如下图:


数据分析只是其中的一个环节,其实数据分析对于数据量很小的标本是没有意义的。只有当数据量很大的时候,通过寻找数据的相似性,从而去进行分析。其实,就是通过大数据去寻找相应的共性、关联,从而去佐证自己在分析前的设想。

其实,这不得不说一下正常科学研究的方法了。数据在我看来可以算是实验的一种,做实验之前有两种可能一种是有假设通过实验去验证假设,一种是有实验的一定目的性通过实验去发现问题。

这与使用数据分析是一样的,数据为什么分析?怎么样去分析?结果是怎样?

可以说,我们在做数据分析的时候也会存在两种情况,①有个想法去验证②从数据中找共性从而去发现想法

这本身就是数据研究的两个方向,也是除了数据分析师之外的产品经理需要做的工作。

对于两种情况举个栗子(因为我原来做风控的就拿风控举例了):

①有个想法去验证

在风控上,区分好人和坏人、人还是机器人是对于反作弊来说比较重要的一点。那么坏人的共通点有什么呢?如果知道相关的关系型我是否就能快速判断坏人呢?这里不得不说关系型网络的一个概念,我们可以普遍认为近朱者赤近墨者黑这句话算一部分的真理。那么对于借钱这点,可以说坏人会连成线,好人可能是单点的。有了这个想法之后,就可以为数据组去提交相应的维度进行验证了。

1、对于数据的注册时间、地区关系进行统计

2、对于用户的通讯录信息进行分析(比如姓名、号码是否重复多次出现)

3、用户通话详单分析

4、逾期数据

通过以上几个维度,去验证是否坏人是否是连成片的,如果验证通过,那么在以后的风控策略上就可以对于这个点作为风控点去进行记录。

②从数据中找共性从而去发现想法

这个比较有趣了就,需要数据人员对各个维度的数据清洗后,对关键点进行一定聚类,从而去寻找相应共性。再对共性进行回归验证一下,是否这个共性为有效的,如果是,则可以作为风控策略。

其实,分析方法有很多种,比较常用的就是聚类,但是聚类比较适合用于单因子决策。如果是多因子来说,那就需要对其单因子、关系型因子分析了。其实数据分析后,对于已经成熟的产品的改进方向是重要的,现在一个成熟型的产品,除了增加相应的新功能外,其实更应该由数据驱动进行产品迭代。

我这里举个栗子,也是我平时槽点众多对象之一:

自从头条的推荐算法火了头条应用之后,很多都用了推荐算法,常见的就是【猜你喜欢】之类的推荐内容,充斥在电商、视频等等的网站。好吧,槽点就是电商的推荐。

在我在搜索-->订书器或者其它什么之后,推荐就变成了订书器,除非我在搜索其它的,订书器的推荐比例才变少。

这其实就是有点没有去考虑用户行为,对于用户的搜索行为,以及推荐在电商中应该对于其权重等设定有下面的考虑(当然这只是我的想法)

对于商品属性进行分类,作为电商提升客单价和复购率虽然很重要,但是对于其关系型产品的推荐可以培养用户对于新商品的需求。尤其是低频商品,比如订书器(只是可能对于我来说哈)这种比较低频的商品,在其推荐的时候权重就应该进行相应的降低,并且在用户购买后提高其关联性商品权重比如a4纸等办公耗材。比如用户购买了食品、服装等高频商品需求时,可以权重相对较高。

那么这些商品的分类、以及推荐效果如何,这就需要后续对于用户的订单数据、页面的跳转率、购买率、页面停留时间等维度数据进行分析了。

分析后,可以对于公司内部产品的提升。但是,对于竞品分析大数据分析看起来有点无力。

其实并不然,就像最开始说的,数据分析只是其中一环。对于竞品,我们就用上了数据挖掘和数据清洗了,最简单的就是爬虫技术。

比如,你是个电商网站,你的用户群体是一个价格偏好型的,那么为了提供价格敏感度就需要对全网的价格进行监测,我记得好像是亚马逊,对于全网的同产品价格就会进行监测,某个价格低于自营产品价格,就会进行一定的价格修正。

虽然,这是个价格修正,但是对于这些历史价格的存储后,以及一定的清洗,我们就能做到数据分析了。就可以观测每个不同种类的商品,在每个季节、或者xx的价格波动,以及市场供需关系,帮助我作为定价或者进行网站活动也能提供一定的理论基础。

除了这个,对于最先开始竞品调研上,我们也可用通过数据挖掘收集相应的keyword的相关数据,尤其对于目标竞品,以及公司产品进行SWOT的分析方法,帮助我们更好的进行产品的规划,以及一些选型等问题。

其实SWOT是一个很好的分析方法,帮助自己迅速了解内部优势、劣势,外部优势、劣势,对于决策上来说也是不可或缺的。

对于用户画像的形成,通过数据分析进行一定的聚类分析,很容易形成清晰的用户画像,比如下图。






对于其用户属性进行划分后,就可以看到相应用户画像,以便更好的对目标用户进行定位。


当我们数据分析后,就可以进行相应的进一步的操作了,进行数据建模。数据建模顾名思义,就是把我们确认的、验证过的内容,进行相应的函数或者其它的形式程序化,以便后续进行复用。

 

数据预测,是在有大量的基础数据基础上,通过不断调优模型,对于未来的事情进行预测。当然,预测这个事难度很高,因为,只有理想情况下才能预测的很准确,因为很多事情是有重复性的可能性,所以进行预测。但是市场,是一个宏观的事情,它有各种因素进行决定,如果,以以往的历史价格来说,可能双十一的时候商品价格变便宜,但是比如在这中间有市场变化、政策变化等因素存在后,这个由于无历史数据的分析,所以这个时候的预测就不会准确。

 

所以,现在的数据预测也只是存在于理想情况下,刨除很多主观因素的影响,纯客观的预测,所以准确性就是个问号了。







好了,对数据分析相关的内容就这么多了,有的地方说的可能不对,很多地方也全凭YY,有错误的话请联系我改正下~

欢迎关注

平时由AI机器人客服,来回复大家哦~

如有疑问,请留言


我要推荐
转发到