米娜桑,大家好,欢迎来到怪力少女赵壮实时间!
在数据处理过程中,我们一般会经历:数据采集—数据开发—数据生产—数据查询分析—数据可视化等几个步骤。而在「数据查询分析」这一步中,会有业务数据分析、用户属性分析、用户行为分析等。其中用户行为分析,主要是针对用户在产品上产生的各种行为进行数据分析,以便我们更加了解用户,更好地满足用户需求,提升用户体验。
01理论入门:三组概念巧理解
1.用户行为/用户行为数据/用户行为分析
用户行为:广义来讲,用户行为是由简单的五个元素构成:时间、地点、人物、交互、交互的内容。如果我们要对网络上用户纷繁复杂的行为进行分析,要将其定义为各种事件。比如,用户搜索是一个事件,在什么时间、什么平台上、哪一个ID、搜索的内容是什么,就是事件的属性。
用户行为数据:最简单的存在形式就是日志,日志记录了用户的各项行为,如网页浏览、购买、点击、评分、评论等等。这些数据既可以横向对于某一类用户群体的共同特性进行分析,如:分析全部用户对于某个页面的点击率;也可以纵向对于某个用户的行为细节和流程进行分析,比如对某一个用户进行行为细查。
用户行为分析:对用户使用产品过程中的所有数据(包括下载量、使用频率、访问量、访问率、留存等等)进行收集、整理、统计,进而分析用户使用产品的规律,为产品的后续发展、优化或者营销等活动提供有力的数据支撑。
2.事件/属性
事件:通过埋点定义的用户行为或业务操作。
属性:包括事件属性、用户属性、设备属性。
事件属性:一个事件内可能包含数个事件属性,记录了详细描述事件的各种维度信息。
举例来说,“播放视频”事件下可能包含以下事件属性:
§enter_from(视频的展示来源)
§is_auto_play(是否自动播放)
用户属性:用户自身状态的属性,例如年龄、性别等。
设备属性:用户所使用设备相关的属性,如操作系统、软件版本、软件渠道等。
3.维度/指标
维度:在用户行为分析当中,维度就是属性,如“城市”就是一种维度,包括北京、上海、深圳、广州等;又如“操作系统”包括ios、android;“渠道”包括app store、华为应用市场、小米应用商店等。
指标:是量化的数值。包括UV、PV、人均次数、时长、点击率、渗透率、留存率、成功率等。指标可以分为计数型指标和复合型指标,如UV、PV、订单金额都是简单计数型指标;而像跳出率、购买转化率等,涉及到四则运算,则属于复合型指标。
总之,在用户行为分析的数据产品当中,事件/维度/指标是三个最常用的词汇,事件和埋点紧密相连,代表埋点定义的用户行为或业务操作。对这些定义好的用户行为和业务操作做出衡量,就需要用到维度(属性)和指标。维度是事件的属性,我们按照什么切面去切分它;指标是事件量化的数值,我们怎么做能达到这一个数值。
02数据建模:好方法源自于好模型
如果数据处理是一条流的话,这条流就包括数据采集、数据生产开发、数据查询分析及可视化。在进行数据分析之前,还需要有一个数据建模的过程。基于模型,会形成常见的数据分析方法。好的模型可以让分析更加精准、快速。
数据仓库教材里,有一种数据立方体,这就是「多维数据模型」的通俗叫法。
通过「多维数据模型」,我们可以做一些基本的数据分析:
1. 对渠道效果进行分析,如:在评估应用宝渠道的效果时,可以分析不同渠道的注册用户分别是多少;
2. 对产品性能进行分析,如:在分析崩溃率时,可以按照产品不同版本的维度进行细分;
3. 对功能迭代进行评估,如:分析某新上线功能的用户的使用渗透率时,可以按照城市维度进行细分。
这个模型非常简单清晰,但是难点在于数据规模。在单位时间内,所产生的数据条数就是所有维度的乘积,假设“城市”维度中覆盖10个城市,需要监测10种指标,那么就会产生10^10 条记录,每条记录按1KB大小,那么就是10TB数据量。如果我们自己用SQL计算,将会是很大的成本。
03用户行为分析应用技巧
工欲善其事,必先利其器,微小的实践可能比宏伟的理论更伟大。
目前,市面上用户行为分析的产品很多,包括神策、growing io等产品。
在以维度和指标为指南,在看数据方面,壮实推荐大家可以从量级、趋势、异常结构、细分五个维度综合分析。看量级,即是看数据的多寡;看趋势,就是通过数据的升降判断业务健康度走向;看异常,就是看数据陡然来进行下钻定位,发现机会点和问题;看结构,即看数据的组成占比;看细分,及通过细分维度的数据结合产品的具体形态推敲数据背后可能存在含义。
数据驱动增长,从科学地进行维度-指标分析开始。
以维度-指标为逻辑的分析,可以极大地提高数据采集的效率,更真实、全面地还原用户与产品的交互过程。通过基本的维度/指标分析,可以快速定位影响转化的关键点,提高运营效率。此外,这一分析也是转化分析、留存分析、路径分析的基础,后续我们将陆续解读,敬请关注望京东路赵壮实~