从0-1搭建用户画像系统的设计思路

访客4年前黑客工具454

编辑导语:如今在这个大数据时代,我们常常会被“标签化”,最常见的就是你逛 *** 时,会按照你的乐趣喜好等等特征举办推荐;本文是作者分享的关于从0到1搭建用户画像系统的设计思路,我们一起来进修一下。

从0-1搭建用户画像系统的设计思路

一、需求目标

1)商城已上线2周年,已有10万+在售物品;数据客栈中积聚着大量的业务数据、日志数据及埋点数据;如何充实挖掘沉淀在数据客栈中的数据的代价,有效的支持用户画像的建树,成为当前的重要事情。

2)在担保用户局限不绝增长的方针下,运营方思量成立用户流失预警机制,实时识别将要流失的用户群体,实时采纳运营计策换回用户。

二、产物布局

从0-1搭建用户画像系统的设计思路

三、用户画像系统搭建流程

今朝团队已经搭建了较量成熟的数据客栈。也就是说已经有布局化的、清晰的用户属性、用户行为相关数据。

在此基本上,搭建用户画像系统,需要:

从0-1搭建用户画像系统的设计思路

四、数据建模

对人、货、场举办阐明,对用户个另外性质和特征做出归纳综合,形成相应的用户属性标签、用户行为标签后。才可以开始建模。

建模需要别离从定性、定量,两个方面入手:

定性:在从已有数据中心,选择特征;假设这些特征与你要预测的值有一个干系,这个干系就是一个原始的模子。

定量:确定模子中涉及到的所有未知系数。

模子计较完成后,需要计较模子的置信度;此时按照测试数据(可以是团队内部测试、灰度测试等 *** ),来判定模子计较的功效,与预期是否相符。

假如相符,就可以用这个模子来预测用户喜欢什么;假如与预期不相符,那么久需要反复上述进程。

好比商城系统中,有以下数据项:

从0-1搭建用户画像系统的设计思路

用户忠诚度指标(L),与用户活泼度、购物车商品数、保藏数、下单数、在线时长的用户行为指标有必然的干系;将这5项数据指标的熵权值,界说为用户忠诚度指标,可以用以下公式暗示:

从0-1搭建用户画像系统的设计思路

个中a暗示上表中A2-A6的归一化值,归一化计较公式如下:

从0-1搭建用户画像系统的设计思路

w暗示权重。权重系数计较公式如下:

从0-1搭建用户画像系统的设计思路

个中,e为行为数据信息熵,计较公式如下:

从0-1搭建用户画像系统的设计思路

最终计较所有的用户的指标L后,譬喻可以取前25%为高忠诚用户,25-50%为普通忠诚用户,剩余为低忠诚用户,取值范畴可以按照业务实际环境调解。

别的,由于权重系数,有大概随时间的增加而衰减;所以假如需要,还需要界说衰减因子r;插手衰减因子后,标签权重=衰减因子*行为权重。

五、梳理用户画像维度

设计用户画像维度时,发起利用MECE(Mutually Exclusive Collectively Exhaustive)准则;也就是对付一个重大的议题,可以或许做到不重叠、不漏掉的分类,并且可以或许借此有效掌握问题的焦点,并成为有效办理问题的要领。

好比劈头搭建用户画像维度,可以参考下图:

从0-1搭建用户画像系统的设计思路

上图为商城系统,劈头的用户画像维度。图中的数据,凭据获取的 *** ,可以分为:统计类标签、法则类标签、挖掘类标签。

统计类标签:这类标签是最为基本也最为常见的标签范例,譬喻对付某个用户来说,他的性别、年数、都市、星座、近7日活泼时长、近7日活泼天数、近7日活泼次数等字段可以从用户注册数据、用户会见、消费类数据中统计得出;该类标签组成了用户画像的基本。

法则类标签:该类标签基于用户行为及确定的法则发生;譬喻对平台上“消费活泼”用户这一口径的界说为近30天生意业务次数>=2,在实际开拓画像的进程中,由于运营人员对业务更为熟悉、而数据人员对数据的布局、漫衍、特征更为熟悉;因此法则类标签的法则确定由运营人员和数据人员配合协商确定。

相关文章

“青菜拼车”套路深,它能解决滴滴的增长难题吗?

“青菜拼车”套路深,它能解决滴滴的增长难题吗?

编辑导语:7月20日,滴滴拼车更名为“青菜拼车”正式官宣上线,这是滴滴的一次布满计谋目光的品牌进级。“滴滴拼着打,只要白菜价”的宣传语引人留意,一方面直观出经济实惠的产物处事,另一方面阐发了“青菜拼车...

以数据为引导,构建业务模型

以数据为引导,构建业务模型

编辑导读:对付一款互联网产物,它的根本就是其业务模子。如何构建业务模子、如何向着正确的偏向构建业务模子是产物司理在产物迭代进程中最具挑战性的事情。本文作者从自身事情实践出发,团结相关理论分享了构建业务...

产品分析及优化 | 有道云笔记-记录,成为更好的自己

产品分析及优化 | 有道云笔记-记录,成为更好的自己

今朝,有道云条记以强大的成果,优质的处事,占据条记类产物较大的市场份额。跟着用户对付效率办公软件的需求逐渐变大,对全场景信息处理惩罚的成果要求日益严苛。有道云条记作为典范的东西类应用,也面对着与同类产...

房产行业怎么做数据分析?

房产行业怎么做数据分析?

编辑导语:疫情期间许多行业因此受到了影响,出格是实体/传统行业,房地产在此时也面对着必然的坚苦;房地产行业个中生意业务错综巨大,运用数据阐明的方法举办系统的整理以及阐明会更好;本文作者分享了关于房产行...

连锁型客户,该如何用最小成本解决复杂需求

连锁型客户,该如何用最小成本解决复杂需求

编辑导语:打点系统对付大企业可能连锁店来说需要足够全面的组织架构,因为连锁店范例的涉及的分支很是麋集,需要每一个层级需要清晰明白,打点起来才较量利便;本文作者分享了关于如何用最小的本钱为连锁型的客户办...

详解草图、线框、模型和原型

详解草图、线框、模型和原型

编辑导语:假如你从事设计事情,你常常会听到草图、线框、模子和原型等术语;很多设计师瓜代利用这几个术语,固然术语是相关的,但它们是差异的;在本文中,将回首四种范例的可交付设计,并摸索哪些东西可以辅佐我们...