本篇文章给大家谈谈华为用户画像构建教程图,以及华为人才画像对应的知识点,希望对各位有所帮助。
互联网大数据时代,消费者的一切行为都是“可视化”。
企业聚焦于怎样利用大数据来精准营销。于是“用户画像”
概念也就应运而生。
1.数据真实
用户画像必须建立在真实的数据之上。比如你的理财产品的注册用户有很多垃圾用户,都不怎么投资,做用户画像的时候就要把这部分人清洗掉。
2.标签化(标签要言简意赅:易理解、短)
按产品需要,给不同的用户特征贴上合适的标签。如地域标签“北京”等等。
3.低交叉率(完整性、独立性)
4.优先级(多个用户画像需要进行优先级排序)
一个产品的用户画像不能超过三个,当有多个用户画像时,需要考虑优先级,否则产品设计时会无所适从。
5.不断修正
刚开始做产品可以通过调研+竞品分析的方式猜测用户是什么样的人群,实际做出来可能有点偏差,然后修正,当产品数据更丰富的时候,可能用户画像又需要修正。
用户画像就是用户信息标签化,所以我们可以通过以下步骤进行用户画像。
1.数据挖掘
以电商为例,为了抓取用户的人口属性和行为轨迹,先预设用户购物时的可能行为。包括访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。
2.筛选标签
根据用户画像的目的,筛选静态标签、动态标签。
静态标签主要从用户基本信息进行用户划分。静态属性是用户画像建立的基础。如性别、年龄、学历、角色、收入、地域、婚否、性格等。
动态标签指用户在互联网环境下的上网行为。如访问行为(搜索、注册、登录)社交行为(邀请、添加、取关好友、加入群、新建群)信息发布行为(添加、发布、删除、留言、分享)等。动态标签能更好的记录用户日常的上网偏好。
3.数据建模
数据建模就是给用户的行为标签赋予权重。
用户的行为,我们可以用4W表示:Who、When、Where、What。谁在什么时候在哪里做了什么。
数据建模实例:华为用户
A用户今天在华为官网购买了华为手机
B用户7天前在京东浏览了华为手机
如何构建用户画像
一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签华为用户画像构建教程图:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供华为用户画像构建教程图了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向华为用户画像构建教程图我们展示了一种朴素、简洁的方法用于描述用户信息。
1.数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。
静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
动态信息数据
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
2.目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒0.8、李宁0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
3.数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
什么地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址+内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,***等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,***订阅号页面,某游戏的过关页。
内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
标签权重
矿泉水1//超市
矿泉水3//火车
矿泉水5//景区
类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。
所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1
红酒1//浏览红酒
红酒5//购买红酒
综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识+时间+行为类型+接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7*1=0.665,即,用户A:红酒0.665、长城0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。
(本文来源于网络,若侵权请联系删除。)
关于红海云
红海云是中国领先的新一代人力资源管理一体化综合解决方案提供商,核心产品红海eHR系统,打破传统人力资源管理系统功能模块数据割裂的局限,从核心人力管理、劳动力管理到战略人才管理,涵盖人力资源业务12大模块,百余项功能一体化布局。并通过红海云RedPaaS平台、RedAPI平台、自动化运维平台等底层数字化配套体系的赋能,让红海云eHR系统拥有了业内领先的灵活性和可扩展性。
迄今为止,红海云服务的客户已成功覆盖华北,华东、华南、西南地区市场,已有逾千家大中型企业借助红海产品获得领先的人力资源管理数字化能力,广泛分布于国企事业单位、地产、银行、医药、物业、物流、餐饮、服饰等行业,包括中国银行、保利物业、石药集团、以岭药业、科兴生物、中金珠宝、华宇集团、祥源控股、雪松控股、真功夫、中邮金融、影儿集团、比音勒芬、曹操出行等众多头部企业。