如何精准匹配用户画像与物品画像?
构建用户画像
什么是用户画像?就是一个人的标签集合。
构建用户画像前首先需要从用户基础信息和动机信息出发,再从不同类型用户中抽取出一个典型特征来还原一个用户的特征,而这个特征抽取的过程就是用户画像构建的过程。
用户动机与特征
用户动机、特征这两个概念。
1)用户动机
在选择和使用媒体时,用户往往具备很强的主动权和目的性,因此用户动机其实指的就是用户使用互联网的目的,它通常分为社交、消磨时间、查找信息、分享、表达、娱乐……这几种。
2)特征
用户画像由大量的特征组成,比如基本特征、统计特征、偏好特征等,而特征的特点分为以下三点。
特征最直观的一个属性是有特征值,而这个特征值可以是单值,也可以是多值,它具有具体数据类型、数据分布,比如枚举范围、日期类、真实值等。
同时,特征还有生成逻辑,它主要通过规则或者算法模型产生,且在不同条件下它还会产生新的特征。
除此之外,特征还能区分类目城市。
特征管理的实现过程
在实际业务中存在着具体特征、管理特征与特征值时,首先我们通过维度将具体特征进行归类,并对特征值进行管理;接着,针对不同条件我们使用限定词来扩充特征;最后,我们把特征和特征值属性归类到特征和特征值字典中进行维护。
在生成特征后,如果重新导入特征,特征依赖就会出现环状结构,引起特征血缘错乱。
因此,业务方申请特征时,我们需要检测是否有环状结构。如果该特征在使用时又产生了新数据,那么这些新数据就会通过数仓写入画像系统,此时我们同样需要对其进行检测。
由于维度匮乏、信息缺失、信息不准确等原因,很多时候仅依靠用户个人填写的基础信息很难对真实系统进行全方位的刻画,因此我们还需要借助算法模型进行预测。
比如一些看似抽象的职业标签,通过海量的数据分析后我们就能推测出一部分用户的职业类型,且经过模型预测后该值的概率较高,比如那些经常定位在政府机关的用户,其为公务员的可能性比较大。
网友评论