推荐系统整体流程:
在推荐系统中,排序其实和召回一样重要,推荐的结果用户是否满意跟排序算法有不可磨灭的关系。
其中排序最简单的线性模型就是逻辑回归(logistic regression),众所周知,逻辑回归主要用于二分类和多分类。
拼接每个向量化后的用户画像userProfile和itemid的特征,再加之上下文信息context,若userid在itemid上发生过行为(小说推荐场景中比如点击,阅读 or 收藏过),就把label置为1,这些加起来就是正样本,那么没有发生过行为的为负样本label为0。那么逻辑回归的损失函数就派上了用场:
其中,y为:
z为:
通过降低损失函数打到训练的目的哦,那么,利用模型对新的数据进行预测就完成了打分,根据topN进行排序展示给用户。
但是这个LR只适合离线大数量处理,没有办法处理在线数据,不能适应现存推荐系统的实时性要求,但是入门还是要学哒~。嗯,Google在2013奶奶推出了Follow The Regularized Leader(FTRL),一种在线逻辑回归算法。该方法对逻辑回归的目标函数进行了修改,加上各种系统工程上的调优,使得该模型的参数可以在每一个线上数据点进行动态更新,GitHub有源码。
此篇文章比较糙,有错误肯请指正~
参考文章:












网友评论