在推荐系统中,最常用的就是用户分数了,它是矩阵协同过滤的基础。但除了分数外,图片、文字等特征也有利于勾勒用户的喜好轮廓。然而,图片、文字、分数的结构不同,难以统一地处理。
在此之前,人们的做法无非两种:
-
使用复合的算法处理。
第一种做法通过整合不同的技术来提高效果,比如整合content-based+CF-based algorithms。整合的方式可以是按权重、交换、混合、级联或者是元级别的整合。但这些做法忽略了利用不同结构的信息源,而需要投入很多精力去设计模型、选择模型。 -
使用复合的异构数据。
最近,第二种做法吸引了更多注意力,它们都借助了不同信息源的力量。- 一种趋势是用评论对评分进行增强处理,包括用topic modeling、sentiment analysis、neural network来对评论建模。
- 人们也考虑到用不同的信息,比如用评分+评论做商品推荐,用video做关键帧推荐,用音频做音乐推荐,用knowledge bases(可能是知识库/百科大全)做电影/书的推荐,但它们仍然局限于个别信息源,也需要研究者对其推荐的领域有一定的了解。
幸运的是,得益于最近在representation learning取得的突破,该技术开始关注这个问题。它使得人们可以用统一的框架处理不同结构的用户反馈。
本文为各种异构信息进行了统一的表示。
问题
为何一个公式能学习出u、v两个向量?Eq.(8)如何求解出来的?
网友评论