在家庭群里,我爸发的链接,基本是关于家庭教育的,每天一个,从不间断。
有提醒大家精心教育子女的,有提醒大家不吃外卖食品的,有提醒年轻人早睡早起的,林林总总,大至套路是列举各种事项的巨大危害,引起全家人的重视。
可能这就是我爸对成年子女的持续教育方式吧,有没有用也不知道。
这些内容,反正我在手机上很少刷到,倒是能刷到老年人买保健品上当受骗的。有时也想暗搓搓发一两条,但想想何必惹他老人家不快呢,算了,算了。
我妈发的内容就比较平和,以养生做饭为主,什么蔬菜粥呀,养生茶呀,至少看上去没有那么大的视觉冲击力。
同样都是拿着手机,大家看到的内容为啥有那么大不同呢?
当然和各人兴趣有关,爱好不同,关注点也不一样。另一方面,也与大数据推荐算法有着莫大的关系!
今天就来聊聊能为每个人建设信息茧房的五大核心算法,协同过滤算法、基于内容的过滤算法、深度学习推荐算法、用户画像与特征工程算法、搜索排序算法。它们是一群极其聪明、24小时不知疲倦的“精灵”,是数字世界无形的指挥家,是我们每一次点击、每一次停留的忠实记录者,更是为每个数字游民量身打造个性化体验的“灵魂画师”。
一、协同过滤算法:宇宙最强的“社交关系网”
我们可以把它看成是宇宙级派对策划师+ 最懂你的“灵魂搭子”发现者,它工作时秉承的原则为“物以类聚,人以群分。你朋友的朋友,也可能是你的朋友。”互联网是一个超级巨大的虚拟城市,每个市民(用户)都有自己的“喜好DNA”。这位“策划师”的工作,就是在这座城市里举办一场永不落幕的盛大派对,并确保每个人都能找到聊得来的伙伴。
比如,小乐在微信读书里,选择了《恐龙》《机器人》《森林侦探》,读完之后,系统会为他推荐新的书目。过程如下:
1. 第一步:建立“关系图谱”
算法策划师拿出一个巨大的本子(其实是数据库),上面密密麻麻记录着所有人的读书行为。它发现,除了小乐,还有小明、小红、小刚等成千上万的人也看了《恐龙》《机器人》《森林侦探》。于是,它在你们之间画上了一条淡淡的连线,认为你们属于同一个“A品味部落”。
2. 第二步:寻找“跨部落推荐”
策划师继续观察。它发现,这个“A品味部落”里,有80%的人,同时还超爱一本《星际海盗的藏宝图》,策划师随即在小乐的读书记录里翻了半天,都没找到《星际海盗的藏宝图》的踪迹。
3. 第三步:发出“灵魂邀请”
“Aha!”策划师灵光一闪,“小乐和这群人品味高度相似,既然大家都爱《星际海盗的藏宝图》,小乐没理由不喜欢啊!” 于是,在小乐的推荐书单里,它悄悄塞进了《星际海盗的藏宝图》,并附上一行小字:“喜欢《恐龙》的人也喜欢”。
这就是协同过滤的核心——它根本不需要知道《星际海盗的藏宝图》是探险还是科幻,内容写了什么。它只依赖于“人”与“人”之间的行为关联,通过群体的智慧来为你预测未知。
它的超能力,就是给人们带来惊喜感!它能为你推荐一些你可能永远不会主动去搜索,但一见就“上头”的东西。比如你爱看科幻片,它可能会根据“同好”的行为,给你推荐一部你闻所未闻的冷门高分悬疑剧,打开新世界的大门。
但如果你刚注册,一片空白,算法就懵了,不知道该把你分到哪个“部落”。所以很多App一开始会让你主动选择兴趣标签。
这时,你的每一次点击、浏览、收藏,都成为算法捕捉的线索,逐渐勾勒出你的兴趣轮廓。随着数据的积累,推荐会越来越精准,仿佛有个懂你的朋友,默默为你筛选世界。
其实在简某书中,也有推荐这个功能,有些推荐作品感人至深,有些则一言难尽,这说明什么,是算法不够强大,还是作为算法分析对象的我们,其实也......一言难尽吧。
五大互联网核心算法精髓总览






网友评论