一、知识储备:
1、python基础
2、科学计算库(numpy、pandas等掌握常用的函数)
二、算法基础(原理+python代码实现+总结)
1、线性回归(LASSO回归、Ridge回归、多项式回归)、逻辑回归
2、决策树、随机森林
3、集成算法:Bagging(随机森林)、Boosting(GBDT、Xgboost、LightGBM)、Stacking
4、归一化、离散化、one-hot、TF-IDF、TextRank、相似度计算(余弦相似度、欧氏距离、杰卡德相似度、皮尔逊相似度)
5、K近邻、朴素贝叶斯
6、Apripri关联算法挖掘
7、降维算法:LDA线性判别分析、PCA
8、DNN、word2vec
三、推荐系统基础(原理+python代码实现)
CF协同过滤、LFM隐语意模型(SVD奇异值分解、MF矩阵分解)
推荐算法评估方法、机器学习算法评估方法
四、推荐系统进阶
推荐系统各个阶段: 召回+排序+重排
推荐项目分为:离线、近线和在线
编程语言使用: java/scala+python
框架:Flask、Tensorflow、Flink
常用名词和算法:CTR预估、CVR、FM、Deep&Wide、DeepFM、Pointwise/Pairwise/Listwise
五、面试必问:
时间复杂度、空间复杂度
数据结构:线性表(顺序表、链表、栈、队列)、树(二叉树、哈夫曼编码、堆、tire树)、图(有向图、无向图、有权图)
算法:KMP算法、分治算法、递归与回溯、贪心算法、动态规划、排序(选择、冒泡、二分、快速)
网友评论