如何结合业务选取一个合适的相似度计算方式?
考虑对item的表征特点,并将item进行细分,定义一些具有代表性的item,尽量考虑全面些,然后人工定义出他们之间的相似关系。之后结合各种相似度的计算,筛选出符合期望的那种相似度,若最后有多个选择,选出解释性强,计算量小的那一种,如果是所有的都被样例item排除,则按照业务重要性,去掉比较不重要的那组样例,继续筛选。
1,余弦相似度
2,皮尔逊相关系数
3,修正的余弦相似度
4,杰卡相似度
5,欧式距离
如何结合业务选取一个合适的相似度计算方式?
考虑对item的表征特点,并将item进行细分,定义一些具有代表性的item,尽量考虑全面些,然后人工定义出他们之间的相似关系。之后结合各种相似度的计算,筛选出符合期望的那种相似度,若最后有多个选择,选出解释性强,计算量小的那一种,如果是所有的都被样例item排除,则按照业务重要性,去掉比较不重要的那组样例,继续筛选。
1,余弦相似度
2,皮尔逊相关系数
3,修正的余弦相似度
4,杰卡相似度
5,欧式距离
本文标题:几种相似度的对比
本文链接:https://www.haomeiwen.com/subject/yviczttx.html
网友评论