Q&A第二期

作者: shudaxu | 来源:发表于2019-12-24 18:04 被阅读0次

1、
Q:线下auc提升了,但是线上auc未提升(或者很低)是什么原因?
A1:首先需要跑特征diff,同一次请求,在线上获得的特征需要和线下的特征一致,才有可比较性。
A2:其次别的策略上的变化也可能会导致线上数据的分布跟离线训练测试时不同,导致线上auc未提升。(比如上线新模型后,推荐策略推荐的物品分布发生很大变化,跟之前训练的数据分布差距太大,那么也可能会导致auc跟线下预期不一样)

2、
Q:为什么线上auc提升,线上点击率未明显提升(ctr模型)?
A1:由于模型本身预估的是单个item的点击率,但是展现给用户的是在不同位置的多个item,单纯把点击率高的排在前面,跟真实点击率提升并没有最直接的关系。(比如你只是交换了一下第二个和第三个item的顺序,但是最终这个变化对用户点击的决策并没有显著影响)。
A2:也有可能是本身的优化空间太小,比如粗排从300选30,精排再从30选top10,那么提升精排模型auc,可能对整体的优化效果有限。(跟具体的分布有关,比如大部分用户看30个左右,而头部item的点击率都比较高【ie:差异小,粗排300选30的recall很高】,对头部预估的也都比较准,那么再怎么交换这30个顺序可能对用户影响也不大)

3、
Q:预估系统数据与算法如何自我演进?
A:算法影响数据,数据反过来影响算法与模型。实际上是一个不断演化的过程,很难保证真正的一致性。因为你在做实验的过程中,数据在变化,上线后,数据也会变化,然后影响模型,再影响数据,最后达到一个动态的平衡。

相关文章

  • Q&A第二期

    1、Q:线下auc提升了,但是线上auc未提升(或者很低)是什么原因?A1:首先需要跑特征diff,同一次请求,在...

  • FRESCO Q&A 第二期

    Q1:FRESCO是一个什么样的项目?创建初衷是什么? FRESCO是全球首个区块链艺术数字资产网络。 通过区块链...

  • SkyEye Q&A ——第二期

    Q1:什么是车载ECU? A1:ECU(Electronic Control Unit)电子控制单元,又称“车载电...

  • 海外义工Q&A(第二期)

    更多关于项目常见问题解答 (安全、消费、接机、机票等问题) 项目的开展时间 活动开展时间为2016年9月-12月 ...

  • 《拖延心理学》1/2

    以Q&A笔记的形式进行分享,什么是Q&A笔记呢? Q&A是由“问题部分”和“答案部分”组成, 以一问一答的形式对知...

  • [ WWDC2018 ] - WWDC Lab:哪些是我们最关心

    WWDC Lab Q&A WWDC期间每天都会有苹果工程师现场答疑活动,这种活动叫Lab。以下是我们的Q&A Q:...

  • QReply - Knowledge world

    Quest your answer is a Q&A platform that empowers people ...

  • 胶原蛋白Q&A

    常见补充方式有如下几种: Q&A

  • Q&A的重要性

    Q&A的重要性Scout Q&A是Listing权重的重要影响因素,而不仅仅是标题、search terms和re...

  • SQL|创建表 JOIN 视图

    Q&A:如何实现多个表链式连接?

网友评论

    本文标题:Q&A第二期

    本文链接:https://www.haomeiwen.com/subject/wbufoctx.html