美文网首页
12. 如何评价RAG项目效果的好坏

12. 如何评价RAG项目效果的好坏

作者: codeMover | 来源:发表于2025-04-26 22:07 被阅读0次

12.1 针对检索环节的评估

  • MRR 平均倒数排名:查询(或推荐请求)的排名倒数

    • MRR是一种常用的评估信息检索系统表现的指标,尤其用于衡量搜索引擎、推荐系统等根据查询返回的多个结果中的相关性。
      ·- MRR衡量的是相关结果首次出现的位置(越靠前越好)。
    • 适用于多结果排序任务,如搜索引擎查询、推荐系统等。


      MRR
  • Hits Rate命中率:前K项中,包含正确信息的项的数目占比

  • NDCG:

    • 高关联度的结果比一般关联度的结果更影响最终的指标得分。
    • 有高关联度的结果出现在更靠前的位置的时候,指标会越高。

12.2 针对生成环节的评估

  • 非量化:完整性、正确性、相关性
  • 量化:Rouge-L
    • Rouge-L是一种用于评价文本生成质量的指标,通常在自动摘要、机器翻译和文本生成任务重使用。通过最长公共子序列来测量生成文本和参考文本之间的相似性。
  • 由多喝专家分别生成人工摘要,构成标准摘要集,将系统生成的自动摘要与人工生成的标准摘要相对比,通过统计二者之间重叠地基本单元的数目,来评价摘要的质量。
  • 召回率:参考文本中与生成文本匹配的最长公共子序列的长度,与参考文本的总长度之比。
  • 精确率:生成文本中与参考文本匹配的最长公共子序列的长度,与生成文本的总长度之比。
  • 由于Rouge-L注意最长公共子序列,在衡量文段的连贯性和句子顺序上具有优势。

相关文章

  • 神一样的产品经理-数据统计分析与挖掘

    产品正式发布之后,如何去评价运营效果的好坏呢?评价的依据是什么?答案是“让数据说话”。 产品运营过程中,产生了大量...

  • 如何评价客户流失预测模型效果

    如何评价客户流失预测模型效果呢? 用来评估客户流失预测模型预测效果好坏的一个重要指标就是提升度了。所谓提升度,简单...

  • 简洁日常——V领针织衫(五)

    11.¥39 评价: 暂无评价 12.¥39.99 评价: 暂无评价

  • 如何评价珍珠好坏?

    如何评价珍珠好坏,简单说一下我们行内的几个判断标准:色泽、大小、形状、瑕疵。 1.珍珠色泽: 古语有云:“珠光宝气...

  • 如何评价模型好坏

    数据集(训练&验证&测试)评价分类结果混淆矩阵分类评价指标准确率precision:召回率recallF1-sco...

  • 如何评价算法的好坏

    机器学习是基于统计原理的预测。 如何判断?判断正确数与总数的比率?这种做法有缺陷,比如一堆人里预测癌症患者,因为发...

  • 如何评价模型的好坏

    1.训练数据集&测试数据集 将原始数据中的一部分作为训练数据、另一部分作为测试数据。使用训练数据训练模型,再用测试...

  • 如何评价分类模型好坏

    前言 在上一篇文章中,我们了解了k近邻算法,也学习了KNN算法的流程,并且手动实现了python代码和封装。那么在...

  • 如何迭代案例教学效果

    如何案例教学效果迭代 在案例教学效果迭代上,我们可以采用的方式是在自我评价,学员评价、专业专家评价和流程专家评价,...

  • StoreKit

    1.APP内评价 效果展示 2.APP内购买其它项目 效果展示

网友评论

      本文标题:12. 如何评价RAG项目效果的好坏

      本文链接:https://www.haomeiwen.com/subject/nttzbjtx.html