美文网首页
2018-11-09 会议

2018-11-09 会议

作者: 雨见青城 | 来源:发表于2018-11-13 16:42 被阅读0次
  • 预测区间(Prediction Interval):
    给定一个概率\sigma,确定预测区间[y_1, y_2 ]。该区间有\sigma的概率包含真实值y_{true}。预测区间可以反映预测值是否可靠,预测区间越大,该预测值越不可信。

  • 计算预测区间有两种方式:

    • Conformal Prediction
    • Quantile RF
  • Conformal Prediction

    • Assumption: 数据是iid

    • 用于衡量预测是否可信,主要利用NonConformity Measure, 简称nc

    • 为计算nc, 构建了两个学习器:

      • Regressor. 拟合<X, Y>之间的关系,用y = f(x)来表示;
      • Normalizer. 拟合<X, ln^{|Y - \hat{Y}|}>之间的关系,用于预测给定测试点\hat{x}的误差,的用n(x)表示。
    • 其算法步骤如下:

      • 从数据集D中,构建训练集D^t, 校准集D^c(RF中可用oob instance代替)。

      • D^t用于训练上述提到的Regressor f(x)Normalizer n(x)

      • D^c用于计算nc。对于校准集D^c中的第i个测试点\hat{x}_i(i \in D^c), 计算其NonConformity Score, 如下:
        \alpha_i = \frac{|y_i - \hat{y_i}|}{\sigma_i}
        其中,\hat{y}_i = f(\hat{x}_i), \sigma_i = n(\hat{x}_i)。计算每个值,并按照降序排列,从而得到Set S = {\{\alpha_1, \alpha_2, ... , \alpha_q\}}

      • 给定一个significance level \delta, 利用某公式确定\alpha_{S}^{\delta}

      • 对于新来的测试点x_j(j \in Test), 用Normalizer n(x)预测得到其\sigma_j,该测试点的预测区间为:
        Prediciton \ Interval = \hat{y}_j \ \pm \ \alpha_{S}^{\delta}\sigma_j

相关文章

网友评论

      本文标题:2018-11-09 会议

      本文链接:https://www.haomeiwen.com/subject/lhpnxqtx.html