如今的AI机器人变得越来越聪明,在很多领域已经超越人类,你知道原因吗?
让我来告诉你吧,AI变得聪明的秘诀是它乐于“接受人类的差评”。
用更专业的语音来表达,AI通过人类反馈强化学习(RLHF)技术变得越来越聪明,而RLHF的关键便是人类对AI的输出进行评价:好评和差评,这种评价作为奖励信号反馈给AI模型,AI模型不断的调整自身的行为使得它的输出更符合人类的标准和价值观。
同时,你还会发现,作为人类的我们其实不喜欢差评,人类只喜欢好评。
同样为人类,凭什么你能评价我呢?除非你是神仙。
从学校进入社会的人类,成长变得异常缓慢乃至停滞,也就在学校期间成长很快,学校有老师给我们评价,如同RLHF,这种评价促进了我们的成长。











网友评论