平衡目标 不同任务loss量级相近 不同任务相近速率学习 不同任务数据量级接近 不同任务重要性程度近似评估 不同任...[作者空间]
FM 原理与特点 适用场景 FM模型可以用于回归任务、二分类任务、排名任务,特别是在数据稀疏场景下,效果明显,广泛...[作者空间]
ES与其他架构配合使用 springdata、spark、flink +es springdata (不想记 懒得...[作者空间]
环境 单节点部署 vs 多节点部署 多节点分发xsync es-cluster/用户管理-配置文件 进阶-概念 索...[作者空间]
ES是一个基于RESTful web接口并且构建在Apache Lucene之上的开源分布式搜索引擎。 base ...[作者空间]
什么是用户引导?引导: 带着人们向某个目标行动,在行动上帮助人们走出困境。搜索引导: 帮助用户更快的完成搜索过程,...[作者空间]
DeepWalk的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走(trunca...[作者空间]
一种引入边信息的变权重GES方法。 建图模块采用networkx,session建立使用用户自定义+deepwal...[作者空间]
这几年,大数据发展迅猛,其中 Kakfa 凭借高可靠、高吞吐、高可用、可伸缩几大特性,成为数据管道技术的首选。 越...[作者空间]
auc AUC(Area under curve)是机器学习常用的二分类评测手段。AUC:一个正例,一个负例,预测...[作者空间]
过拟合(over-fitting)其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验...[作者空间]
from 感知机 https://blog.csdn.net/duduhonghong/article/detai...[作者空间]
基于flink-1.8.1 Watermark作用 watermark是用于处理乱序事件的,而正确的处理乱序事件,...[作者空间]
链接:http://genek.tv/,本文是该课程的学习记录。 1.共表达 两条基因的表达模式相似,即在某些样本...[作者空间]
https://blog.csdn.net/u013332124/article/details/91456422...[作者空间]
1、Flink 源码解析 —— 源码编译运行 2、Flink 源码解析 —— 项目结构一览 3、Flink 源码解...[作者空间]
一个总结https://www.cnblogs.com/xianbin7/p/10661572.html 特征交叉...[作者空间]
xgboost是各种比赛中最常使用的方法,网上介绍非常多,但是大部分看起来都比较费劲,这篇文章我将通俗的讲一下...[作者空间]
概述 GBDT的加入,是为了弥补LR难以实现特征组合的缺点。 LR LR作为一个线性模型,以概率形式输出结果,在工...[作者空间]
这里是「王喆的机器学习笔记」的第十七篇文章,之前已经有多篇专栏文章介绍了从Word2Vec,到Graph Embe...[作者空间]