美文网首页
Spark MLib Word2Vec Error: The v

Spark MLib Word2Vec Error: The v

作者: 邵红晓 | 来源:发表于2019-10-22 10:20 被阅读0次

语料库,去除停用词

val model = word2vec.fit(v)

一执行就报错如题目错误,经过google发现,spark ml word2vec有一个参数
minCount: 表示输入词在输入语料中至少出现多少次,才会进行向量转化,少于该出现次数的次将会在输入值中直接丢弃。 (>=0整数,默认值: 5)
恍然大悟,语料库输入有问题,我输入了词典当作语料库,词典种词的出现次数当然小于5,发现了问题所在

相关文章

网友评论

      本文标题:Spark MLib Word2Vec Error: The v

      本文链接:https://www.haomeiwen.com/subject/vyofvctx.html