命令 :
hdfs dfs -cat /aaaa/bbbb/cccc/ddd/* |grep 2333333 |jq .itemInfoModel.totalSoldQuantity | sort | uniq| wc -l
备注:
- hdfs dfs -cat 是HDFS文件系统里的cat命令
jq 是linux下的 Json解析命令,非常的方便linux下 去重需要先排序再去重
hdfs dfs -cat /aaaa/bbbb/cccc/ddd/* |grep 2333333 |jq .itemInfoModel.totalSoldQuantity | sort | uniq| wc -l
jq 是linux下的 Json解析命令,非常的方便
linux下 去重需要先排序再去重
本文标题:读取HDFS中的 Json文件 并排序去重求个数
本文链接:https://www.haomeiwen.com/subject/bdmtattx.html
网友评论