• About Me


  • 江湖传闻



  • 上一张

分布式1102-Hi,Hive!Hi,Spark!

hadoop以及MapReduce暂告一段落!

这一节我们做个过渡,讲一讲Hive以及Spark。

分布式1015-1021-分布式回归分析

一、开始!今日信息量巨大

大佬们展示肌肉。

回归部分还需要些数学根底。

代码后面也有一丢丢正文。

数据之学|交叉验证相关理论介绍

交叉验证相关理论介绍

2020.10.13

1.1 场景构建

源禾同学和正阳同学在某次考试都考了100分,正阳同学实力强劲,学习踏实,掌握核心科技,考了100是实力的体现,因为卷子上只有100分。而源禾同学考100分,因为源禾使用了败者食尘,他课下做了这张卷子的所有题,背了题,考了100分是因为记性好。

谁才是老师喜爱的同学呢?

分布式1007-Map-Reduce的文字流

最后编辑于:20.10.15

开门见山地来一段,就一段,不会有人这个都没搞懂吧,不会吧不会吧(拖走

1
2
3
4
5
6
hadoop jar \
$HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-3.1.3.jar \
-input /user/devel/2020210995wangyuanhe/README.txt \
-output /user/devel/2020210995wangyuanhe/1007output \
-mapper "/usr/bin/cat" \
-reducer "/usr/bin/wc"

开始前再插一句题外话,被强大而可爱的丰丰老师表(da)扬(shang)了,动力+10086,继续努力啊小禾禾!!