recode.txt
(318 Bytes, 下载次数: 0)
2023-9-27 17:25 上传
点击文件名下载附件
数据
下载积分: 吾爱币 -1 CB
1、使用List(1,2,3,4,5)创建RDD,并将所有元素打印出来。
2、将第1小题中的RDD的每个元素加2,打印出前3个元素。
3、有一个包含了学生姓名的数组Array("Jim","Tom","Jim","Jerry","John","Jim","Tom"),通过RDD去除重复的名字,打印出去重后的RDD元素。
4、通过RDD计算第3小题的数组中有多少个元素以字母'J'开头,打印RDD元素个数。
5、考试文档中的recode.txt文件中包含了商品被点击的记录,其中第一个字段是点击时间,第二个字段是商品ID,将文件数据读取到RDD中,使用合适的算子统计每件商品被点击的次数。
6、考试文档中的student.txt文件记录了大数据技术专业2个班同学的《spark实时数据处理技术》课程成绩,数据结构为【学号,姓名,班级,成绩】,读取文件数据用来创建DataFrame,将DataFrame中所有数据打印出来;
7、使用第6小题的DataFrame,统计出及格的学生人数并打印出来;
8、使用第6小题的DataFrame,统计每个班的平均分并打印出来;
9,使用第6小题的DataFrame,计算出1班排名前3的学生信息并打印出来;
10、使用第6小题的DataFrame,查询出不及格的学生,并将学生信息导出为csv文件。