怎么创建DataFrame
1、创建在Spark SQL中SparkSession是创建DataFrame和执行SQL的入口,创建DataFrame有三种方式:通过Spark的数据源进行创建;从一个存在的RDD进行转换;还可以从Hive Table进行查询返回。1)从Spark数据源进行创建(1)查看Spark数据源进行创建的文件格式

3、(3)展示结果

7、2)对DataFrame创建一个临时表

9、4)结果展示

12、6)通过SQL语句实现查询全表

14、2)查看DataFrame的Schema信息

16、4)查看”name”列数据以及”age+1”数据

18、6)按照”age”分组,查看数据条数
