- 從R原生data.frame和list創(chuàng)建
- 從SparkR RDD創(chuàng)建
- 從特定的數(shù)據(jù)源(JSON和Parquet格式的文件)創(chuàng)建
- 從通用的數(shù)據(jù)源創(chuàng)建
- 將指定位置的數(shù)據(jù)源保存為外部SQL表,并返回相應(yīng)的DataFrame
- 從Spark SQL表創(chuàng)建
- 從一個(gè)SQL查詢的結(jié)果創(chuàng)建
支持的主要的DataFrame操作有:
·數(shù)據(jù)緩存,持久化控制:cache(),persist(),unpersist()