-
示例:
df.write.csv('./data.csv')
.insertInto()
:将DataFrame
保存在table
中.insertInto(tableName, overwrite=False)
它要求当前的
DataFrame
与指定的table
具有同样的schema
。其中overwrite
参数指定是否覆盖table
现有的数据。.jdbc()
:将DataFrame
保存在数据库中-
:一个
JDBC URL
,格式为:jdbc:subprotocol:subname
mode
:指定当数据表中已经有数据时,如何保存。可以为:'append'
:追加写入'overwrite'
:覆写已有数据'ignore'
:忽略本次保存操作(不保存)'error'
:抛出异常(默认行为)
properties
:一个字典,用于定义JDBC
连接参数。通常至少为:{ 'user' : 'SYSTEM', 'password' : 'mypassword'}
-
.json()
:将DataFrame
保存为json
文件df.write.json('./data.json')
.orc()
:将DataFrame
保存为ORC
文件.pqrquet()
:将DataFrame
保存为Pqrquet
格式的文件.parquet(path, mode=None, partitionBy=None, compression=None)
.saveAsTable()
:将DataFrame
保存为table
.saveAsTable(name, format=None, mode=None, partitionBy=None, **options)
.text()
:将DataFrame
保存为文本文件