1. 结果为:

    2. 指定列名:

      1. rdd = sc.parallelize([('Alice', 1)])
      2. spark_session.createDataFrame(rdd, ['name', 'age']).collect()

      结果为:

      1. [Row(name=u'Alice', age=1)]
    3. 结果为:

      1. [Row(name=u'Alice', age=1)]
    4. 结果为:

      1. [Row(name=u'Alice', age=1)]
      • 如果只有一列,则字符串schema 为:

        1. rdd = sc.parallelize([1])
        2. spark_session.createDataFrame(rdd, "int").collect()

        结果为:

        1. [Row(value=1)]