且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

如何在pyspark数据帧中创建序列号列?

更新时间:2023-11-18 21:38:28

您可以使用 range

df_len = 100
freq =1
ref = spark.range(
    5, df_len, freq
).toDF("id")
ref.show(10)

+---+
| id|
+---+
|  5|
|  6|
|  7|
|  8|
|  9|
| 10|
| 11|
| 12|
| 13|
| 14|
+---+

仅显示前10行