且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

PySpark-获取组中每一行的行号

更新时间:2023-02-05 09:42:31

使用窗口功能:

from pyspark.sql.window import *
from pyspark.sql.functions import row_number

df.withColumn("row_num", row_number().over(Window.partitionBy("Group").orderBy("Date")))