且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

将自定义函数应用于PySpark中数据框的选定列的单元格

更新时间:2022-12-11 17:25:35

您必须在spark中使用udf(用户定义函数)

You have to use udf (user defined function) in spark

from pyspark.sql.functions import udf
example_udf = udf(example, LongType())
df.withColumn('result', example_udf(df.address1, df.address2))