创建CSV源表
Blink可以将CSV格式文件作为源表读入,进行计算,CSV需要定义的DDL如下:
create table csv_source(
id varchar,
name varchar
) with (
type ='csv',
path = 'hdfs://hdfsroot/csvpath/test.csv',
...
);
WITH参数
通用配置:
参数 |
注释说明 |
备注 |
path |
文件路径 |
文件路径可以是oss/hdfs |
fieldDelim |
列分隔符 |
默认为’,’,支持Java风格的字符串转义 |
lineDelim |
行分隔符 |
默认为’\n’,支持Java风格的字符串转义 |
charset |
字符集 |
默认为UTF-8 |
emptyColumnAsNull |
空列不全 |
是否将空列补为null |
timezone |
时区 |
默认时区UTC |
firstLineAsHeader |
是否将第一行作为列名 |
默认false |
quoteCharacter |
csv里面如果string的field里包含列分隔符,可以用这个quote character包起来 |
例如:1,”1,2”,3,quotaCharacter为’”‘ |