日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
Flink SQL 知其所以然:SQL 數(shù)據(jù)類型大全!

SQL 數(shù)據(jù)類型

在介紹完一些基本概念之后,我們來(lái)認(rèn)識(shí)一下,F(xiàn)link SQL 中的數(shù)據(jù)類型。

Flink SQL 內(nèi)置了很多常見的數(shù)據(jù)類型,并且也為用戶提供了自定義數(shù)據(jù)類型的能力。

總共包含 3 部分:

  • 原子數(shù)據(jù)類型。
  • 復(fù)合數(shù)據(jù)類型。
  • 用戶自定義數(shù)據(jù)類型。

一、原子數(shù)據(jù)類型

1、字符串類型:

  • CHAR、CHAR(n):定長(zhǎng)字符串,就和 Java 中的 Char 一樣,n 代表字符的定長(zhǎng),取值范圍 [1, 2,147,483,647]。如果不指定 n,則默認(rèn)為 1。
  • VARCHAR、VARCHAR(n)、STRING:可變長(zhǎng)字符串,就和 Java 中的 String 一樣,n 代表字符的最大長(zhǎng)度,取值范圍 [1, 2,147,483,647]。如果不指定 n,則默認(rèn)為 1。STRING 等同于 VARCHAR(2147483647)。

2、二進(jìn)制字符串類型:

  • BINARY、BINARY(n):定長(zhǎng)二進(jìn)制字符串,n 代表定長(zhǎng),取值范圍 [1, 2,147,483,647]。如果不指定 n,則默認(rèn)為 1。
  • VARBINARY、VARBINARY(n)、BYTES:可變長(zhǎng)二進(jìn)制字符串,n 代表字符的最大長(zhǎng)度,取值范圍 [1, 2,147,483,647]。如果不指定 n,則默認(rèn)為 1。BYTES 等同于 VARBINARY(2147483647)。

3、 精確數(shù)值類型:

  • DECIMAL、DECIMAL(p)、DECIMAL(p, s)、DEC、DEC(p)、DEC(p, s)、NUMERIC、NUMERIC(p)、NUMERIC(p, s):固定長(zhǎng)度和精度的數(shù)值類型,就和 Java 中的 BigDecima一樣,p 代表數(shù)值位數(shù)(長(zhǎng)度),取值范圍 [1, 38];s 代表小數(shù)點(diǎn)后的位數(shù)(精度),取值范圍 [0, p]。如果不指定,p 默認(rèn)為 10,s 默認(rèn)為 0。
  • TINYINT:-128 到 127 的 1 字節(jié)大小的有符號(hào)整數(shù),就和 Java 中的 byte 一樣。
  • SMALLINT:-32,768 to 32,767 的 2 字節(jié)大小的有符號(hào)整數(shù),就和 Java 中的 short 一樣。
  • INT、INTEGER:-2,147,483,648 to 2,147,483,647 的 4 字節(jié)大小的有符號(hào)整數(shù),就和 Java 中的 int 一樣。
  • BIGINT:-9,223,372,036,854,775,808 to 9,223,372,036,854,775,807 的 8 字節(jié)大小的有符號(hào)整數(shù),就和 Java 中的 long 一樣。

4、有損精度數(shù)值類型:

  • FLOAT:4 字節(jié)大小的單精度浮點(diǎn)數(shù)值,就和 Java 中的 float 一樣。
  • DOUBLE、DOUBLE PRECISION:8 字節(jié)大小的雙精度浮點(diǎn)數(shù)值,就和 Java 中的 double 一樣。
  • 關(guān)于 FLOAT 和 DOUBLE 的區(qū)別可見 https://www.runoob.com/w3cnote/float-and-double-different.html。

5、布爾類型:BOOLEAN。

6、NULL 類型:NULL。

7、Raw 類型:RAW('class', 'snapshot') 。只會(huì)在數(shù)據(jù)發(fā)生網(wǎng)絡(luò)傳輸時(shí)進(jìn)行序列化,反序列化操作,可以保留其原始數(shù)據(jù)。以 Java 舉例,class 參數(shù)代表具體對(duì)應(yīng)的 Java 類型,snapshot 代表類型在發(fā)生網(wǎng)絡(luò)傳輸時(shí)的序列化器。

8、日期、時(shí)間類型:

  • DATE:由 年-月-日 組成的 不帶時(shí)區(qū)含義 的日期類型,取值范圍 [0000-01-01, 9999-12-31]
  • TIME、TIME(p):由 小時(shí):分鐘:秒[.小數(shù)秒] 組成的 不帶時(shí)區(qū)含義 的的時(shí)間的數(shù)據(jù)類型,精度高達(dá)納秒,取值范圍 [00:00:00.000000000到23:59:59.9999999]。其中 p 代表小數(shù)秒的位數(shù),取值范圍 [0, 9],如果不指定 p,默認(rèn)為 0。
  • TIMESTAMP、TIMESTAMP(p)、TIMESTAMP WITHOUT TIME ZONE、TIMESTAMP(p) WITHOUT TIME ZONE:由 年-月-日 小時(shí):分鐘:秒[.小數(shù)秒] 組成的 不帶時(shí)區(qū)含義 的時(shí)間類型,取值范圍 [0000-01-01 00:00:00.000000000, 9999-12-31 23:59:59.999999999]。其中 p 代表小數(shù)秒的位數(shù),取值范圍 [0, 9],如果不指定 p,默認(rèn)為 6。
  • TIMESTAMP WITH TIME ZONE、TIMESTAMP(p) WITH TIME ZONE:由 年-月-日 小時(shí):分鐘:秒[.小數(shù)秒] 時(shí)區(qū) 組成的 帶時(shí)區(qū)含義 的時(shí)間類型,取值范圍 [0000-01-01 00:00:00.000000000 +14:59, 9999-12-31 23:59:59.999999999 -14:59]。其中 p 代表小數(shù)秒的位數(shù),取值范圍 [0, 9],如果不指定 p,默認(rèn)為 6。
  • TIMESTAMP_LTZ、TIMESTAMP_LTZ(p):由 年-月-日 小時(shí):分鐘:秒[.小數(shù)秒] 時(shí)區(qū) 組成的 帶時(shí)區(qū)含義 的時(shí)間類型,取值范圍 [0000-01-01 00:00:00.000000000 +14:59, 9999-12-31 23:59:59.999999999 -14:59]。其中 p 代表小數(shù)秒的位數(shù),取值范圍 [0, 9],如果不指定 p,默認(rèn)為 6。
  • TIMESTAMP_LTZ 與 TIMESTAMP WITH TIME ZONE 的區(qū)別在于:TIMESTAMP WITH TIME ZONE 的時(shí)區(qū)信息是攜帶在數(shù)據(jù)中的,舉例:其輸入數(shù)據(jù)應(yīng)該是 2022-01-01 00:00:00.000000000 +08:00;TIMESTAMP_LTZ 的時(shí)區(qū)信息不是攜帶在數(shù)據(jù)中的,而是由 Flink SQL 任務(wù)的全局配置決定的,我們可以由 table.local-time-zone 參數(shù)來(lái)設(shè)置時(shí)區(qū)。
  • INTERVAL YEAR TO MONTH、 INTERVAL DAY TO SECOND:interval 的涉及到的種類比較多。INTERVAL 主要是用于給 TIMESTAMP、TIMESTAMP_LTZ 添加偏移量的。舉例,比如給 TIMESTAMP 加、減幾天、幾個(gè)月、幾年。INTERVAL 子句總共涉及到的語(yǔ)法種類如下 Flink SQL 案例所示。
CREATE TABLE sink_table (
result_interval_year TIMESTAMP(3),
result_interval_year_p TIMESTAMP(3),
result_interval_year_p_to_month TIMESTAMP(3),
result_interval_month TIMESTAMP(3),
result_interval_day TIMESTAMP(3),
result_interval_day_p1 TIMESTAMP(3),
result_interval_day_p1_to_hour TIMESTAMP(3),
result_interval_day_p1_to_minute TIMESTAMP(3),
result_interval_day_p1_to_second_p2 TIMESTAMP(3),
result_interval_hour TIMESTAMP(3),
result_interval_hour_to_minute TIMESTAMP(3),
result_interval_hour_to_second TIMESTAMP(3),
result_interval_minute TIMESTAMP(3),
result_interval_minute_to_second_p2 TIMESTAMP(3),
result_interval_second TIMESTAMP(3),
result_interval_second_p2 TIMESTAMP(3)
) WITH (
'connector' = 'print'
);
INSERT INTO sink_table
SELECT
-- Flink SQL 支持的所有 INTERVAL 子句如下,總體可以分為 `年-月`、`日-小時(shí)-秒` 兩種

-- 1. 年-月。取值范圍為 [-9999-11, +9999-11],其中 p 是指有效位數(shù),取值范圍 [1, 4],默認(rèn)值為 2。比如如果值為 1000,但是 p = 2,則會(huì)直接報(bào)錯(cuò)。
-- INTERVAL YEAR
f1 + INTERVAL '10' YEAR as result_interval_year
-- INTERVAL YEAR(p)
, f1 + INTERVAL '100' YEAR(3) as result_interval_year_p
-- INTERVAL YEAR(p) TO MONTH
, f1 + INTERVAL '10-03' YEAR(3) TO MONTH as result_interval_year_p_to_month
-- INTERVAL MONTH
, f1 + INTERVAL '13' MONTH as result_interval_month

-- 2. 日-小時(shí)-秒。取值范圍為 [-999999 23:59:59.999999999, +999999 23:59:59.999999999],其中 p1\p2 都是有效位數(shù),p1 取值范圍 [1, 6],默認(rèn)值為 2;p2 取值范圍 [0, 9],默認(rèn)值為 6
-- INTERVAL DAY
, f1 + INTERVAL '10' DAY as result_interval_day
-- INTERVAL DAY(p1)
, f1 + INTERVAL '100' DAY(3) as result_interval_day_p1
-- INTERVAL DAY(p1) TO HOUR
, f1 + INTERVAL '10 03' DAY(3) TO HOUR as result_interval_day_p1_to_hour
-- INTERVAL DAY(p1) TO MINUTE
, f1 + INTERVAL '10 03:12' DAY(3) TO MINUTE as result_interval_day_p1_to_minute
-- INTERVAL DAY(p1) TO SECOND(p2)
, f1 + INTERVAL '10 00:00:00.004' DAY TO SECOND(3) as result_interval_day_p1_to_second_p2
-- INTERVAL HOUR
, f1 + INTERVAL '10' HOUR as result_interval_hour
-- INTERVAL HOUR TO MINUTE
, f1 + INTERVAL '10:03' HOUR TO MINUTE as result_interval_hour_to_minute
-- INTERVAL HOUR TO SECOND(p2)
, f1 + INTERVAL '00:00:00.004' HOUR TO SECOND(3) as result_interval_hour_to_second
-- INTERVAL MINUTE
, f1 + INTERVAL '10' MINUTE as result_interval_minute
-- INTERVAL MINUTE TO SECOND(p2)
, f1 + INTERVAL '05:05.006' MINUTE TO SECOND(3) as result_interval_minute_to_second_p2
-- INTERVAL SECOND
, f1 + INTERVAL '3' SECOND as result_interval_second
-- INTERVAL SECOND(p2)
, f1 + INTERVAL '300' SECOND(3) as result_interval_second_p2
FROM (SELECT TO_TIMESTAMP_LTZ(1640966476500, 3) as f1)

二、復(fù)合數(shù)據(jù)類型

  1. 數(shù)組類型:ARRAY、t ARRAY。數(shù)組最大長(zhǎng)度為 2,147,483,647。t 代表數(shù)組內(nèi)的數(shù)據(jù)類型。舉例 ARRAY、ARRAY,其等同于 INT ARRAY、STRING ARRAY。
  2. Map 類型:MAP。Map 類型就和 Java 中的 Map 類型一樣,key 是沒有重復(fù)的。舉例 Map、Map。
  3. 集合類型:MULTISET、t MULTISET。就和 Java 中的 List 類型,一樣,運(yùn)行重復(fù)的數(shù)據(jù)。舉例 MULTISET,其等同于 INT MULTISET。
  4. 對(duì)象類型:ROW、ROW、ROW(n0 t0, n1 t1, ...>、ROW(n0 t0 'd0', n1 t1 'd1', ...)。就和 Java 中的自定義對(duì)象一樣。舉例:ROW(myField INT, myOtherField BOOLEAN),其等同于 ROW。

三、用戶自定義數(shù)據(jù)類型

用戶自定義類型就是運(yùn)行用戶使用 Java 等語(yǔ)言自定義一個(gè)數(shù)據(jù)類型出來(lái)。但是目前數(shù)據(jù)類型不支持使用 CREATE TABLE 的 DDL 進(jìn)行定義,只支持作為函數(shù)的輸入輸出參數(shù)。如下案例:

第一步,自定義數(shù)據(jù)類型

public class User {
// 1. 基礎(chǔ)類型,F(xiàn)link 可以通過(guò)反射類型信息自動(dòng)把數(shù)據(jù)類型獲取到
// 關(guān)于 SQL 類型和 Java 類型之間的映射見:https://nightlies.apache.org/flink/flink-docs-release-1.13/docs/dev/table/types/#data-type-extraction
public int age;
public String name;
// 2. 復(fù)雜類型,用戶可以通過(guò) @DataTypeHint("DECIMAL(10, 2)") 注解標(biāo)注此字段的數(shù)據(jù)類型
public @DataTypeHint("DECIMAL(10, 2)") BigDecimal totalBalance;
}

第二步,在 UDF 中使用此數(shù)據(jù)類型

public class UserScalarFunction extends ScalarFunction {
// 1. 自定義數(shù)據(jù)類型作為輸出參數(shù)
public User eval(long i) {
if (i > 0 && i <= 5) {
User u = new User();
u.age = (int) i;
u.name = "name1";
u.totalBalance = new BigDecimal(1.1d);
return u;
} else {
User u = new User();
u.age = (int) i;
u.name = "name2";
u.totalBalance = new BigDecimal(2.2d);
return u;
}
}
// 2. 自定義數(shù)據(jù)類型作為輸入?yún)?shù)
public String eval(User i) {
if (i.age > 0 && i.age <= 5) {
User u = new User();
u.age = 1;
u.name = "name1";
u.totalBalance = new BigDecimal(1.1d);
return u.name;
} else {
User u = new User();
u.age = 2;
u.name = "name2";
u.totalBalance = new BigDecimal(2.2d);
return u.name;
}
}
}

第三步,在 Flink SQL 中使用

-- 1. 創(chuàng)建 UDF
CREATE FUNCTION user_scalar_func AS 'flink.examples.sql._12_data_type._02_user_defined.UserScalarFunction';
-- 2. 創(chuàng)建數(shù)據(jù)源表
CREATE TABLE source_table (
user_id BIGINT NOT NULL COMMENT '用戶 id'
) WITH (
'connector' = 'datagen',
'rows-per-second' = '1',
'fields.user_id.min' = '1',
'fields.user_id.max' = '10'
);

-- 3. 創(chuàng)建數(shù)據(jù)匯表
CREATE TABLE sink_table (
result_row_1 ROW,
result_row_2 STRING
) WITH (
'connector' = 'print'
);
-- 4. SQL 查詢語(yǔ)句
INSERT INTO sink_table
select
-- 4.a. 用戶自定義類型作為輸出
user_scalar_func(user_id) as result_row_1,
-- 4.b. 用戶自定義類型作為輸出及輸入
user_scalar_func(user_scalar_func(user_id)) as result_row_2
from source_table;
-- 5. 查詢結(jié)果
+I[+I[9, name2, 2.20], name2]
+I[+I[1, name1, 1.10], name1]
+I[+I[5, name1, 1.10], name1]

當(dāng)前標(biāo)題:Flink SQL 知其所以然:SQL 數(shù)據(jù)類型大全!
文章轉(zhuǎn)載:http://www.dlmjj.cn/article/cdphgoo.html