请教一个 Flink SQL 的问题，解决了星巴克感谢

查看 577|回复 28

2023-6-12 17:12:43

实现过类似的需求，首先 lookup join 肯定是不行了，事实流中没有出现的用户肯定关联不到的。
比较彻底的解决方案是使用 datastream API ，process function 。还要状态编程，因为需要将维表的状态自己维护，比如把状态放到一个 tuple2 里，t0 是 customer id ，t1 给默认值 0 ，然后拿另外一个流的 element ，每来一条就给 t1+1 ，窗口触发时把所有的 tuple2 向下游发送。
需要额外考虑的一点是，有可能某个时间窗口内 1 个下单的都没有(比如半夜)，那么该窗口无法触发，没有任何输出，所以默认的滚动窗口\事件时间语义就不太行。还需要再实现一个窗口，事件时间、处理时间混合语义，保证即使没有事件仍然可以触发，输出所有用户下单数均为 0 的情况。
Flink SQL 没有实现过，但是有一个简单粗暴的想法，定时把维表的数据全量发到 flink ，构造出所有包含用户的事实流，这样你只需要改造 customers 维表那里就够了。
缺点是需要不断地读维表，对 MySQL 增加压力； source 端不断地向下游发维度信息，实际上不符合事件驱动和流式计算的原则。
我猜测这个需求数据量不大，实时性要求也没那么高，使用 spark streaming 可能是更好的选择。

David1119 2023-6-12 17:13:13

@sijue 1. 不行，需求就是监控哪些用户没有下订单（这里的场景我做了更改，实际是监控哪些 IoT 设备没有上传数据，我在主题里也 append 更新下）
2. 用户表是提前全量初始化好的，不考虑更新问题，用户表没有时间信息；订单表，理论每个用户每分钟都有数据。

kerie

2023-6-12 17:14:07

参考 9 楼的，process function 最方便，sql 做基础 etl 没问题，复杂一点的逻辑用 datastream 更灵活方便，存一下上一秒的 state ，做比较，可以判断类似连续 2 秒没数据然后报警推送，甚至连续 2s 没数据，但是 5s 内能上传上来就算正常这样的场景，随意发挥

kerie

2023-6-12 17:15:01

@t3zb2xzvjm4yvmn 我感觉看到希望了，我的数据量不大，你知道如何粗暴的每分钟把维表的数据全量发到 flink ？
用 DataStream API ，你说的额外考虑的场景暂时不用考虑，我们是 IoT 设备，理论不会出现 1 分钟全部设备没有数据的情况，后续优化再额外每分钟加一些 mock 数据，强制触发窗口。

fuyufjh 2023-6-12 17:15:49

@David1119 我再挣扎下，新手感觉 Flink SQL 更直观一些，但如果实在做不了就放弃 SQL 的方案，转 DataStream API process function 。

kerie

2023-6-12 17:16:30

这是一个典型的 micro batch 需求吧，1 分钟执行一次。用时间条件做过滤能起到很好的过滤效果，执行很快的

t3zb2xzvjm4yvmn 2023-6-12 17:17:12

@fuyufjh 大佬能讲一下用 Flink 具体怎么做吗

kerie

2023-6-12 17:17:59

@kerie Flink SQL 好像没有现成的方法，可以自定义 source table ，你研究一下吧
或者不在 Flink 里做，在外部写一个 Java/Python 程序用 JDBC 和 kafka API ，定时把数据推到 kafka ，用 Flink SQL 接 kafka 就比较方便了。

leonhao 2023-6-12 17:18:29

@t3zb2xzvjm4yvmn 我研究一下，感谢！

kerie

2023-6-12 17:19:04

Flink SQL 无法实现，需要自己写 stream api 。如果可能出现这种情况，根本不需要 Flink ，把数据写到数据库在算就行

请教一个 Flink SQL 的问题，解决了星巴克感谢

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

请教一个 Flink SQL 的问题，解决了星巴克感谢

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告