Apache Flink 1.9.0 发布，开源流处理框架_业界资讯

时间：2019-08-24

阅读：

Apache Flink 1.9.0 已经发布，Apache Flink 项目的目标是开发一个流处理系统，以统一和支持多种形式的实时和离线数据处理应用程序以及事件驱动的应用程序。

此版本包括批处理作业的批处理式恢复，以及新的基于闪烁的表 API 和 SQL 查询引擎的预览，还有状态处理器 API 的可用性，它是最常见的请求特性之一，允许用户使用 Flink DataSet 作业读写保存点。最后，包括一个重新设计的 WebUI 和 Flink 新的 Python Table API 的预览以及它与 Apache Hive 生态系统的集成。

TableAPI & SQL

将 Table 模块进行拆分（FLIP-32，FLIP 即 Flink Improvement Proposals，专门记录一些对Flink 做较大修改的提议），对 Java 和 Scala 的 API 进行依赖梳理，并且提出了 Planner 接口以支持多种不同的 Planner 实现。Planner 将负责具体的优化和将 Table 作业翻译成执行图的工作，我们可以将原来的实现全部挪至 Flink Planner 中，然后把对接新架构的代码放在 Blink Planner 里。

不仅让 Table 模块在经过拆分后更加清晰，更重要的是不影响老版本用户的体验。在 1.9 版本中，已经 merge 了大部分当初从 Blink 开源出来的 SQL 功能。

除了架构升级之外，Table 模块在 1.9 版本还做了几个相对比较大的重构和新功能，包括：

FLIP-37：重构 Table API 类型系统
FLIP-29：Table 增加面向多行多列操作的 API
FLINK-10232：初步的 SQL DDL 支持
FLIP-30：全新的统一的 Catalog API
FLIP-38：Table API 增加 Python 版本

批处理改进

Flink的批处理功能在 1.9 版本有了重大进步，首当其冲的是优化批处理的错误恢复代价：FLIP-1（Fine GrAIned Recovery from Task Failures），从这个 FLIP 的编号就可以看出，该优化其实很早就已经提出，1.9 版本终于有机会将 FLIP-1 中未完成的功能进行了收尾。

在新版本中，如果批处理作业有错误发生，那么 Flink 首先会去计算这个错误的影响范围，即 Failover Region。因为在批处理作业中，有些节点之间可以通过网络进行Pipeline 的数据传输，但其他一些节点可以通过 Blocking 的方式先把输出数据存下来，然后下游再去读取存储的数据的方式进行数据传输。

如果算子输出的数据已经完整的进行了保存，那么就没有必要把这个算子拉起重跑，这样一来就可以把错误恢复控制在一个相对较小的范围里。

如果作业极端一点，在每一个需要Shuffle 的地方都进行数据落盘，那么就和 MapReduce 以及 Spark 的行为类似了。只是 Flink 支持更高级的用法，你可以自行控制每种 Shuffle 是使用网络来直连，还是通过文件落盘来进行。

流处理改进

这个版本增加了一个非常实用的功能，即 FLIP-43（State Processor API）。Flink 的 State 数据的访问，以及由 State 数据组成的 Savepoint 的访问一直是社区用户呼声比较高的一个功能。

这次的 State Processor API 则提供了更加灵活的访问手段，也能够让用户完成一些比较黑科技的功能：

用户可以使用这个 API 事先从其他外部系统读取数据，把它们转存为 Flink Savepoint 的格式，然后让 Flink 作业从这个 Savepoint 启动。这样一来，就能避免很多冷启动的问题。
使用 Flink 的批处理 API 直接分析State 的数据。State 数据一直以来对用户是个黑盒，这里面存储的数据是对是错，是否有异常，用户都无从而知。有了这个 API 之后，用户就可以像分析其他数据一样，来对 State 数据进行分析。
脏数据订正。假如有一条脏数据污染了你的 State，用户还可以使用这个 API 对这样的问题进行修复和订正。
状态迁移。当用户修改了作业逻辑，想复用大部分原来作业的 State，但又希望做一些微调。那么就可以使用这个 API 来完成相应的工作。

Hive 集成

在 1.9 版本中，通过 FLIP-30 提出的统一的 Catalog API 的帮助，目前 Flink 已经完整打通了对 Hive Meta Store 的访问。同时，也增加了 Hive 的 Connector，目前已支持 CSV, Sequence File, Orc, Parquet 等格式。用户只需要配置 HMS 的访问方式，就可以使用 Flink 直接读取 Hive 的表进行操作。在此基础之上，Flink 还增加了对 Hive 自定义函数的兼容，像 UDF， UDTF和 UDAF，都可以直接运行在Flink SQL里。

Flink WebUI 修改

组件使用了最新的稳定版本的 Angular。

发布说明

苹果Mac产品行销副总裁Tom Boger和平台架构副总裁Tim Millet在接受采访时，分享了其自研芯片Apple Silicon成功的秘诀。Millet指出，竞争对手的芯片制造商“无法直接采用第

2024-11-18 10:05:47

据报道，英伟达新款Blackwell AI芯片已经面临延迟，并且伴随着配套服务器出现的过热难题，这一连串的挑战引发了用户对于新数据中心能否如期启动并顺利运行的深切忧虑。据内部消息

2024-11-18 10:05:25

Mark Gurman爆料，苹果将在明年推出AirTag 2，爆料称全新的AirTag 2将升级芯片，并改进了位置跟踪功能，能在更远的距离内响应。Mark Gurman还透露，这款设备的代号是B589，它内置的扬声

2024-11-18 10:05:02

NVIDIA Blackwell架构的新一代服务器正在批量出货，而在OCP Summit 2024峰会上，官方进行了公开展示，而且是直接将芯片裸露在外，随便看。这台服务器一共配备了八颗B200芯片，4NP工艺

2024-11-17 23:04:05

Intel锐炫独立显卡会在下个月有一场好戏，但细节不详，现在又有了更进一步的消息。有曝料者贴出了一张预告海报，上边写着Intel锐炫、Battlemage SoC、2024年12月等字样，再次证实In

2024-11-17 21:23:54

技嘉发布了一款新的专业显卡Radeon PRO W7800 AI TOP 48G，一如其名拥有多达48GB显存，比之前的32GB版本增加了一半，可以更好地用于AI大模型训练。AMD去年4月发布了首批两款基于R

2024-11-17 21:23:28

据媒体报道，近日全球范围内的苹果用户报告称，他们收到了多年前参与以旧换新计划的iPhone所购买的AppleCare+服务费退款。这些退款涵盖了从iPhone 11 Pro到iPhone 14 Pro的多种

2024-11-17 21:23:09

随着iPhone、Mac等产品逐渐成熟，苹果也在积极尝试不同领域，据媒体报道，苹果正探索三个主要方向来推出新产品。方向一：AirPods转型分析师郭明錤预测，未来的AirPods Pro 3可能会加

2024-11-17 16:03:46

据媒体报道，谷歌的AI聊天机器人Gemini近日又引起了争议。一名密歇根州的研究生在使用该机器人辅助作业时，突然向用户发送了“请去死”的恶意信息。Gemini回复道：&ldq

2024-11-17 16:03:26

在近日的一次采访中，Intel技术传播经理Florian Maislinger证实，Intel正在开发具有大缓存产品。但这些产品将主要针对数据中心市场，而非主流的消费级市场，因为与服务器市场相比，游

2024-11-17 16:03:09

为庆祝经典游戏《半条命2》正式发行20周年，V社宣布在北京时间11月19日凌晨2点之前，用户可以在Steam平台上免费获取这款游戏。这款游戏在国区原价为42元，整体评价为好评如潮。而

2024-11-17 16:02:34

显示专家Ross Young在社交平台上表示，最新的M4 MacBook Pro使用量子点（QD）薄膜，而不是红色KSF荧光粉薄膜。过去苹果通常采用KSF解决方案，因为它的成本低，而且不含镉，但最新的无镉QD

2024-11-17 10:30:19

一名女生在社交平台上称，她11月6日买的iPhone 16，在看综艺的时候突然自燃，目前已经联系商家及平台，但都没有回应。该女生表示，她没有使用磁吸充电器充电，没有边充电边看手机，我就是

2024-11-17 10:29:56

作为全球用户最多的操作系统，相信很多玩家从开始用电脑的那一天起，就一直在和Windows打交道。随着技术一天天地进步，Windows系统也在不停的更新，三年前微软推出了最新Windows 11

2024-11-16 21:15:09

《剑星》女主eva的原装紧身衣显然已经不能满足众多COSER的二创热情了，最近来自俄罗斯的符文姐姐Alin Ma就带来了全新版本的eva COS。镂空服装黑丝吊带，把该遮住的地方完美展现

2024-11-16 21:14:41

游戏盗号是令玩家非常崩溃的事，尤其腾讯游戏一般还是用QQ、微信登陆，一旦被盗号还会引发社交、财产安全问题。前些天就有一位用户向腾讯反馈，称自己的账号因为借给了游戏内认识

2024-11-16 21:14:13

字节跳动视频生成模型PixelDance和Seaweed在即梦AI正式上线，面向公众免费开放使用。用户进入即梦AI的“视频生成”界面，在视频模型里选择“视频P2.0 Pro&rdquo

2024-11-15 23:46:40

RTX 40全系标配了新一代12VHPWR 16针供电接口，但因为缺陷而在RTX 4090上出现了多次烧毁事件，后续悄悄升级了新版12V-2x6，那么下一代呢？海盗船在谈论未来电源的时候意外确认，下一

2024-11-15 23:44:32

近日，一位Reddit网友称自己的锐龙7 9800X3D被烧毁了，连带微星MAG X870 TOMAHAWK WIFI主板插座也被烧毁，引发广泛关注和议论。今天，微星发布了一则简短的官方声明，表示正在与AMD密

2024-11-15 23:44:07

近日游戏博主tfAIart分享了《最终幻想7》多角色3D美图。据悉，这些图片是他用AI生成制作的。但即便是AI图，这些角色也很性感魅惑，让人心动不已。一起来欣赏下吧！&zwnj;《最终幻想

2024-11-15 23:43:42

AMD官方博客撰文，详细对比了两家当红轻薄本笔记本处理器的性能，一方是锐龙AI 9 HX 370(RDNA3.5架构的Radeon 890M)，一方是酷睿Ultra 7 258V(Xe2-LPG架构的锐炫140V)。双方的笔

2024-11-15 23:43:21

NVIDIA Blackwell GPU相当强悍，大家都知道，但到底有多强呢？除了官方宣传数据，现在终于第一次看到了实测数据，来自MLCommons MLPerf v4.1，考察AI训练推理性能的最佳平台。对比对象

2024-11-14 21:57:47

伴随着AI投资热潮，今年以来，英伟达股价不断创下新高，累计上涨了约2倍。华尔街知名投资机构Melius Research在本周早些时候发布的一份报告中称，投资者应该继续持有英伟达，该公司的

2024-11-14 21:57:24

微星最近推出了新款GeForce RTX 3050 Ventus 2X XS White显卡，采用了全白的外观设计。据悉，该显卡整体尺寸仅为205 x 112 x 45毫米，采用双槽厚度设计，轻至570克，便于安装于各种机

2024-11-14 21:57:06

近日PlayStation中国官方介绍了《剑星》 x 《尼尔：机械纪元》DLC相机模式，该模式将于11月20日上线。现在游戏中每一刻都能转变成个人杰作。玩家可以尽情捕捉美丽的风景、热血

2024-11-14 21:56:43

Windows on ARM版本由来已久，但无论是Windows 10还是Windows 11，微软一直没有单独提供官方ISO镜像，安装的时候不是很方便。如今，微软终于在官网上提供了Windows 11 on ARM的官方

2024-11-14 21:54:28

特斯拉宣布将在美国召回2,400辆Cybertruck电动皮卡。原因是一个故障部件可能导致车辆动力损失，从而增加撞车风险。这是特斯拉今年第六次对Cybertruck进行召回。根据特斯拉提

2024-11-14 21:54:08

据媒体报道，英国消费者权益组织“Which?”代表约4000万iCloud用户向苹果提起反垄断诉讼，指控苹果违反了竞争法，并寻求30亿英镑（约合人民币276亿元）的赔偿。他们认为，苹

2024-11-14 21:53:47

TIOBE发布了最新的2024年11月的编程语言排行榜，Go语言在TIOBE指数中的排名不断上升，本月排名已经提升至第7，创下该语言的历史新高。TIOBE CEO Paul Jansen点评称，Go在前十名中独

2024-11-14 21:53:31

11月初，爱奇艺限制投屏案二审判决，二审维持了一审判决，即爱奇艺方须在老会员有效期内持续提供高清投屏，且须补偿41天黄金会员时长。今日，爱奇艺限制投屏案“朱元律师”

2024-11-14 21:53:12

Windows 环境下的修改方法：第一步：修改在php5下POST文件大小的限制1.编修php.ini找到：max_execution_time = 30，这个是每个脚本运行的最长时间，单位秒，修改为：max_execution_time =

2019-08-22 09:00:35

今天，一个朋友需要在服务器中搭建一套移动商城源码，程序提供方在安装说明中指明需要用phpStudy环境，当然是基于Windows系统的，虽然老蒋知道Linux Web环境也是可以部署的，但是鉴于

2019-08-12 17:48:00

一般我们使用的VPS主机每月都有固定的流量，如果当月额度用完服务器可能会暂停，有些是需要额外支付费用的。即便是固定带宽不限制流量的服务器，占用太大的流量也会影响网站的访

2019-08-12 15:30:16

比如你的IP地址为： 192.100.100.1，则Apache服务器的配置文件可以这样写： <VirtualHost 192.100.100.1> ServerAdmin njzadmin@sina.com DocumentRoot /wwwroot ServerName

2019-08-07 21:13:28

2.4.2版本的apache中需要在目录下面添加 Require all granted,否则无论怎么访问都是403，悲了个催的！具体报错如下:[Fri Aug 10 19:07:13.263893 2012] [authz_core:error] [pi

2019-08-07 21:11:55

Apache下301重定向代码（因为我使用的是WINDOWS 2003 + APACHE 所以本文仅限APACHE服务器使用。）新建.htaccess文件，输入下列内容（需要开启mod_rewrite）：1）将不带WWW的域名转向到带W

2019-08-07 21:10:54

1、http2.4.1以前：第一种直接拒绝访问打开 httpd.conf 文件,将一下配置追加到文件最后。<pre name="code" class="html"><pre name="code" class="html"><pre name="code

2019-08-07 21:09:59

docker如果是 exec 进入容器，修改 Apache 配置之后需要重启服务器，如果在容器内使用下面的命令，将会导致退出容器：service apache2 restart采用下面两种方式可以不退出容器而更

2019-08-07 21:09:20

注册Apache到Linux服务在Linux下用源代码方式编译安装完Apache后，启动关闭Apache可以通过如下命令实现：/usr/local/apache/bin/apachectl start | stop | restart如果想将htt

2019-08-07 21:08:32

Apache服务器网站在安装完SSL证书后，如果想实现输入域名自动跳转到https，则需要用到.htaccess来重写url。因为我的服务器是Linux主机所以下面提供的是Linux系统的方法。在网

2019-08-07 21:07:51

2018-09-24

2019-02-01

2019-09-12

2019-04-09

2020-03-30

2019-06-25

2019-04-24

2019-09-23

2019-09-21

2020-03-25

Apache Flink 1.9.0 发布，开源流处理框架

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道