Apache Flink

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用JavaScala编写的分布式流数据流引擎。[1][2]Flink以数据并行流水线方式执行任意流数据程序[3],Flink的流水线运行时系统可以执行批处理和流处理程序。[4][5]此外,Flink的运行时本身也支持迭代算法的执行。[6]

Flink提供高吞吐量、低延迟的流数据引擎[7]以及对事件-时间处理和状态管理的支持。Flink应用程序在发生机器故障时具有容错能力,并且支持exactly-once语义。[8]程序可以用Java、Scala[9]Python[10]SQL[11]等语言编写,并自动编译和优化[12]到在集群或云环境中运行的数据流程序。[13]

Flink并不提供自己的数据存储系统,但为Amazon Kinesis、Apache KafkaHDFSApache Cassandra和ElasticSearch等系统提供了数据源和接收器。

Last updated