Pray

人肉排渣工程师,擅长排渣数据,服务器排渣


  • 首页

  • 分类

  • 归档

Flink源码解析 Flink 内存基础

发表于 2019-09-11 | 分类于 Flink

Flink抽象出的内存类型 HEAP:JVM堆内存 OFF_HEAP:非堆内存 这在Flink中被定义为一个枚举类型:MemoryType。 @Internalpublic enum MemoryType { /** * Denotes memory that is part of t ...

阅读全文 »

Flink源码解析 Flink中Task间的数据传递

发表于 2019-09-06 | 更新于 2019-09-07 | 分类于 Flink

数据传递AbstractStreamOperator$CountingOutput.collect@Override public void collect(StreamRecord<OUT> record) { numRecordsOut.inc(); outpu ...

阅读全文 »

Flink源码解析 TaskManager启动与运行Task

发表于 2019-08-28 | 更新于 2019-08-29 | 分类于 Flink

./taskmanager.sh start 实际上,调用了如下语句/usr/local/flink/flink-1.7.2/bin/flink-daemon.sh start taskexecutor --configDir /usr/local/flink/flink-1.7.2/conf 在f ...

阅读全文 »

Flink 的 Exactly Once 和 At Least Once 和 Jstorm的ACK

发表于 2019-08-10 | 更新于 2019-09-18 | 分类于 Flink

有状态与无状态 无状态:数据的计算与上一次的计算结果无关。例如map,flatMap 有状态: 数据的计算与上一次的计算结果有关,例如时间窗口内的sum,需要累加求和。 无状态计算的例子 比如:我们只是进行一个字符串拼接,输入 a,输出 a_666,输入b,输出 b_666输出的结果跟之前的状态 ...

阅读全文 »

Flink LocalAgg

发表于 2019-08-03 | 更新于 2020-03-30 | 分类于 Flink

背景参考了腾讯Oceanus和阿里Blink中minibatch的思路,针对热流进行预聚合的方式解决数据倾斜的问题。 Local Keyed Streams现实中,很多数据具有幂律分布(,幂律就是两个通俗的定律,一个是“长尾”理论,只有少数大的门户网站是很多人关注的,但是还有一个长长的尾巴,就是小网 ...

阅读全文 »

Flink 通信机制和背压处理

发表于 2019-07-28 | 更新于 2019-08-08 | 分类于 Flink

本地线程数据传递(同一个TM)以Operator FlatMap 所在线程 与 下游 Operator sum() 所在线程间的通信为例。这两个task线程共享同一个Buffer pool,通过wait()/notifyAll来同步。 Buffer和Netty中的ByteBuf功能类似,可以看作是 ...

阅读全文 »

Flink源码解析 资源申请

发表于 2019-07-27 | 分类于 Flink

申请资源申请资源就得从ejv.allocateResourcesForAll 即 ExecutionJobVertex的allocateResourcesForAll 方法说起。这个方法先遍历了每个ExecutionJobVertex中的所有的task,为每一个task申请一个slot。Execut ...

阅读全文 »

Flink 使用调优(二)

发表于 2019-07-27 | 更新于 2019-08-08 | 分类于 Flink

这次调优的场景是处于批处理和yarn模式。 背景获取位于hdfs的两个数据的多份文件,数据是按照5分钟或者一小时归档成一个文件夹。并且每个文件夹内部有多个文件,分析一天的数据,又碎又散。 两份数据需要先union后再join。 调优taskmanager.network.memory数据需要继续un ...

阅读全文 »

Flink源码解析 CLI提交job到JobManger到TaskMnager运行job

发表于 2019-07-20 | 更新于 2019-08-04 | 分类于 Flink

CLI提交Job启动Job./bin/flink run examples/streaming/SocketWindowWordCount.jar 跟踪Flink的脚本代码就会发现,最终会执行以下命令:exec $JAVA_RUN $JVM_ARGS "${log_setting ...

阅读全文 »

Kafka消息格式的演变

发表于 2019-07-10 | 分类于 Kafka

copy byhttps://mp.weixin.qq.com/s?__biz=MzU0MzQ5MDA0Mw==&mid=2247483983&idx=1&sn=1c2bd11df195f84e5433512f6b2695e8&chksm=fb0be8dbcc7c61 ...

阅读全文 »
1…91011…15
笑笑

笑笑

142 日志
15 分类
© 2021 笑笑
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Pisces v7.0.1
|