Spark Streaming 迁移到Flink的效果小结小米的业务从Spark Streaming迁移到Flink的过程,比如数据处理的延迟、资源使用的变化、作业的稳定性等。 对于无状态作业,数据处理的延迟由之前Spark Streaming的16129ms降低到Flink的926ms,有94. ...
Kubernetes 、Docker环境搭建
Version compont version docker 19.03.8 kubernetes 1.17.4 安装docker卸载旧版本 # 在 master 节点和 worker 节点都要执行yum remove -y docker \docker-client \doc ...
Flink运行时之网络通信分析
NetworkEnvironment网络环境(NetworkEnvironment)是TaskManager进行网络通信的主对象,主要用于跟踪中间结果并负责所有的数据交换。每个TaskManager的实例都包含一个网络环境对象,在TaskManager启动时创建。NetworkEnvironment ...
Flink批处理踩坑和自埋之旅
一、close导致数据变多ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment(); List<String> list = Lists.newArrayList("11"); env.setP ...
java sun.misc.Unsafe
初始化初始化的代码主要包括调用JVM本地方法registerNatives()和sun.reflect.Reflection#registerMethodsToFilter。然后新建一个Unsafe实例命名为theUnsafe,通过静态方法getUnsafe()获取,获取的时候需要做权限判断。由此可 ...
java字节序、主机字节序和网络字节序
计算机硬件有两种储存数据的方式:大端字节序(big endian)和小端字节序(little endian)。 举例来说,数值0x2211使用两个字节储存:高位字节是0x22,低位字节是0x11。 大端字节序:高位字节在前,低位字节在后,这是人类读写数值的方法。小端字节序:低位字节在前,高位字节在后 ...
Flink源码解析 序列化
TypeInformation 类是描述一切类型的公共基类,它和它的所有子类必须可序列化(Serializable),因为类型信息将会伴随 Flink 的作业提交,被传递给每个执行节点。 类型信息由 TypeInformation 类表示,TypeInformation 支持以下几种类型: Bas ...