ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【NiFi】Apache NiFi 助力数据处理及分发 [打印本页]

作者: 天津储鑫盛钢材现货供应商    时间: 2024-10-6 16:16
标题: 【NiFi】Apache NiFi 助力数据处理及分发

1.什么是 NiFi ?

简朴的说,NiFi 就是为了办理差别系统间数据自动流通题目而创建的。固然 dataflow 这个术语在各种场景都有被利用,但我们在这里利用它来表示差别系统间的自动化的可管理的信息流。自企业拥有多个系统开始,一些系统会有数据天生,一些系统要消耗数据,而差别系统之间数据的流通题目就出现了。这些题目出现的相应的办理方案已经被广泛的研究和讨论,其中企业集成 eip(Enterprise Integration Patterns) 就是一个全面且易于利用的方案。
dataflow 要面对的一些挑战包括

多年来,数据流一直是架构中不可制止的题目之一。现在有许多活跃的、快速发展的技术,使得 dataflow 对想要乐成的特定企业更加重要,比如 SOA,API,IOT,BigData。此外,合规性,隐私性和安全性所需的严酷程度也在不断提高。尽管不绝的出现这些新概念新技术,但 dataflow 面对的困难和挑战依旧,其中主要的区别还是复杂的范围,必要适应的需求变革的速率以及大规模边沿情况的普遍化。NiFi 旨在帮助办理这些现代数据流挑战。
2.NiFi 的核心概念

NiFi 的基本计划概念与基于流程的编程 FBP(Flow-based programming)的主要思想密切相干。以下是一些主要的 NiFi 概念以及它们如何映射到 FBP:
NiFi 术语FBP 术语描述FlowFileInformation PacketFlowFile 表示在系统中移动的每个对象,对于每个 FlowFile,NiFi 都会记录它一个属性键值对和 0 个或多个字节内容(FlowFile 有 attribute 和 content)FlowFile ProcessorBlack Box实际上是处理器起主要作用。在 eip 术语中,处理器就是差别系统间的数据路由,数据转换大概数据中介的组合。处理器可以访问给定 FlowFile 的属性及其内容。处理器可以对给定工作单元中的零或多个流文件进行操作,并提交该工作或回滚该工作ConnectionBounded BufferConnections 用来连接处理器。它们充当队列并允许各种历程以差别的速率进行交互。这些队列可以动态地对进行优先级排序,并且可以在负载上设置上限,从而启用背压Flow ControllerScheduler流控制器维护流程如何连接,并管理和分配所有流程利用的线程。流控制器充当代理,促进处理器之间流文件的互换Process GroupSubnet历程组里是一组特定的流程和连接,可以通过输入端口吸收数据并通过输出端口发送数据,如许我们在历程组里简朴地组合组件,就可以得到一个全新功能的组件(Process Group) 此计划模子也类似于 SEDA,带来了许多好处,有助于 NiFi 成为非常有效的、构建功能强盛且可扩展的数据流的平台。其中一些好处包括:

3.NiFi 的架构


NiFi 在操作系统上的 JVM 内实行。JVM 上 NiFi 的主要组件如下:

NiFi 也能够在集群内运行。

从 NiFi 1.0 版本开始,NiFi 集群采用了 Zero-Master Clustering 模式。NiFi 集群中的每个节点对数据实行雷同的任务,但每个节点都在差别的数据集上运行。Apache ZooKeeper 选择单个节点作为集群和谐器,ZooKeeper 自动处理故障转移。所有集群节点都会向集群和谐器发送心跳报告和状态信息。集群和谐器负责断开和连接节点。此外,每个集群都有一个主节点,主节点也是由 ZooKeeper 选举产生。我们可以通过任何节点的用户界面与 NiFi 集群进行交互,并且我们所做的任何更改都将复制到集群中的所有节点上。
4.NiFi 的性能预期和特点

NiFi 的计划目标是充实利用其运行的底层主机系统的能力。这种资源的最大化在 CPU 和磁盘方面尤其明显。

5.NiFi 关键特性的高级概览



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4