大数据NiFi(十五):NiFi入门案例二
admin
2023-10-19 07:20:35
0

NiFi入门案例二

需求:随机生成一些测试数据集,对生成的数据进行正则匹配,对匹配后的数据进行输出到外部文件中。以上需要用到的“GenerateFlowFile”、“ReplaceText”、“PutFile”处理器。

一、配置“GenerateFlowFile”处理器

这个处理器可以生成随机的FlowFile数据或者生成自定义内容的FlowFile。多用于负载测试和模拟生成数据测试。

1、拖拽“Processor”在弹框中输入“GenerateFlowFile”




2、配置“GenerateFlowFile”生成FlowFile

打开“GenerateFlowFile”配置,找到“PROPERTIES”选项进行配置:



关于“GenerateFileFile”的“PROPERTIES”配置选项解释如下:

配置项默认值允许值描述File Size

(文件大小)0 B生成每个FlowFile文件的大小。Batch Size

(批次大小)1每次生成几个FlowFile。Data Format

(数据格式)TextBinary

Text指定生成的数据是文本还是二进制文件。Unique FlowFiles(唯一FlowFile)falsetrue

false如果为true,每次生成的FlowFile独一无二,如果为false,每个FlowFile随机内容相同,吞吐量大。Custom Text

(自定义文本)自定义生成文本内容。需要将“Data Format”设置为Text并且将“Unique FlowFiles”设置为false,这时生成的文件大小不定,将忽略设置的“File Size”Character Set

(字符编码)UTF-8指定生成FlowFile的编码。Mime Type

(mime.type值)设置自带属性“mime.type”的Value值。

相关内容