NiFi入门案例二
需求:随机生成一些测试数据集,对生成的数据进行正则匹配,对匹配后的数据进行输出到外部文件中。以上需要用到的“GenerateFlowFile”、“ReplaceText”、“PutFile”处理器。
一、配置“GenerateFlowFile”处理器
这个处理器可以生成随机的FlowFile数据或者生成自定义内容的FlowFile。多用于负载测试和模拟生成数据测试。
1、拖拽“Processor”在弹框中输入“GenerateFlowFile”
2、配置“GenerateFlowFile”生成FlowFile
打开“GenerateFlowFile”配置,找到“PROPERTIES”选项进行配置:
关于“GenerateFileFile”的“PROPERTIES”配置选项解释如下:
配置项 | 默认值 | 允许值 | 描述 | File Size
(文件大小)0 B生成每个FlowFile文件的大小。Batch Size
(批次大小)1每次生成几个FlowFile。Data Format
(数据格式)TextBinary
Text指定生成的数据是文本还是二进制文件。Unique FlowFiles(唯一FlowFile)falsetrue
false如果为true,每次生成的FlowFile独一无二,如果为false,每个FlowFile随机内容相同,吞吐量大。Custom Text
(自定义文本)自定义生成文本内容。需要将“Data Format”设置为Text并且将“Unique FlowFiles”设置为false,这时生成的文件大小不定,将忽略设置的“File Size”Character Set
(字符编码)UTF-8指定生成FlowFile的编码。Mime Type
(mime.type值)设置自带属性“mime.type”的Value值。