이 페이지에서
3.7. HDFS 관련 템플릿 3.7.1. HDFS file read (SmartCity_NiFi_Template-15)
3.7.1.1. ListHDFS, FetchHDFS processor 사용 Hadoop Configuration Resources 설정 Directory 설정 File Filter를 사용할 수 있음.
3.7.2. HDFS file write (SmartCity_NiFi_Template-16)
3.7.2.1. PutHDFS processor 사용 Hadoop Configuration Resources 설정 Directory 설정
3.7.3. HDFS file read + Scheduling (SmartCity_NiFi_Template-17)
3.7.3.1. GetHDFS 사용 Hadoop Configuration Resources를 설정 Directory 설정 Keep Source File을 설정 (read 후 file을 보존하려면 true로 설정해야 file이 지워지지 않음, default : false)
SCHEDULING에서 Scheduling Strategy설정 (Timer Driven, CRON Driven) 8 hours 마다 실행 시 (Scheduling Strategy : CRON Driven, Run Schedule : * * /8 * ?)
3.7.4.1. ListHDFS, FetchParquet processor 사용 Hadoop Configuration Resources를 설정 Directory 설정 Record Write JSONRecordSetWrite ( parquet file은 해당 파일의 footer에 schema가 존재함, 이를 read하여 parquet file의 내용을 읽어 들일 수 있고, Record Writer를 통하여 사용하고자 하는 record의 format을 설정하여 변환하여 사용할 수 있음)
3.7.5.1. PutParquet processor 사용 Hadoop Configuration Resources를 설정 Directory 설정 Record Reader 설정 (해당 내용이 JSON format이어 JsonTreeReader 사용) Compression Type 설정( snappy로 설정)
3.7.6. HDFS file write fail 시 retry (SmartCity_NiFi_Template-20) HDFS에 파일을 저장시 Error가 발생했을 시 retry를 통해 재 시도하여 HDFS에 file을 write 템플릿 다운로드 (링크)
3.7.6.1. PutHDFS, RetryFlowFile processor 사용 Hadoop Configuration Resources를 설정 Directory 설정
Maximum Retries 설정( 3회 재 시도)