본문으로 건너뛰기

3.7. HDFS 관련 템플릿

3.7.1. HDFS file read (SmartCity_NiFi_Template-15)

HDFS file read (SmartCity_NiFi_Template-15)

3.7.1.1. ListHDFS, FetchHDFS processor 사용

  • Hadoop Configuration Resources 설정
  • Directory 설정
  • File Filter를 사용할 수 있음.

HDFS file read (SmartCity_NiFi_Template-15)

HDFS file read (SmartCity_NiFi_Template-15)

3.7.2. HDFS file write (SmartCity_NiFi_Template-16)

HDFS file write (SmartCity_NiFi_Template-16)

3.7.2.1. PutHDFS processor 사용

  • Hadoop Configuration Resources 설정
  • Directory 설정

HDFS file write (SmartCity_NiFi_Template-16)

3.7.3. HDFS file read + Scheduling (SmartCity_NiFi_Template-17)

HDFS file read + Scheduling (SmartCity_NiFi_Template-17)

3.7.3.1. GetHDFS 사용

  • Hadoop Configuration Resources를 설정
  • Directory 설정
  • Keep Source File을 설정 (read 후 file을 보존하려면 true로 설정해야 file이 지워지지 않음, default : false)

HDFS file read + Scheduling (SmartCity_NiFi_Template-17)

  • SCHEDULING에서 Scheduling Strategy설정 (Timer Driven, CRON Driven)
  • 8 hours 마다 실행 시 (Scheduling Strategy : CRON Driven, Run Schedule : * * /8 * ?)

HDFS file read + Scheduling (SmartCity_NiFi_Template-17)

3.7.4. HDFS file read parquet file format (SmartCity_NiFi_Template-18)

HDFS file read parquet file format (SmartCity_NiFi_Template-18)

3.7.4.1. ListHDFS, FetchParquet processor 사용

  • Hadoop Configuration Resources를 설정
  • Directory 설정
  • Record Write JSONRecordSetWrite ( parquet file은 해당 파일의 footer에 schema가 존재함, 이를 read하여 parquet file의 내용을 읽어 들일 수 있고, Record Writer를 통하여 사용하고자 하는 record의 format을 설정하여 변환하여 사용할 수 있음)

HDFS file read parquet file format (SmartCity_NiFi_Template-18)

3.7.5. HDFS file write parquet file format (SmartCity_NiFi_Template-19)

HDFS file write parquet file format (SmartCity_NiFi_Template-19)

3.7.5.1. PutParquet processor 사용

  • Hadoop Configuration Resources를 설정
  • Directory 설정
  • Record Reader 설정 (해당 내용이 JSON format이어 JsonTreeReader 사용)
  • Compression Type 설정( snappy로 설정)

HDFS file write parquet file format (SmartCity_NiFi_Template-19)

3.7.6. HDFS file write fail 시 retry (SmartCity_NiFi_Template-20)

HDFS file write fail 시 retry (SmartCity_NiFi_Template-20)

3.7.6.1. PutHDFS, RetryFlowFile processor 사용

  • Hadoop Configuration Resources를 설정
  • Directory 설정

HDFS file write fail 시 retry (SmartCity_NiFi_Template-20)

  • Maximum Retries 설정( 3회 재 시도)

HDFS file write fail 시 retry (SmartCity_NiFi_Template-20)