본문으로 건너뛰기

6.2.3. 프로젝트 관리

프로젝트 등록/수정/삭제 및 프로젝트 별 원본데이터, 전처리데이터, 모델을 관리합니다.

6.2.3.1. 프로젝트 등록/조회/수정/삭제

프로젝트를 등록하거나, 등록된 프로젝트 목록을 조회합니다. 선택한 프로젝트를 ‘수정’ 또는 ‘삭제’ 할 수 있습니다.

6.2.3.1.1. 프로젝트 등록

‘등록’ 버튼을 클릭하여 프로젝트 등록 Modal을 띄웁니다.

02_project_list_register1

‘프로젝트 명’, ‘설명’를 입력 후 새로운 프로젝트를 등록합니다.

02_project_list_register2

No.DetailNote참조번호
1등록 버튼프로젝트 등록 Modal 띄우는 버튼1
2프로젝트 등록 Modal새로운 프로젝트 등록을 위한 Modal2
3프로젝트 정보 입력새로운 ‘프로젝트 명’, ‘설명’ 입력3
4프로젝트 등록새로운 프로젝트 등록4

6.2.3.1.2. 프로젝트 조회/수정

‘프로젝트 관리’ 화면에서 프로젝트의 이름, 생성일 등을 확인할 수 있습니다.

‘프로젝트 이름’을 클릭하여 프로젝트 상세로 이동할 수 있으며, 체크박스로 선택 후에 ‘삭제’ 버튼을 눌러 특정 프로젝트를 삭제할 수 있습니다.

02_project_list_modify1 02_project_list_modify2

No.DetailNote참조번호
1프로젝트 목록모든 사용자가 생성한 프로젝트 전체 목록1
2프로젝트 선택특정 프로젝트 선택 박스2
3프로젝트 삭제선택 프로젝트 삭제 버튼3
4프로젝트 수정선택 프로젝트 수정 Modal 띄우는 버튼4
5프로젝트 수정 Modal선택 프로젝트 수정 Modal5
6프로젝트 수정 정보입력수정한 프로젝트 ‘이름’, ‘설명’ 입력6
7프로젝트 수정프로젝트 수정 완료7

6.2.3.2. 프로젝트 상세

‘프로젝트 이름’을 클릭하여 프로젝트 상세로 이동하여, 생성된 프로젝트 내부에서 원본데이터, 전처리데이터, 모델에 대한 상세정보를 생성 및 관리합니다.

6.2.3.2.1. 데이터 탐색

Data lake 내에 설치되어 있는 HUE 페이지를 연결하여, Data lake 데이터를 탐색합니다.

프로젝트 상세 페이지에서 ‘Hue’를 클릭하여 데이터 탐색창으로 이동합니다.

03_data_search1

Hue 페이지에서 데이터가 저장된 테이블을 클릭하여 상세 정보를 탐색합니다.

03_data_search2

번호DetailNote참조번호
1Hue 연결데이터 탐색을 위해 Hue 페이지 이동을 위한 버튼1
2데이터 테이블조회 가능한 전체 데이터 테이블2
3Query BrowserQuery 작성 및 실행3
4Query InfoQuery History, Saved Queries, Query Result 확인4
5Table InfoQuery에 사용된 Table 정보 확인5

6.2.3.2.2. 데이터 ETL

Data lake 내에 설치되어 있는 Nifi 페이지를 연결하여, Data lake 내의 데이터 ETL 기능을 수행합니다.

프로젝트 상세 페이지에서 ‘Nifi’를 클릭하여 데이터 ETL 화면으로 이동합니다.

04_data_etl1

데이터 플로우를 기반으로 학습용 데이터, 예측용 데이터를 각각 생성합니다.

04_data_etl2

Nifi 프로세서(processor)를 확인하여 ‘Data 조회’, ‘JSON파일 변환’, ‘파일명 변경’, ‘파일 업로드 경로 설정’ 등의 프로세스를 변경/수행하도록 합니다.

04_data_etl3

번호Detail1Detail2Note참조번호
1Nifi 연결데이터 ETL을 위해 Nifi 페이지 이동을 위한 버튼1
2학습용 데이터
(수동 실행)
학습용 데이터 생성을 위한 템플릿2
2-1학습용 데이터 상세GenerateFlowFile -> ExecuteSQL -> ConvertRecord
-> UpdateAttribute -> PutFile or PutSFTP
2-1
3예측용 데이터
(스케줄) 1
예측용 데이터 생성 템플릿(매일 23시)3
3-1예측용 데이터 상세 1ExecuteSQL -> ConvertAvroToJSON -> ReplaceText
-> UpdateAttribute -> PutFile or PutSFTP
3-1
4예측용 데이터
(스케줄) 2
예측용 데이터 생성 템플릿(매시간)4
4-1예측용 데이터 상세 2스케줄 시간을 제외하고 위와 동일함4-1

6.2.3.2.3. 원본데이터 생성

파일브라우저에서 조회되는 파일 중에서 데이터를 선택하여 원본 데이터를 생성합니다.

프로젝트 상세 페이지에서 ‘생성’ 버튼을 눌러 원본데이터 생성화면으로 이동합니다.

05_raw_data_creation1

데이터 ETL을 통해 생성된 파일 조회하고 샘플 미리보기 후, 원본 데이터를 생성합니다.

05_raw_data_creation2

번호DetailNote참조번호
1생성 버튼원본데이터 생성 Modal을 띄우는 버튼1
2원본데이터 생성 Modal프로젝트에서 사용할 원본데이터 생성 Modal2
3파일브라우저파일저장 경로에 저장된 전체 파일 표시3
4미리보기선택한 파일의 데이터 미리보기4
5원본데이터 생성선택한 파일로 원본데이터 생성5

6.2.3.2.4. 원본데이터 조회/삭제

생성된 원본데이터 정보(개수, 생성시간 및 Chart)를 조회 또는 삭제합니다.

‘원본리스트’에, 프로젝트 내부에서 생성한 원본데이터 전체 리스트가 조회되면, 특정 데이터를 클릭하여 상세정보를 확인할 수 있습니다. 상세 정보에서 특정 ‘데이터 필드명’을 선택하여 각각의 Chart를 조회합니다.

06_raw_data_list_delete

번호DetailNote참조번호
1원본리스트프로젝트에서 생성한 원본데이터 전체 리스트1
2데이터셋 정보선택한 원본데이터 데이터셋 정보2
3Chart선택한 데이터셋 정보의 특정 필드(컬럼) 시각화3
4원본데이터 삭제선택한 원본데이터 삭제4

6.2.3.2.5. 전처리데이터 생성

원본데이터의 각 필드에 전처리 테스트를 수행하여 전처리 결과를 미리 확인합니다. 전처리 테스트 완료 후 ‘등록된 전처리 리스트’로 전처리 데이터를 생성합니다.

‘데이터셋’에서 ‘전치리’ 버튼을 눌러 전처리데이터 생성화면으로 이동합니다.

07_pre-processing_data_creation1

전처리를 수행할 ‘필드 명’, 전처리 기능 종류인 ‘처리방식’, ‘파라미터’을 정하고 전처리 대상으로 추가합니다. 전처리 기능의 파라미터를 변경하고 싶을 경우 ‘Parameter’ 를 선택하여 ‘Value’에 변경하고자 하는 값을 입력합니다.

전처리 대상 LIST UP이 끝났다면, 미리보기에서 ‘테스트’를 클릭하여 테스트 결과를 조회한 후, ‘전처리 데이터 셋 생성’을 클릭하여 전처리 데이터를 생성합니다.

07_pre-processing_data_creation2

번호DetailNote참조번호
1전처리 생성 버튼전처리데이터 생성 Modal 띄우는 버튼1
2전처리 생성 Modal전처리데이터 테스트 및 생성을 위한 Modal2
3전처리 추가수행할 전처리 방법 선택 및 추가3
4등록된 전처리 리스트③에서 추가한 전처리 List4
5미리보기원본데이터 샘플 및 전처리테스트 결과 미리보기5
6전처리 데이터 셋 생성전처리데이터 생성을 위한 버튼6

6.2.3.2.6. 전처리데이터 조회/삭제

전처리데이터 정보(개수, 생성시간 및 Chart)를 조회 또는 삭제합니다.

‘전처리된 리스트’에서 전처리 선택에 따라 ‘전처리 정보’, ‘전처리 프로세스’ 확인이 가능합니다. ‘전처리 프로세스’ 하단에 ‘데이터 필드명’을 선택하여 전처리 결과에 대한 각각의 Chart도 확인할 수 있습니다.

08_pre-processing_list_delete

번호DetailNote참조번호
1전처리된 리스트현 ‘원본데이터’의 전처리 데이터 리스트1
2전처리셋 정보선택한 전처리 데이터 셋 정보2
3전처리 프로세스전처리 데이터에 수행된 전처리 방법3
4Chart특정 필드(칼럼)에 대한 시각화4
5전처리 삭제선택한 전처리 데이터 삭제5

6.2.3.2.7. 모델 생성

모델을 생성하기 위해 알고리즘과 파라미터를 선택하고 분석정보를 최종 확인한 후 모델 생성을 요청합니다.

모델 학습을 진행하기 위해 ‘학습’을 클릭하여 학습을 위한 Modal을 띄웁니다. 09_model_creation1

‘알고리즘’ 탭에서 분석을 위한 알고리즘 선택, ‘파라미터 설정’ 탭에서 선택한 알고리즘의 모델 및 학습 파라미터를 설정합니다.

09_model_creation2 09_model_creation3

‘분석 정보 확인’ 탭에서 정보를 확인한 후 ‘학습시작’을 클릭하여 모델을 생성합니다.

09_model_creation4

번호DetailNote참조번호
1학습 버튼모델생성 Modal 띄우는 버튼1
2모델생성 Modal모델 생성을 위한 Modal2
3알고리즘 설정탭모델 생성을 위한 알고리즘 선택 탭3
4알고리즘 조회창사용 가능한 전체 알고리즘 조회4
5파라미터 설정탭선택한 알고리즘의 모델/학습 파라미터 설정 탭5
6파리미터 설정 테이블조정하고 싶은 파라미터 변경 또는 선택6
7분석정보 확인탭분석 정보 조회 탭7
8분석정보 테이블모델 생성을 위해 선택한 전체정보 조회8
9학습시작모델 학습 시작 버튼9

6.2.3.2.8. 모델 조회/삭제

생성된 모델 정보(상태, 생성시간, 학습정보 등)를 조회 또는 삭제합니다

‘모델 리스트’에, 선택한 전처리 데이터를 기반으로 생성한 모델 리스트가 표시되고, ‘학습정보’ 영역에서 학습 알고리즘, 소요시간, 성능평가 Score 및 파라미터 등을 확인할 수 있습니다.

10_model_list_delete

번호DetailNote참조번호
1모델 리스트선택한 전처리데이터로부터 생성한 전체 모델 리스트1
2모델 정보선택한 모델의 정보 조회화면2
3학습 정보선택한 모델의 학습정보 조회화면3
4모델 삭제선택한 모델 삭제4

6.2.3.2.9. 모델 테스트

모델 학습이 완료되면, 생성된 모델과 테스트 데이터를 선택하여 테스트 결과를 조회합니다.

‘테스트’ 버튼을 클릭하여 테스트를 위한 Modal을 띄웁니다.

11_model_test1

파일 리스트에서 테스트를 위한 데이터를 선택하고, ‘테스트 요청’을 클릭하여 테스트 결과(Score 및 Pridict)를 확인합니다.

11_model_test2

번호DetailNote참조번호
1테스트 버튼모델 테스트 Modal 띄우는 버튼1
2모델 테스트 Modal선택한 모델 테스트를 위한 Modal2
3파일 리스트학습용 전체 파일 List3
4테스트 데이터 미리보기선택한 파일의 데이터 미리보기4
5테스트 요청테스트 결과 요청을 위한 버튼5
6테스트 결과선택한 데이터에 적용한 모델 테스트 결과6

6.2.3.3. 배치관리

예측용 데이터를 모델에 적용하여, 코어 모듈에 저장하기 위한 배치를 생성/조회합니다.

6.2.3.3.1. 배치 등록

코어 모듈에 예측 결과를 저장하기 위한 배치를 등록합니다.

‘배치등록’ 버튼을 클릭하여 배치등록을 위한 Modal을 띄웁니다.

12_batch_registration1

배치에 필요한 모델, 예측 데이터, 후처리 및 코어모듈 저장방식, 배치 실행 주기를 설정합니다.

12_batch_registration2

No.Detail1Detail2Note참조번호
1배치 등록배치 등록을 위한 Modal을 표시하는 버튼1
2배치명등록하고자 하는 배치명 입력2
3학습된 모델프로젝트에서 생성한 모델 정보3
3-1프로젝트배치에 적용할 모델의 프로젝트 선택3-1
3-2모델명배치에 적용할 모델 선택3-2
4예측용 데이터 생성모델에 적용할 예측용 데이터 파일명 및 경로4
4-1Nifi 버튼Data Lake Nifi를 새창으로 open4-1
4-2Nifi 템플릿명사용자가 예측용 데이터를 생성할 때, 어떠한 Nifi 템플릿을 사용하였는 지에 대한 참고용 정보4-2
4-3파일 생성 위치예측용 데이터가 생성된 상대 경로(NFS ResultPath의 하위 경로) 입력4-3
4-4파일 생성 규칙학습에 사용할 예측용 데이터 파일(json)의 이름 또는 파일 생성 규칙을 입력4-4
5후처리 방식없음 or 백분율.
백분율 선택 시, 토글되는 ‘전체값 컬럼’ 입력란에 계산에 사용할 값이 있는 컬럼명을 넣는다.
식 : ('전체값' - '예측값') / '전체값' * 100
5
6코어모듈 저장방식예측 결과를 코어 모듈에 저장 시 필요한 정보6
6-1결과 반영 방식UPDATE or REPLACE6-1
6-2데이터 셋 아이디결과 반영 대상 데이터 셋 아이디.
사용자는 사전에 코어모듈의 데이터 셋 아이디를 알고 있어야 한다.
6-2
6-3업데이트 도메인명결과 반영 대상 도메인을 선택한다.6-3
6-4업데이트하는 속성결과 반영 속성을 선택한다.
예측용 데이터에 예측시간(predictedAt)이 없거나, 후처리에서 백분율로 설정하지 않으면, 예측시간 또는 백분율을 선택하더라도 결과에 반영되지 않는다.
6-4
6-5인스턴스 컬럼이름결과 반영 대상의 Key가 되는 컬럼명. 반드시 모델 적용 결과에 존재하는 컬럼명이야한다.6-5
7실행주기, 기타사항배치 실행 간격/주기, 메모7
7-1실행 주기분/시간/일/월/요일.
* = every.
요일 : 1-일요일, 7-토요일
예1) */13/3/10/* : 10월 3일 13시 매분마다 배치 실행
예2) 30/*/*/6/1 : 6월 매주 일요일 매시간 30분마다 배치 실행
7-1
7-2기타사항Remark7-2
8등록 버튼작성한 배치를 등록한다.8

6.2.3.3.2. 배치 조회/수정

등록된 모든 배치작업과 이력(실행로그)를 조회하고 수정합니다.

‘배치관리’ 탭에서 등록된 배치 목록을 조회합니다. 등록한 배치를 실행, 정지, 수정, 삭제할 수 있습니다.

13_batch_list_modify

No.DetailNote참조번호
1배치 관리배치 관리 탭1
2배치목록 테이블등록 완료된 배지작업 화면2
3배치 선택특정 배치 선택 박스3
4시작 버튼선택한 배치 시작4
5정지 버튼선택한 배치 정지5
6삭제 버튼선택한 배치 삭제6
7배치 수정배치명을 클릭하면 수정 Modal 표시6

6.2.3.3.3. 배치 로그 조회

‘배치이력관리’탭에서 전체 배치목록의 실행로그를 조회합니다.

‘배치이력관리’ 탭에서 등록된 배치의 실행 이력을 조회합니다.

14_batch_log_list1

No.DetailNote참조번호
1배치이력관리배치 실행 이력 관리 탭1
2필터링 조건실행 이력 필터링 조건
Default : 1 개월
2
3검색 버튼필터링 조건 검색3
4배치이력목록 테이블등록된 배치 실행 이력 조회 화면4
5작업 이력배치 시작, 예측용 데이터 파일 확인, 배치 모듈 실행,
배치 모듈 결과, 결과 저장(코어모듈), 배치 종료
5
6배치이력 상세배치 이력 상세 내용 Modal 버튼6

배치이력의 상세 내용을 확인합니다.

14_batch_log_list2

No.DetailNote참조번호
1이력 : 배치 시작배치 시작
확인 정보 : 시작/종료시간, 성공여부, 저장방법, 업데이트 속성, 결과반영 방식, 실행 주기
6-1
2이력 : 예측용 데이터 파일 확인예측용 데이터에 대한 확인
확인 정보 : 시작/종료시간, 성공여부, 대상 파일 경로 및 크기
6-2
3이력 : 배치 모듈 실행예측용 데이터를 모델에 적용
확인 정보 : 시작/종료시간, 성공여부, 대상 파일 경로 및 크기
6-3
4이력 : 배치 모듈 결과예측용 데이터 모델 적용 결과
확인 정보 : 시작/종료시간, 성공여부, 대상 파일 경로 및 크기, 배치 결과
6-4
5이력 : 결과 저장(코어모듈)예측용 데이터 모델 적용 결과를 코어 모듈에 저장
확인 정보 : 시작/종료시간, 성공여부, 저장방법, 업데이트 속성, 결과반영 방식, 저장URL, 배치전송데이터
6-5
6이력 : 배치 종료배치 종료
확인 정보 : 시작/종료시간, 성공여부
6-6