본문으로 건너뛰기

2.4 Spark 설정

2.4.1 Thrift Server 배포


  • 프로젝트 빌드 후 생성된 *.tar.gz 파일을 /usr/local 하위 경로에 압축 해제

    tar -xvzf /usr/local/lib/citydatahub_data_core_module/bigdatastorage/build/dist/thrift-server-1.0.tar.gz -C /usr/local

  • jts2geojson 설치

    wget -P $SPARK_HOME/jars/ "https://repo1.maven.org/maven2/org/wololo/jts2geojson/0.16.1/jts2geojson-0.16.1.jar"

  • Thrift 서버 실행 준비

    yum -y update
    yum install -y epel-release
    yum -y install supervisor

    cp /usr/local/lib/citydatahub_data_core_module/bigdatastorage/docker/thrift/run-thrift.sh /
    cd /
    chmod a+x run-thrift.sh

    # 스크립트 파일 내 line separator 이슈를 고려하여 각 스크립트 파일 convert
    yum -y install dos2unix
    dos2unix $THRIFT_HOME/bin/thrift-server.sh
    dos2unix $THRIFT_HOME/bin/install-dependencies.sh
    dos2unix $GEOHIKER_HOME/sbin/datacore-start-thriftserver.sh
    dos2unix $GEOHIKER_HOME/sbin/datacore-stop-thriftserver.sh

    # 실행되는 스크립트 파일 권한 수정 (실행권한 추가)
    chmod +x $THRIFT_HOME/bin/thrift-server.sh
    chmod +x $THRIFT_HOME/bin/install-dependencies.sh
    chmod +x $GEOHIKER_HOME/sbin/datacore-start-thriftserver.sh
    chmod +x $GEOHIKER_HOME/sbin/datacore-stop-thriftserver.sh

2.4.3 Hadoop 클러스터 (Hadoop & Hive과 연동)

HDFS에 데이터를 적재하고, YARN에서 query를 실행하기 위해 hadoop 클러스터가 설치된 경로의 config 폴더 하위에 있는 아래 명기되어있는 파일들을 $SPARK_HOME/conf 경로에 위치하도록 해야 합니다.

core-site.xml
hdfs-site.xml
yarn-site.xml