구축사례 > 수퍼컴퓨팅 솔루션
우리나라의 에너지 자급률은 5%에도 미치지 못한다고 한다. 70년대 오일 쇼크의 기억이 가물가물하지만, 미국-이라크 전이 발발했을 때 우리나라에서 가장 민감하게 반응한 부분 중 하나가 에너지 공급 중단 가능성이었다. 정부는 국내 석유, 가스 자원이 매장돼 있을 가능성이 높은 지역을 대상으로 지질 탐사와 조사를 활발히 벌이고 있는데, 그 핵심 역할을 담당하는 한국지질자원연구원 석유해저자원연구부에서는 리눅스 공개 SW 운영 환경으로 에너지 자급률 10% 달성을 목표로 고성능 데이터 처리 기술을 구현하고 있다.
 
기관 : 한국지질자원연구원 석유해저자원연구부

문제 : 수십 ~ 수백 기바바이트의 데이터 연산과 처리에 고성능 컴퓨팅이 필요 / 연산 전용 장비로 워크스테이션을
문제 : 사용했으나 부품 교체 등 유지보수에 엄청난 비용이 발생 / 원하는 기능의 소프트웨어를 자유롭게 개발할 수
문제 : 있는 환경 필요

해결 : 클루닉스의 클러스터링 소프트웨어와 레드햇의 리눅스 운영체제, x86 서버로 42웨이 시스템을 구성해 데이터
해결 : 처리에 필요한 연산 능력 확보 / 리눅스 기반으로 데이터 분석 소프트웨어를 개발하고, 필요한 기능을 추가할
해결 : 수 있어 연구용 소프트웨어 개발의 탄력적인 환경 확보
계획 : 데이터 안정성 확보 위해 스토리지 강화
 
프랑스는 세계 산유국 중 하나다. 중동 지역과 북 남미 지역에 위치한 다른 산유국들과 달리, 프랑스는 자국 영토에서는 석유 한 방울 나오지 않지만 산유국 대열에 올라 있다. 석유 매장국은 아니지만 매장 지역에 대한 채굴권을 획득해 산유국이 된 프랑스는, 이로 인해 에너지 자급률이 60%에 이른다고 한다. 이에 비해 우리나라의 에너지 자급률은 현재 5%에도 미치지 못하고 있다.
 

몇 년 전부터 전 세계적으로 고유가 시대에 돌입하면서, 국내에서도 석유나 가스 등 매장 자원 개발에 대한 관심이 높아졌다. 국가적으로 필요한 에너지 자원의 수급 불안정성을 해결하고자 하는 정책의 일환으로 산업자원부 유전개발팀에서 지원해 국내외 석유 자원 개발에 관한 정책 수립과 실행을 위한 지원을 하고 있다.

정부에서는 국내 에너지 자급률을 10%로 끌어올린다는 목표이며, 이를 위해 국내 가스 대륙붕 탐사, 해외 채굴권 획득 등을 목표로 한국석유공사, 한국지질자원연구원 등 관계 기관은 석유/가스 지질 탐사 및 생산 기술 개발과 자원 개발 인프라 구축 등에 노력을 다하고 있다.

 

세계 경제 및 정치적 위기에 에너지는 중요한 요인이 되고 있고 국가적 위기 관리의 일환으로도 에너지의 자급률 달성은 시급한 목표가 되고 있다.
우리나라는 대륙붕 해저에 두터운 제 3기층 퇴적물이 분포돼 있어 석유, 가스 자원이 존재할 가능성이 높다는 보고서에 따라 1970년 1월 해저광물자원개발법을 제정, 공포했으며 이에 따라 국내 대륙붕의 석유 가스 자원 탐사를 시작하게 됐다.

현재도 이를 위해 한국지질자원연구원에서는 고가의 워크스테이션 대신 x86 아키텍처의 PC 서버와 리눅스 운영체제로 국내 에너지 자급도 개선을 도모하고 있다.

한국지질자원연구원 석유해저자원연구부에서는 42개의 인텔 CPU를 장착한 조립 형 PC 서버와 레드햇 운영체제(RHEL)로 지질 데이터 분석 시스템을 구성했다. 클러스터링 환경은 슈퍼컴 솔루션 전문 업체인 클루닉스에서 구축했다.

이 데이터 분석 시스템은 한 번에 수십 기가바이트에 이르는 대용량 데이터를 처리하고 있다. 데이터를 처리하는 기술에 따라 지층 단면도의 정확도가 달라지기 때문에 이 분석 시스템과 소프트웨어는 국내 에너지 자급률 달성을 위한 기초라고 할 수 있다.

데이터 처리 분석의 정확도를 위해서는 연산 능력이 중요하고, 최대한 신속하게 데이터 분석 결과를 도출하기 위해 고성능 시스템이 필요하다. 하드웨어 시스템과 함께 데이터 분석 소프트웨어 또한 중요한데, 한국지질자원연구원 석유해저자원연구부에서는 리눅스 시스템과 x86 서버들로 기존 워크스테이션 제품을 대체했으며, 리눅스 기반의 분석 소프트웨어를 자체 개발, 사용해 데이터 처리 능력을 높여가고 있다.

지질 탐사는 주로 탄성파를 이용해 지층에 매장돼 있는 물질들을 파악한다. 각 성분에 따라 탄성파가 다르다는 점에 착안한 것으로, 이러한 지층 단면도는 주로 석유 등 지하 자원 탐사를 위해 사용된다. 지층 단면도는 단 한 장이지만, 이 한 장의 지층 단면도가 수억, 수십억 원의 비용 지출 여부를 쥐락펴락하며, 국가적 에너지 확보와 독립성을 가늠하게 만든다.

 

매장 지역을 발견하기 위해 광구의 해역을 격자 단위로 구분해 조사선은 이 해역을 운항하며 수면에 탄성파를 쏜다. 일정 지역/시간 단위로 쏘아 보낸 탄성파는 해저 지층의 정보를 추측하는 데이터로 사용된다. 이렇게 수집된 데이터는 한 해역 단위 당 수십 기가바이트에 이르기 때문에 인터넷을 통한 전송이 어렵고 테이프에 저장해 대전에 위치한 연구원에 직접 전달된다.

이 데이터를 토대로 해저 자원 지도를 정확하게 그려내는 것이 시추 비용을 최소화할 수 있을뿐더러 국내 에너지 자급률을 높이는 데 기여한다. 최단 시간 내 데이터를 정확하게 분석하기 위해 고성능의 연산 속도와 안정성이 필요하다.

 

한 번에 수십 기가바이트 용량이 여러 개 모여 수백 기가바이트의 데이터를 처리해야 하는데, 이러한 시스템에 문제라도 일어나면 처음부터 다시 작업해야 하며, 그 전까지의 작업은 모두 무위로 돌아가기 때문이다.

따라서 이러한 작업에는 보통 슈퍼컴퓨터나 연산 전용이라고 할 수 있는 CISC 기반의 워크스테이션 장비들이 사용되는데, 한국지질자원연구원 석유해저자원연구부에서는 리눅스 운영체제와 PC 서버로 성능과 안정성을 충분히 보장받고 있으며, 더 나아가 필요한 연구용 소프트웨어를 리눅스 기반으로 직접 개발해 해외 상용 패키지와 함께 사용하고 있다.

 

매장 지역을 발견하기 위해 광구의 해역을 격자 단위로 구분해 조사선은 이 해역을 운항하며 수면에 탄성파를 쏜다. 일정 지역/시간 단위로 쏘아 보낸 탄성파는 해저 지층의 정보를 추측하는 데이터로 사용된다. 이렇게 수집된 데이터는 한 해역 단위 당 수십 기가바이트에 이르기 때문에 인터넷을 통한 전송이 어렵고 테이프에 저장해 대전에 위치한 연구원에 직접 전달된다.

이 데이터를 토대로 해저 자원 지도를 정확하게 그려내는 것이 시추 비용을 최소화할 수 있을뿐더러 국내 에너지 자급률을 높이는 데 기여한다. 최단 시간 내 데이터를 정확하게 분석하기 위해 고성능의 연산 속도와 안정성이 필요하다.

리눅스 기반으로 개발된 이 데이터 분석 소프트웨어는 포트란으로 개발됐는데, '지오비트(GeoBit)'라는 이름으로 소프트웨어 등록도 돼 있다. 이 소프트웨어와 해외 상용 소프트웨어를 병행해 분석하는데, 데이터는 조사선이 제공하는 탄성파 정보로 이뤄진다.
조사선이 바다 위를 떠돌며 수집한 데이터를 얼마나 정확하게 분석해 지질 단면도를 그려내느냐는 매우 중요하다. 단면도의 정확도에 따라 1회 수천만 원이 소요되는 시추 비용을 최소화할 수 있기 때문이다.

한 예로, 국내 대륙붕 석유/가스 탐사의 역사는 지난 1968년으로 거슬러 올라가는데, 당시 조광권을 획득한 외국 석유 개발 회사들이 국내 탐사를 실시했으나 약간의 가스 징후만을 발견했을 뿐 모두 실패해 철수한 바 있다. 그 중 제6-1 광구는 1972년 네덜란드의 쉘 사가 조광권을 설정해 탐사 시추했으나 석유 발견에 실패했다.

그러나 1983년 정밀 물리 탐사를 실시한 결과, 석유 가스 자원 부존 가능성이 있다는 결론에 도달했고, 수 년 동안 몇 차례에 걸쳐 정밀 탐사를 실시, 1999년 시추에 성공해 2000년 2월 '동해-1 가스전'으로 공식 명명하고 상업적 개발을 선언, 현재에 이르고 있다. 탐사 기술과 데이터 처리 기술의 발전이 없었다면 동해-1 가스전은 발견되지 못했을 것이다.

성능과 안정성을 요구하는 이 작업에 리눅스를 사용하고 있는 이유에 대해 한국지질자원연구원 석유 해저자원연구부 장성형 박사는 "리눅스라는 운영체제는 어떤 하드웨어에도 탑재 가능하기 때문에 서버 업체들, 또는 CPU 업체들을 경쟁시켜 하드웨어 시스템 가격을 낮출 수 있는 것은 물론, 운영체제 라이센스 비용도 크게 격감된다"고 설명한다.

구입 비용뿐 아니다. 기존에 사용하던 워크스테이션의 경우 CPU나 메모리 보드 등을 교체하는데 해당 벤더는 수 천만 원의 비용을 요구했다. 특정 하드웨어 벤더의 제품을 사용할 수 밖에 없던 종속적 환경 때문에 수천만 원을 들여 부품을 교체하거나 유지보수를 받아야 했기에 총 소유 비용 측면에서도 많은 부담이 있었다.

리눅스 운영체제를 선택함으로써 하드웨어 업체들을 경쟁시킬 수 있고, 부품 교체 등에 있어서도 범용성 있는 하드웨어를 선택했기 때문에 부품 교체가 매우 손쉬워져 유지 보수 비용뿐 아니라 작업도 훨씬 수월해졌다는 평가다. 공공연구기관에서의 IT 관련 예산이 넉넉하지 않은 점을 감안하면 리눅스로 전환한 이후 연구의 폭이 훨씬 넓어진 셈.

그러나 장성형 박사가 꼽은 리눅스의 장점은 비용 절감에만 있지 않다. 리눅스 기반에서 필요한 분석 소프트웨어를 자체 개발함으로써 기능에서나 사용자 인터페이스 측면에서 가장 최적화된 소프트웨어 개발이 가능하다는 점이다.

리눅스는 스택에 컴파일부터 원하는 애플리케이션이 모두 제공되기 때문에 원하는 대로 프로그램 구현이 가능하다고 정성형 박사는 설명한다. 시중에 지질 데이터 처리를 위한 상용 소프트웨어가 윈도우나 유닉스 버전으로 공급되고 있지만, 추가적으로 필요한 기능이나 소프트웨어 개발을 위해서는 리눅스만한 운영체제가 없다는 설명이다.

 

"미국의 대형 석유 회사인 베리타스에서는 1만 4천 개의 CPU를 사용해 데이터를 처리하는데, 이 시스템이 리눅스 기반이다. 리눅스 개발자들이 포진해 있기 때문에 방대한 리눅스 시스템 환경 운영과 원하는 프로그램 개발이 가능한 것이지만, 글로벌 대형 석유 회사에서도 데이터 분석을 위해 리눅스를 사용하고 있다는 점은 안정성과 성능, 비용 효율성, 프로그램 개발의 자율성과 생산성을 모두 반영한 것"이라고 강조한다.

최근 들어 썬 솔라리스도 소스코드를 공개하고 있으며 마이크로소프트 또한 HPC(고성능 컴퓨팅) 시장에 진입하기 위해 다각도로 노력을 기울이고 있다. 하지만 장성형 박사는 리눅스 대신 다른 운영체제를 사용하는 일은 없을 것이라고 단언한다.
"다른 운영체제가 무료로 제공된다고 해도 리눅스에서 바꿀 수는 없다. 비용보다 중요한 것은 범용성이다. 어떤 하드웨어, 소프트웨어에도 종속되지 않으면서 범용적으로

사용된다는 점은 사용자에게 컴퓨팅 운영환경에서의 자율성을 확보할 수 있도록 해주기 때문이다"고 장성형 박사는 리눅스 사용의 근본적인 이유를 제시했다.

물론 이를 위해서는 리눅스 개발자와 엔지니어가 필수다. 리눅스 기술력이 있기에 한국지질자원연구원은 국민의 세금에서 제공되는 연구 비용을 다른 운영체제를 사용했을 때와 비교해 10분의 1수준에서 사용하면서 동일한 성능을 발휘하며, 컴퓨팅 운영의 폭을 넓히고 있는 것이다.

 
출처 : 공개SW 리포트(한국소프트웨어진흥원 발행)
글 이동훈기자(정보통신기자협회), 사진 김윤형 | 2007.12
 
Copyright(C) by Clunix, Inc., All rights reserved.
본사 및 연구소 : 서울특별시 영등포구 경인로 775. 1동 1206호
빅데이터센터 : 대구광역시 동구 동대구로 481 대구지식서비스센터 4층
Tel:02.3486.5896 Email:bizsup@clunix.com