| 애플리케이션 | 천체물리학, 분자물리학, 기상학 및 생물학 분야에서의 과학 연구를 위한 그리드 컴퓨팅 네트워크 |
|---|---|
| 비즈니스 이점 |
|
| 소프트웨어 |
|
| 하드웨어 | IBM eServer xSeries® |
스페인 최대 연구 기관에 속한 IFCA에서는 의료 전문가를 비롯하여 중요한 기상 패턴을 모니터링하는 기상학자까지 다양한 전문가들을 지원합니다.
“그리드 연구에 가장 활발하게 참여하는 센터 중 하나인 IFCA에서는 IBM 및 Linux 기술이 핵심적인 구성 요소를 이루고 있습니다.”
- IFCA e-사이언스 및 그리드 연구 책임자 Jesus Marco
앨버트 아인슈타인과 같은 천재는 연필 한 자루와 평평한 표면만 가지고 혁신적인 이론을 입증했을지 몰라도, 오늘날에는 컴퓨팅 능력을 바탕으로 과학 연구가 새로운 지평을 열어가고 있습니다. 그리 멀지 않은 미래에는 여러 대륙을 망라하여 수많은 학자들이 고성능 컴퓨터에서 계산 및 시뮬레이션을 실행하면서 함께 일하는 것이 일반화될 것입니다. 뿐만 아니라 이들이 만들어내는 몇 조TB 단위의 데이터들이 전자 데이터베이스에 저장되어 고속 네트워크를 통해 공유됨으로써 공히 전세계적인 가상 연구 조직이 탄생할 것으로 예상됩니다. 바로 그리드 컴퓨팅의 시대가 열리는 것입니다.
스페인의 칸타브리아 물리학 연구소(Instituto de Fisica de Cantabria, IFCA)에서는 그리드 컴퓨팅이 현실화 되었습니다. 최근 자체 그리드 리소스를 구현한 IFCA가 현재 참여 중인 그리드 시험에서는 유럽 10개 나라에 걸쳐 분산된 컴퓨터 수백 대의 컴퓨팅 리소스를 통합시켜(수백 기가플롭의 처리 성능 제공) 수십 명의 과학자들이 이를 이용할 수 있습니다. 분자물리학, 천체물리학, 기상학, 생물학 등의 분야에서 복잡한 문제를 해결하는 이 학자들에게 있어 그리드 컴퓨팅이 없다면 인생은 상상할 수 없을 만큼 느린 속도로 진행될 것입니다.
칸타브리아 대학교 및 스페인 최대 규모의 비영리 연구 기관인 CSIC(스페인 최고 과학 연구 센터)의 자금 지원을 받아 운영 중인 IFCA는 그리드 연구를 매우 활발하게 진행하는 센터 중 하나입니다. 칸타브리아에 본부를 둔 IFCA에서는 듀얼 Pentium III 프로세서 기반 IBM eServer xSeries 220 시스템 80대로 구성된 클러스터에서 Red Hat Linux, IBM Informix Dynamic Server 9.3 및 다양한 과학 연구 소프트웨어를 실행하고 있습니다. “그리드 연구에 가장 활발하게 참여하는 센터 중 하나인 IFCA에서는 IBM 및 Linux 기술이 핵심적인 구성 요소를 이루고 있습니다.”라고 IFCA e-사이언스 및 그리드 연구 책임자 Jesus Marco가 밝힙니다.
연구 데이터는 100mbps를 능가하는 속도로 그리드를 통해 교환됩니다. 그 정도의 데이터 볼륨을 그리드 없이 처리하려면 컴퓨터 센터 한 곳에서 수천 대의 최신 세대 PC를 관리해야 합니다. 그리드 환경에서는 데이터가 그리드를 통해 분산, 처리되므로 모든 학자들은 최소한의 투자로 컴퓨팅 리소스를 확장할 수 있습니다. “아직 비용 대비 이점 분석을 하진 않았지만 그 이점을 분명하게 인식할 수 있습니다”라고 Marco는 말합니다. “그리드 환경에서는 고가용성의 작업을 보장하고 훨씬 더 복잡한 연구 요청을 처리하며 예기치 못한 컴퓨팅 리소스 수요를 능히 해결할 수 있습니다.
산 살바도르에 본부를 둔 DGII는 Informix Dynamic Server, Version 9.4로 업그레이드한 후 세금 행정 업무를 크게 향상시켰습니다.
“우리는 IBM의 그리드 컴퓨팅 지식 그리고 IBM의 그리드 환경 기술 로드맵에서 큰 도움을 받았습니다.”
- IFCA 소프트웨어 개발자 David Rodriguez
개방성, 상호 연결성 및 경제성
그리드 네트워크에 포함된 IFCA로서는 공개 표준 기반의 기술을 전개하여 다양한 시스템 및 어플리케이션과 원활하게 연결하는 것이 중요합니다. 또한 경제성 있는 솔루션을 전개하여 지원 받은 예산을 최대한 활용할 필요가 있습니다. 따라서 기술 솔루션을 찾기 시작한 IFCA의 관심은 Linux 운영 체제 및 공개 소스 소프트웨어로 향했습니다. “그와 더불어 IT 업계에서 확고한 입지를 갖춘 업체를 원했습니다. 따라서 IBM이 그리드 기술에 깊은 관련이 있다는 소식을 듣고 즉시 그 솔루션을 테스트해보기로 했습니다.”라고 Marco는 설명합니다.
각 기술 요소들은 매우 훌륭하게 융합된다는 것이 확인되었습니다. “우리 입장에서 IBM의 공개 표준 지원 그리고 포괄적인 Linux용 하드웨어 및 소프트웨어 솔루션은 타의 추종을 불허하는 막강한 조합이었습니다.”라고 Marco는 밝힙니다.
밀려드는 데이터 관리
IFCA는 유럽분자물리학연구소(CERN), 유럽우주기구(ESA)와 같은 연구 기관들과 손을 잡고 명성 높은 국제 프로젝트에 참여하고 있습니다. 각 프로젝트에서는 지역적으로 분산된 초대형 데이터베이스 및 시스템 리소스를 대화형으로 활용하고 데이터마이닝 기술을 적용하는 것이 중요한 요구 사항입니다.
예를 들어, 2000년에 CERN의 감독 하에 유럽연합의 정보사회기술프로그램(Information Society Technologies Program)의 일환으로 착수된 DataGrid 프로젝트에서는 폭넓게 분산된 과학 커뮤니티들이 대규모 공유 데이터를 집중적으로 계산하고 분석할 수 있는 컴퓨팅 인프라를 구축하고 있습니다. 이를 보완하고자 2001년에 시작된 CrossGrid European 프로젝트는 그리드 환경에서 대화형 어플리케이션을 지원하는 것을 목표로 하며, 여기서 IFCA는 분산 데이터마이닝을 담당합니다.
“그리드 데이터에서는 매우 강력한 데이터베이스 엔진이 필요했습니다.”라고 Marco는 설명합니다. “1년간 Informix Dynamic Server 9.3으로 베타 테스트를 실시한 결과 그 성능에 깊은 인상을 받았습니다. 이 제품은 물리학 및 기상학 프로젝트에서 필요로 하는 기능 요건, 즉 뛰어난 안정성 및 확장성, 강력한 복제 체제, Object Translator와 같은 분산 툴간의 상호 운용성 그리고 XML 지원 등을 모두 충족시켰습니다.”
언제라도 IFCA는 테라바이트급 데이터를 데이터 저장소에 저장합니다. “시스템에는 엄청난 부하가 발생합니다.”라고 IFCA 소프트웨어 개발자 David Rodriguez는 설명합니다. “하지만 Informix Dynamic Server에는 매우 효과적인 복제 기법이 구현되어 있어 일부 서버가 정기 유지 보수 등으로 오프라인 상태이더라도 변함 없이 작업을 수행할 수 있습니다.”
IBM 기술 덕분에 IFCA를 비롯하여 그 밖의 그리드 협업 기관들은 분산 데이터베이스 쿼리를 수행한 다음 그 결과에 데이터마이닝 기술을 적용할 수 있습니다.
“일부 어플리케이션에서는 데이터 쿼리에 웹 인터페이스를 사용하는 3계층 아키텍처가 구현됩니다. 우리는 이 용도로 Informix Object Translator를 테스트했습니다. Informix Object Translator는 XML을 데이터 교환 형식으로 사용하면서 3계층 웹 어플리케이션으로 데이터를 확장할 수 있습니다.” Rodriguez의 설명입니다.
Globus Toolkit은 그리드 시스템의 기반으로 사용되는 미들웨어입니다. 여기에는 소프트웨어 서비스, 리소스 모니터링, 검색 및 관리를 위한 라이브러리, 보안 및 파일 관리 기능이 포함됩니다. 이 미들웨어 위에 데이터 액세스 계층이 구현됩니다.
최 근 발표된 새로운 버전의 툴 킷(GT3)에서는 OGSA(Open Grid Services Architecture) 표준을 구현했습니다. IBM은 이 툴 킷을 계속 개발하고 표준을 강화할 Globus Alliance에서 적극적으로 활동하고 있습니다.
견고하고 확장 가능한 플랫폼
IBM 플랫폼의 또 다른 중요한 장점 중 하나는 IFCA가 손쉽게 시스템을 전개하고 구성할 수 있었다는 것입니다. 자동화된 설치 과정에는 Linux 기반의 네트워크 부팅 산업 표준인 PXE(Preboot Execution Environment) 및 Kickstart 절차가 포함되었습니다. 따라서 총 80노드의 클러스터가 불과 몇 분만에 구성될 수 있습니다. “이는 엄청난 성과”라고 Marco는 말합니다.
IBM 비즈니스 파트너인 CIC(Consulting Informatico Cantabria)에서 그리드 솔루션용 IBM 서버를 공급했습니다. “과학 환경에서 컴퓨팅 리소스에 대한 수요가 증가하는 속도를 감안하면 확장성이 뛰어난 하드웨어 인프라가 필요합니다.”라고 Marco는 강조합니다. “IBM xSeries 서버는 가장 뛰어난 확장성을 제공하는 환경일 뿐 아니라 미션 크리티컬 어플리케이션을 위한 탄력성 및 고가용성을 두루 갖추었습니다.” 처리 리소스에 대한 수요가 늘고 데이터 양이 폭발적으로 증가하자 IFCA는 더욱 강력한 확장성 및 성능을 원하고 있습니다. Rodriguez는 이렇게 부연 설명합니다. “우리는 IBM의 그리드 컴퓨팅 지식 그리고 IBM의 그리드 환경 기술 로드맵에서 큰 도움을 받았습니다.”

