상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153055.jpg
KCI등재 학술저널

병렬 컴퓨팅을 위한 R 패키지 소개 및 성능평가

R Packages for Parallel Computing and their Performance Evaluation

  • 8

스마트 기기와 더불어 트위터, 페이스북 등 SNS의 등장으로 다양한 정보와 방대한 데이터가 빠른 속도로 수집되고 있다. 이렇게 수집된 데이터를 빅데이터라고 하고 빅데이터를 처리하고 분석해야 하는 요즘 시대를 빅데이터 시대라고 한다. 최근 빅데이터의 신속한 처리 및 분석을 위한 연구, 특히 고성능 컴퓨팅(HPC, high performance computing)에 대한 연구가 활발히 진행되고 있다. 고성능 컴퓨팅을 위한 연구테마에는 하둡(Hadoop)과 같이 효율적으로 빅데이터를 저장하고 처리하는 기술개발 및 연산속도의 향상을 위한 병렬 컴퓨팅에 대한 연구 등이 포함된다. 이와 더불어 R 커뮤니티에서도 대용량자료의 처리 및 분석을 위한 많은 연구 및 기술개발을 하고 있다. 본 연구에서는 최근 R 커뮤니티에서 개발된 병렬 계산 패키지들을 소개하고 특징들을 비교하였으며, 모의실험을 통해 성능을 평가하였다. 실험결과 계산속도는 자료의 수, 컴퓨터 수, 코어 수 및 통신방식에 따라 차이를 나타냈지만 패키지별 차이는 없는 것으로 나타났다.

With the advent of smart devices and SNS such as Twitter, Facebook, huge sized information and data are being collected at a rapid pace. This collected data is often called the big data. A lot of research for processing and analyzing the big data have been actively studied, especially high-performance computing (HPC), Hadoop, parallel computing, and so on. In R community, there have been much research and technologies for processing and analysis of the big data. In this study, we introduce to the R packages for parallel computing, and evaluate their performances through simulations.

1. 서론

2. 병렬 컴퓨팅을 위한 R 패키지

3. R에서의 병렬 프로그래밍 순서

4. R 병렬 컴퓨팅 패키지의 성능평가

5. 결론

참고문헌

로딩중