DataLake 의 이해 및 필요성 ( AWS 기반 설명 )
1 데이터 레이크의 필요성 데이터간의 폐쇄성으로 데이터 통합이 필요함 기존 DW 보다 더 거대한 통합을 원함 레거시 시스템들의 분산으로 통합 데이터의 필요성이 대두됨 2. 데이터 폐쇄성으로 인한 문제 데이터의 비용 증가 정확도 저하 중북 증가 협업의 감소가 발생 3. 데이터 레이크의 배경 다양한 데이터로 인한 한계 분산된 저장소로 인한 한계 식상해 보일 수도 있지만, 빅데이터를 활용하기 위한 저장 방법론이 필요하게 됨 공공재 개념의 데이터가 필요해짐 데이터를 융합을 의한, 데이터 활용을 위한, 데이터의 저장소를 만들 필요가 생김 4. 그럼 어떤 요소로 한계를 극복했는가? ( 클라우드 개념에서 ) 저렴한 저장소가 필요하게 됨 클라우드가 저렴해? YES? NO? YES : 사용할 만큼 비용을 지불해서, 저렴..
2023.03.09