Data Science
데이터 레이크(Data Lake)란?
데이터 레이크(Data Lake)는 구조화/반구조화/구조화되지 않은 대량의 원시 데이터를 저장, 처리, 보호하기 위한 중앙 집중식 저장소입니다. 데이터 레이크는 데이터를 원본 형식으로 저장할 수 있으며, 크기 제한을 무시하고 다양한 데이터를 처리 할 수 있습니다. 데이터 레이크는 확장 가능하고 안전한 플랫폼을 제공하며, 기업에서는 이를 통해 온프레미스, 클라우드, 에지 컴퓨팅 시스템 등을 가리지 않고 모든 시스템의 데이터를 속도 제한 없이 수집할 수 있을 뿐 아니라, 유형이나 양에 상관없이 모든 데이터를 고품질로 저장하고, 실시간 모드나 일괄 처리 모드로 데이터를 처리하며, SQL, Python, R 등의 언어와 타사 데이터 또는 분석 애플리케이션을 사용하여 데이터를 분석할 수 있습니다. 데이터레이크 V..
2021. 8. 10. 01:21
최근댓글