728x90
반응형
데이터 레이크(Data Lake)
- 대규모 데이터 분석 처리 시나리오 에서 공통으로 나타나는 요소로, 대량의 파일 기반 데이터가 수집되어 분석된다.
데이터 웨어하우스(Data Warehouse)
- 읽기 작업에 최적화된 관계형 스키마 데이터를 저장하는 확립된 방법
데이터 레이크하우스(Data Lakehouse)
- DataLake의 유연하고 확장성 있는 스토리지와 DataWarehouse의 관계형 쿼리 의미 체계가 결합된 형태
Data Warehouse와 Data Lakehouse의 차이
DataLake | Data Warehouse | |
유형 | 정형, 반 정형, 비 정형 관계형, 비관 계형 |
정형 관계형 |
스키마 | 읽기 시 스키마 | 쓰기 시 스키마 |
Format | 원시 필터링되지 않음 |
처리됨, 점검됨 |
원본 | 빅 데이터, IoT, 소셜미이더, 스트리밍 데이터 |
응용 프로그램, 비즈니스, 트랜잭션 데이터, 일괄 처리 보고 |
확장성 | 저렴한 비용으로 손쉽게 스케일링 | 스케일링이 어렵고 비용이 많이 듦 |
사용자 | 데이터 과학자, 데이터 엔지니어 | 데이터 웨어하우스 전문가, 비즈니스 분석가 |
사용 사례 | 기계학습, 예측 분석, 실시간 분석 | 핵심 보고, BI |
728x90
반응형
'Microsoft' 카테고리의 다른 글
[Microsoft Azure] Azure Data Lake Storage Gen2 소개 (0) | 2024.11.12 |
---|---|
[Microsoft Azure] Azure의 데이터 엔지니어링 소개 (0) | 2024.11.04 |
[Power BI]Power BI Desktop의 스토리지 모드 (0) | 2024.03.10 |