Microsoft

[Microsoft Fabric] 데이터 레이크(Data Lake), 데이터 웨어하우스(Data Warehouse), 데이터 레이크하우스(Data Lakehouse)

truthyun 2024. 8. 22. 16:58
728x90
반응형

데이터 레이크(Data Lake)

  • 대규모 데이터 분석 처리 시나리오 에서 공통으로 나타나는 요소로, 대량의 파일 기반 데이터가 수집되어 분석된다.

데이터 웨어하우스(Data Warehouse)

  • 읽기 작업에 최적화된 관계형 스키마 데이터를 저장하는 확립된 방법

데이터 레이크하우스(Data Lakehouse)

  • DataLake의 유연하고 확장성 있는 스토리지와 DataWarehouse의 관계형 쿼리 의미 체계가 결합된 형태

 

Data Warehouse와 Data Lakehouse의 차이

  DataLake Data Warehouse
유형 정형, 반 정형, 비 정형
관계형, 비관 계형
정형
관계형
스키마 읽기 시 스키마 쓰기 시 스키마
Format 원시
필터링되지 않음
처리됨, 점검됨
원본 빅 데이터, IoT, 소셜미이더,
스트리밍 데이터
응용 프로그램, 비즈니스,
트랜잭션 데이터, 일괄 처리 보고
확장성 저렴한 비용으로 손쉽게 스케일링 스케일링이 어렵고 비용이 많이 듦
사용자 데이터 과학자, 데이터 엔지니어 데이터 웨어하우스 전문가, 비즈니스 분석가
사용 사례 기계학습, 예측 분석, 실시간 분석 핵심 보고, BI

 

 

 

728x90
반응형