8 - 데이터 플랫폼 전쟁

2025. 4. 3. 12:06

8 - 데이터 플랫폼 전쟁

항목	Databricks	Snowflake	BigQuery	Redshift	Fabric
아키텍처	Lakehouse (Delta Lake + Spark + Photon)	Data Warehouse, + Snowpark	Serverless DWH	클러스터/서버리스 DWH	OneLake 기반 통합 SaaS
저장 포맷	Delta Lake (오픈소스, ACID 지원)	Protobuf 기반 내부 포맷	Colossus 기반	Columnar	OneLake (Parquet 등)
ML 지원	MLflow, AutoML, 노트북 통합	기본 없음 (외부 연동)	BigQuery ML 내장	SageMaker 등 외부 사용	AutoML, Copilot 연동
BI/대시보드	기본 시각화 + 외부 연동	Snowsight (웹 UI)	Looker Studio 등 별도	Quicksight 등 외부	Power BI 통합
스트리밍	Structured Streaming	약함	제한적 (Pub/Sub 연동)	Kinesis 연동	Fabric Event Stream
특징	AI/ML + 엔지니어링 + 분석 통합	SQL 분석 특화, 자동 최적화	서버리스 + 대규모 분석 강점	AWS 연계 강점, 튜닝 가능	MS 생태계 기반 통합 UI

왜 비교가 필요한가?