Delta Lake: 테이블 생성부터 Time Travel까지
IntroDelta format에 대해서 알아봐야겠다는 생각을 하던 참에, 뿌리를 뽑아두면 좋을 것 같아서 delta가 풀고자하는 기본 개념과, 어떻게 구현되었는지 감을 잡기 위해서 간단한 동작을 체크해보았습니다.Delta Lake의 탄색 배경 (feat. ChatGPT)빅데이터 환경이 발전하면서 데이터 레이크(Data Lake) 가 대규모 데이터를 저장하는 핵심 기술로 자리 잡았습니다. 하지만 기존의 데이터 레이크에는 다음과 같은 문제점들이 있었습니다.1. 데이터 무결성 부족데이터 레이크는 주로 Apache Parquet, ORC, Avro 같은 파일 포맷을 사용하여 데이터를 저장하지만, 이들은 ACID(원자성, 일관성, 격리성, 지속성) 트랜잭션을 지원하지 않습니다. 따라서 다음과 같은 문제가 발생할..
개발/공부
2025. 3. 2. 22:35
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- leetcode 매일풀기
- first missing positive
- leetcode 매일 풀기
- mlse
- n queens 2
- wildcard matching
- leetcode
- sudoku solver
- 가상면접 사례로 배우는 대규모 시스템 설계
- 개발자 글쓰기
- word ladder 2
- maximum rectangle
- 회고
- valid number
- datalakehouse
- otel
- permutation sequence
- distinct subsequences
- substring with concatenation of all words
- 글또 10기
- text justification
- longest valid parentheses
- scramble string
- palindrome partitioning 2
- hard mode challenge
- binary tree maximum path sum
- slay the spire에 진심인편
- best time to buy and sell stock 3
- 알고리즘
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
글 보관함