Apache Kafka®️ 비용 절감 방법 및 최적의 비용 설계 안내 웨비나 | 자세히 알아보려면 지금 등록하세요

Building CDC Pipelines With Apache Flink®

Change data capture (CDC) is used to copy data across relational databases, enabling essential backend operations like data synchronization, migration, and disaster recovery. And now, with stream processing, you can build CDC pipelines that power event-driven applications and trusted data products, with fresh, processed data integrated across legacy and modern, distributed systems.

See how Confluent brings Apache Kafka® and Apache Flink® together so you can build streaming CDC pipelines and power downstream analytics with fresh, high-quality operational data.

오래된 데이터 기반의 의사 결정에서 벗어나 실시간 대응 체제로 전환합니다.

처리 비용을 30% 절감합니다.

수동 장애 수정 작업 없이 신뢰할 수 있고 깨끗한 데이터를 제공합니다.

기존 CDC 아키텍처의
3가지 주요 과제

대부분의 조직은 이미 로그 기반 CDC를 사용하여 데이터베이스 변경 사항을 이벤트로 변환합니다.

  • 일괄 처리로 인한 상당한 데이터 지연. 대부분의 조직은 이벤트 스트림 대신 일괄 처리에 의존하여 로그 데이터를 다운스트림에 구체화합니다. 이는 다음 일괄 처리 프로세스가 실행될 때까지 몇 시간 또는 며칠 동안 데이터 시스템이 동기화되지 않은 상태로 유지됨을 의미합니다.
  • 중복 처리 비용. 포인트 투 포인트 통합을 구축 및 유지 관리하는 부담과 이러한 파이프라인 전반에서 발생하는 중복 처리로 인해 추가 비용이 발생합니다.
  • 반복적인 수동 장애 수정 주기로 인한 신뢰 하락. 이 모든 파이프라인의 정확성을 유지하는 것은 시간이 많이 소요되며 휴먼 에러가 발생하기 쉽습니다. 또한 이러한 방식은 팀이 다른 다운스트림 consumers에게 영향을 미친 후에야 확인된 문제를 사후 대응적으로 수정하도록 강요합니다.
Operational estate and analytical state
최신 정제 데이터를 얻기 위한 간단한 아키텍처
CDC pipeline architecture

Kafka와 Flink로 CDC 파이프라인을 구축하면 CDC 워크로드와 일괄 처리 분석을 통합하고 처리 사일로를 제거할 수 있습니다. 일괄 처리를 기다리거나 중복 처리 비용을 감수하거나 취약한 파이프라인에 의존하는 대신, 이 아키텍처를 사용하면 다음을 수행할 수 있습니다.

  • CDC 데이터를 이벤트 스트림으로 캡처
  • Flink를 사용하여 해당 스트림을 실시간으로 처리
  • 운영 및 분석 환경 전반에서 CDC 스트림을 즉시 구체화

획기적으로 절감된 비용으로 데이터 가치 극대화

서버리스 Apache Flink®를 Confluent 데이터 스트리밍 플랫폼에서 사용하면 데이터 수집 전 단계로 처리를 Shift Left 하여 지연 시간, 데이터 이동성, 비용 효율성을 개선할 수 있습니다.

  • 데이터 강화: 추가적인 컨텍스트로 데이터를 강화하여 정확성을 향상시킵니다.
  • 데이터 재사용성: 애플리케이션 간에 일관된 데이터 스트림을 공유합니다.
  • 어디서나 실시간으로: 저지연 애플리케이션이 이벤트에 즉시 반응하도록 지원합니다.
  • 비용 절감: 리소스 사용을 최적화하고 중복 처리를 줄입니다.

앱 개발(AppDev) 팀은 적시 조치를 가능하게 하는 데이터 파이프라인을 구축할 수 있습니다.

분석, 실시간 검색 인덱스 구축, ML 파이프라인, SIEM 최적화를 위한 Shift-Left 데이터 웨어하우스 및 데이터 레이크 수집이 필요한 경우.

Shift Left Analytics 알아보기

분석 팀은 계산, 상태 업데이트, 외부 작업을 트리거하여 이벤트 기반 애플리케이션에 공급할 데이터를 준비하고 가공할 수 있습니다.

여기에는 생성형 AI 솔루션, 사기 탐지, 실시간 경고 및 알림, 마케팅 개인화 등을 위해 구축된 애플리케이션이 포함됩니다.

Streaming Agents 알아보기

Confluent 스트림 처리로 CDC 파이프라인을 구축하는 3단계

Confluent를 사용하면 분석 환경에서 CDC 스트림을 구체화하기 전에 처리할 수 있습니다. Flink SQL을 사용하여 Kafka topics에서 캡처한 변경 데이터를 간편하게 필터링, 조인, 강화합니다. 그 후 운영 및 분석 환경 모두에서 데이터 스트림을 구체화합니다.

Modernize your tech stack image

1단계. 완전 관리형 CDC 커넥터를 사용하여 변경 데이터를 쉽게 캡처하고 통합합니다.

Confluent는 Oracle, SQL Server, MySQL, Salesforce, Debezium과 같은 소스를 위한 완전 관리형 CDC 커넥터를 제공합니다. 이러한 커넥터를 사용하면 모든 Insert, Update, Delete에 대한 정렬된 기록을 캡처하여, 커넥터를 직접 작성, 테스트, 유지 관리할 필요 없이 실시간으로 정교한 변경 데이터 통합을 수행할 수 있습니다.

기본 데이터 스트림의 실시간 변경 사항을 반영하여 지속적으로 업데이트되는 테이블을 생성하고, 실시간 쿼리가 가능한 결과를 제공합니다. 또한 Debezium CDC 스트림을 자동으로 해석하여 원시 데이터베이스 변경 사항을 지속적으로 업데이트되는 테이블로 간편하게 변환할 수 있습니다.

CDC diagram

2단계. Flink를 사용하여 스트리밍 변경 데이터를 지속적으로 강화, 변환, 최적화합니다.

변경 데이터의 출처가 어디든 Confluent Cloud for Apache Flink®를 사용하여 간단한 SQL 구문으로 인메모리 무상태 및 상태 기반 처리를 수행합니다. 저지연, 고처리량 스트림 처리 기능을 통해 귀하와 다운스트림 팀은 필터링, 중복 제거, 집계, 조인, 비정규화를 수행하여 실시간으로 CDC 워크로드를 강화하고 변환할 수 있습니다.

Expose CDC streams

3단계. 어디서나 CDC 스트림을 즉시 제공합니다.

ETL 파이프라인은 운영 워크로드를 분석 환경에 전달하기에 취약하고 비용이 많이 드는 방식입니다. 정제되고 강화된 데이터를 운영 환경에서 다시 사용할 수 있게 만들어야 할 때 상황은 더욱 어려워집니다. 추가적인 데이터 이동과 예약된 일괄 처리는 실시간 이벤트 기반 경험을 제공하는 데 상당한 지장을 줄 수 있습니다.

Confluent를 사용하면 이러한 시스템을 쉽게 통합하고, CDC 워크로드를 실시간으로 처리하며, 분석 및 운영 앱 모두에서 즉시 구체화할 수 있습니다. Confluent의 다양한 관리형 커넥터 세트는 원활한 통합을 지원하며, Tableflow는 스트리밍 데이터를 실시간 오픈 테이블 형식으로 구체화합니다.

스트리밍 CDC 데모 및 사례 연구

Confluent 고객들은 Flink를 사용하여 데이터 동기화 및 재해 복구와 같은 기존 CDC 사용 사례를 개선하고 새로운 실시간 기능을 확보하고 있습니다.

GitHub 리포지토리를 방문하여 Customer 360 및 제품 판매 분석, 또는 판매 추세 분석을 위한 실시간 분석 구현 방법을 알아보세요.

선택 가능한 2가지 실습이 있습니다.

제품 판매 및 Customer360 집계 실습

제품 판매 데이터를 정제 및 집계하고, 강화된 데이터를 Snowflake 또는 Redshift로 적재한 후, 운영 데이터베이스에서 사용할 데이터 제품을 생성합니다.

지금 시작하기

일일 판매 동향 실습

결제를 검증하고 판매 패턴을 분석하여 일일 추세를 파악한 다음, Amazon Athena에서 Kafka topic을 Iceberg 테이블로 구체화하여 더 깊은 인사이트를 얻습니다.

지금 시작하기
CDC data flow diagram
Confluent에서 스트리밍 CDC를 시작하는 방법

Flink로 CDC 데이터를 실시간 처리할 준비가 되셨나요? Confluent로 시작하여 어떤 환경에도 대응 가능한 스트림 처리 아키텍처를 구현하세요.

AWS, Google Cloud, Microsoft Azure에서 이용 가능한 Confluent Cloud for Apache Flink®를 사용해 보세요. 서버리스 및 클라우드 네이티브의 비용 효율성과 간단함을 갖춘 Kafka + Flink 기반 애플리케이션을 구축할 수 있습니다.

또한 Apache Flink®용 Confluent Platform을 사용하면 기존 Flink 워크로드를 자체 관리형 데이터 스트리밍 플랫폼으로 가져와 온프레미스 또는 프라이빗 클라우드에 즉시 배포할 수 있습니다.

Confluent Cloud

Apache Kafka®를 위한<br />클라우드-네이티브 서비스

Confluent 전문가로부터 맞춤형 기술 지원을 받으려면 비즈니스 이메일 주소를 입력해 주세요.
국가
  • 국가
  • 가나
  • 가다
  • 가봉
  • 가이아나
  • 감비아
  • 건지 섬
  • 과들루프
  • 과테말라
  • 그레나다
  • 그루지야
  • 그리스
  • 그린란드
  • 기니
  • 기니 비사우
  • 나미비아
  • 나우루
  • 나이지리아
  • 남 수단
  • 남극 대륙
  • 남아프리카
  • 네덜란드
  • 네팔
  • 노르웨이
  • 노퍽 섬
  • 뉴 칼레도니아
  • 뉴질랜드
  • 니우에
  • 니제르
  • 니카라과
  • 대만
  • 대한민국
  • 덴마크
  • 도미니카 공화국
  • 도미니카 공화국
  • 독일
  • 동 티모르
  • 라오스 인민 민주주의 공화국
  • 라이베리아
  • 라트비아
  • 레바논
  • 레소토
  • 루마니아
  • 룩셈부르크
  • 르완다
  • 리비아 아랍 자 마히리 야
  • 리투아니아
  • 리히텐슈타인
  • 마 요트
  • 마다가스카르
  • 마르티니크
  • 마샬 군도
  • 마카오
  • 말라위
  • 말레이시아
  • 말리
  • 멕시코
  • 모나코
  • 모로코
  • 모리셔스
  • 모리타니
  • 모잠비크
  • 몬세 라트
  • 몬테네그로
  • 몰도바, 공화국
  • 몰디브
  • 몰타
  • 몽골리아
  • 미국
  • 미국령 군소 제도
  • 미국령 버진 아일랜드
  • 미얀마
  • 미크로네시아,
  • 바누아투
  • 바레인
  • 바베이도스
  • 바하마
  • 방글라데시
  • 버뮤다
  • 베냉
  • 베네수엘라
  • 베트남
  • 벨기에
  • 벨리즈
  • 보네르, 신트 유스 타티 우스, 사바
  • 보스니아 헤르체고비나
  • 보츠와나
  • 볼리비아
  • 부룬디
  • 부베 섬
  • 부키 나 파소
  • 부탄
  • 북 마리아나 제도
  • 북마케도니아 공화국
  • 불가리아
  • 브라질
  • 브루나이 다루 살람
  • 사모아
  • 사우디 아라비아
  • 사우스 조지아 및 사우스 샌드위치 제도
  • 산 마리노
  • 상투 메 프린시 페
  • 생 바르 텔레 미
  • 생 피에르 미 클롱
  • 서사하라
  • 성좌 (바티칸 시국)
  • 세네갈
  • 세르비아
  • 세이셸
  • 세인트 루시아
  • 세인트 마틴 (프랑스어 부분)
  • 세인트 빈센트 그레나딘
  • 세인트 키츠 네비스
  • 세인트 헬레나
  • 소말리아
  • 솔로몬 제도
  • 수리남
  • 스리랑카
  • 스발 바르와 얀 메이 엔
  • 스와질란드
  • 스웨덴
  • 스위스
  • 스페인
  • 슬로바키아
  • 슬로베니아
  • 시에라 리온
  • 신트 마틴 (네덜란드어 부분)
  • 싱가포르
  • 아랍 에미리트
  • 아루바
  • 아르메니아
  • 아르헨티나
  • 아메리칸 사모아
  • 아이슬란드
  • 아이티
  • 아일 오브 맨
  • 아일랜드
  • 아제르바이잔
  • 아프가니스탄
  • 안도라
  • 알바니아
  • 알제리
  • 앙골라
  • 앤티가 바부 다
  • 앵 귈라
  • 에리트레아
  • 에스토니아
  • 에콰도르
  • 에티오피아
  • 엘살바도르
  • 영국
  • 영국령 버진 아일랜드
  • 영국령 인도양 지역
  • 예멘 아랍 공화국
  • 오만
  • 오스트리아
  • 온두라스
  • 올란드 제도
  • 요르단
  • 우간다
  • 우루과이
  • 우즈베키스탄
  • 우크라이나
  • 월리스 푸 투나
  • 이라크
  • 이스라엘
  • 이집트
  • 이탈리아
  • 인도
  • 인도네시아 공화국
  • 일본
  • 자메이카
  • 잠비아
  • 재결합
  • 저지
  • 적도 기니
  • 중국
  • 중앙 아프리카 공화국
  • 지부티
  • 지브롤터
  • 짐바브웨
  • 차드
  • 체코 공화국
  • 칠레
  • 카메룬
  • 카보 베르데
  • 카자흐스탄
  • 카타르
  • 캄보디아
  • 캐나다
  • 케냐
  • 케이맨 제도
  • 코모로
  • 코스타리카
  • 코코스 군도
  • 코트 디부 아르
  • 콜롬비아
  • 콩고
  • 콩고 민주 공화국
  • 쿠라 사오
  • 쿠웨이트
  • 쿡 제도
  • 크로아티아
  • 크리스마스 섬
  • 키르기즈스탄
  • 키리바시
  • 키프로스
  • 타지키스탄
  • 탄자니아, 유엔
  • 태국
  • 터크 스 케이 커스 제도
  • 터키
  • 토켈 라우
  • 통가
  • 투르크 메니스탄
  • 투발루
  • 튀니지
  • 트리니다드 토바고
  • 파나마
  • 파라과이
  • 파키스탄
  • 파푸아 뉴기니
  • 팔라우
  • 팔레스타인 자치구, 점령 자
  • 페로 제도
  • 페루
  • 포르투갈
  • 포클랜드 제도 (말 비나 스)
  • 폴란드
  • 푸에르토 리코
  • 프랑스
  • 프랑스 남부 지역
  • 프랑스 령 기아나
  • 프랑스 령 폴리네시아의
  • 피지
  • 핀란드
  • 필리핀 제도
  • 핏 케언
  • 허드 섬 및 맥도널드 제도
  • 헝가리
  • 호주
  • 홍콩

이미 계정을 보유하고 있습니다. 로그인

"무료로 시작하기"를 클릭하면 서비스 약관개인정보 보호정책에 동의하게 됩니다.

Confluent 전문가로부터 맞춤형 기술 지원을 받으려면 비즈니스 이메일 주소를 입력해 주세요.
국가
  • 국가
  • 가나
  • 가다
  • 가봉
  • 가이아나
  • 감비아
  • 건지 섬
  • 과들루프
  • 과테말라
  • 그레나다
  • 그루지야
  • 그리스
  • 그린란드
  • 기니
  • 기니 비사우
  • 나미비아
  • 나우루
  • 나이지리아
  • 남 수단
  • 남극 대륙
  • 남아프리카
  • 네덜란드
  • 네팔
  • 노르웨이
  • 노퍽 섬
  • 뉴 칼레도니아
  • 뉴질랜드
  • 니우에
  • 니제르
  • 니카라과
  • 대만
  • 대한민국
  • 덴마크
  • 도미니카 공화국
  • 도미니카 공화국
  • 독일
  • 동 티모르
  • 라오스 인민 민주주의 공화국
  • 라이베리아
  • 라트비아
  • 레바논
  • 레소토
  • 루마니아
  • 룩셈부르크
  • 르완다
  • 리비아 아랍 자 마히리 야
  • 리투아니아
  • 리히텐슈타인
  • 마 요트
  • 마다가스카르
  • 마르티니크
  • 마샬 군도
  • 마카오
  • 말라위
  • 말레이시아
  • 말리
  • 멕시코
  • 모나코
  • 모로코
  • 모리셔스
  • 모리타니
  • 모잠비크
  • 몬세 라트
  • 몬테네그로
  • 몰도바, 공화국
  • 몰디브
  • 몰타
  • 몽골리아
  • 미국
  • 미국령 군소 제도
  • 미국령 버진 아일랜드
  • 미얀마
  • 미크로네시아,
  • 바누아투
  • 바레인
  • 바베이도스
  • 바하마
  • 방글라데시
  • 버뮤다
  • 베냉
  • 베네수엘라
  • 베트남
  • 벨기에
  • 벨리즈
  • 보네르, 신트 유스 타티 우스, 사바
  • 보스니아 헤르체고비나
  • 보츠와나
  • 볼리비아
  • 부룬디
  • 부베 섬
  • 부키 나 파소
  • 부탄
  • 북 마리아나 제도
  • 북마케도니아 공화국
  • 불가리아
  • 브라질
  • 브루나이 다루 살람
  • 사모아
  • 사우디 아라비아
  • 사우스 조지아 및 사우스 샌드위치 제도
  • 산 마리노
  • 상투 메 프린시 페
  • 생 바르 텔레 미
  • 생 피에르 미 클롱
  • 서사하라
  • 성좌 (바티칸 시국)
  • 세네갈
  • 세르비아
  • 세이셸
  • 세인트 루시아
  • 세인트 마틴 (프랑스어 부분)
  • 세인트 빈센트 그레나딘
  • 세인트 키츠 네비스
  • 세인트 헬레나
  • 소말리아
  • 솔로몬 제도
  • 수리남
  • 스리랑카
  • 스발 바르와 얀 메이 엔
  • 스와질란드
  • 스웨덴
  • 스위스
  • 스페인
  • 슬로바키아
  • 슬로베니아
  • 시에라 리온
  • 신트 마틴 (네덜란드어 부분)
  • 싱가포르
  • 아랍 에미리트
  • 아루바
  • 아르메니아
  • 아르헨티나
  • 아메리칸 사모아
  • 아이슬란드
  • 아이티
  • 아일 오브 맨
  • 아일랜드
  • 아제르바이잔
  • 아프가니스탄
  • 안도라
  • 알바니아
  • 알제리
  • 앙골라
  • 앤티가 바부 다
  • 앵 귈라
  • 에리트레아
  • 에스토니아
  • 에콰도르
  • 에티오피아
  • 엘살바도르
  • 영국
  • 영국령 버진 아일랜드
  • 영국령 인도양 지역
  • 예멘 아랍 공화국
  • 오만
  • 오스트리아
  • 온두라스
  • 올란드 제도
  • 요르단
  • 우간다
  • 우루과이
  • 우즈베키스탄
  • 우크라이나
  • 월리스 푸 투나
  • 이라크
  • 이스라엘
  • 이집트
  • 이탈리아
  • 인도
  • 인도네시아 공화국
  • 일본
  • 자메이카
  • 잠비아
  • 재결합
  • 저지
  • 적도 기니
  • 중국
  • 중앙 아프리카 공화국
  • 지부티
  • 지브롤터
  • 짐바브웨
  • 차드
  • 체코 공화국
  • 칠레
  • 카메룬
  • 카보 베르데
  • 카자흐스탄
  • 카타르
  • 캄보디아
  • 캐나다
  • 케냐
  • 케이맨 제도
  • 코모로
  • 코스타리카
  • 코코스 군도
  • 코트 디부 아르
  • 콜롬비아
  • 콩고
  • 콩고 민주 공화국
  • 쿠라 사오
  • 쿠웨이트
  • 쿡 제도
  • 크로아티아
  • 크리스마스 섬
  • 키르기즈스탄
  • 키리바시
  • 키프로스
  • 타지키스탄
  • 탄자니아, 유엔
  • 태국
  • 터크 스 케이 커스 제도
  • 터키
  • 토켈 라우
  • 통가
  • 투르크 메니스탄
  • 투발루
  • 튀니지
  • 트리니다드 토바고
  • 파나마
  • 파라과이
  • 파키스탄
  • 파푸아 뉴기니
  • 팔라우
  • 팔레스타인 자치구, 점령 자
  • 페로 제도
  • 페루
  • 포르투갈
  • 포클랜드 제도 (말 비나 스)
  • 폴란드
  • 푸에르토 리코
  • 프랑스
  • 프랑스 남부 지역
  • 프랑스 령 기아나
  • 프랑스 령 폴리네시아의
  • 피지
  • 핀란드
  • 필리핀 제도
  • 핏 케언
  • 허드 섬 및 맥도널드 제도
  • 헝가리
  • 호주
  • 홍콩

이미 계정을 보유하고 있습니다. 로그인

"무료로 시작하기"를 클릭하면 서비스 약관개인정보 보호정책에 동의하게 됩니다.

Streaming CDC With Flink | FAQs

How does a streaming approach improve on batch ELT/ETL pipelines?

A streaming approach allows you to "shift left," processing and governing data closer to the source. Instead of running separate, costly ELT jobs in multiple downstream systems, you process the data once in-stream with Flink to create a single, reusable, high-quality data product. This improves data quality, reduces overall processing costs and risks, and gets trustworthy data to your teams faster.

Why use Apache Flink® for processing real-time CDC Data?

Apache Flink® is the de facto standard for stateful stream processing, designed for high-performance, low-latency workloads—making it ideal for CDC. Its ability to handle stateful computations allows it to accurately interpret streams of inserts, updates, and deletes to maintain a correct, materialized view of data over time. Confluent offers a fully managed, serverless Flink service that removes the operational burden of self-management.

How do you handle data consistency and quality in real-time CDC pipeline?

Data consistency is maintained by processing CDC events in-flight to filter duplicates, join streams for enrichment, and aggregate data correctly before it reaches any downstream system. Confluent's platform integrates Flink with Stream Governance, including Schema Registry, to define and enforce universal data standards, ensuring data compatibility, quality, and lineage tracking across your organization.

How does Confluent Cloud handle changes to the source database schema?

When your CDC pipeline is integrated with Confluent Schema Registry, it can automatically and safely handle schema evolution. This ensures that changes to the source table structure—like adding or removing columns—do not break downstream applications or data integrity. The platform manages schema compatibility, allowing your data streams to evolve seamlessly.

What are the main benefits of using a Fully managed service for Apache Flink® like Confluent Cloud?

A fully managed service eliminates the significant operational complexity, steep learning curve, and high in-house support costs associated with self-managing Apache Flink®. With Confluent, you get a serverless experience with elastic scalability, automated updates, and pay-as-you-go pricing, allowing your developers to focus on building applications rather than managing infrastructure. In addition, native integration between Apache Kafka® and Apache Flink® and pre-built connectors allow teams to build and scale fast.

How does Confluent Cloud simplify processing Debezium CDC events?

Confluent Cloud provides first-class support for Debezium, an open source distributed platform for change data capture. Pre-built connectors can automatically interpret the complex structure of Debezium CDC event streams, simplifying the process of integrating with Kafka and Flink.