Ahorra un 25 % (o incluso más) en tus costes de Kafka | Acepta el reto del ahorro con Kafka de Confluent

Building CDC Pipelines With Apache Flink®

Change data capture (CDC) is used to copy data across relational databases, enabling essential backend operations like data synchronization, migration, and disaster recovery. And now, with stream processing, you can build CDC pipelines that power event-driven applications and trusted data products, with fresh, processed data integrated across legacy and modern, distributed systems.

See how Confluent brings Apache Kafka® and Apache Flink® together so you can build streaming CDC pipelines and power downstream analytics with fresh, high-quality operational data.

Pasa de tomar decisiones con datos obsoletos a reaccionar en tiempo real

Reduce los costes de procesamiento en un 30 %

Proporciona datos fiables y limpios sin necesidad de correcciones manuales

Los 3 grandes desafíos de las arquitecturas CDC tradicionales

La mayoría de empresas ya usa sistemas CDC basados en registros para convertir los cambios de las bases de datos en eventos.

  • Alta latencia en los datos provocada por el procesamiento por lotes. En lugar de streams de eventos, la mayoría de empresas usa el procesamiento por lotes para materializar los datos de registro en sistemas posteriores. Eso significa que los sistemas de datos no están sincronizados durante varias horas (o incluso días), mientras esperan a que se ejecute el siguiente proceso por lotes.
  • Costes de procesamiento redundante. Los costes adicionales provienen tanto de tener que desarrollar y mantener integraciones punto a punto como de todo el procesamiento redundante que ocurre a lo largo de estas pipelines.
  • Pérdida de confianza por culpa de las constantes correcciones manuales. Garantizar la exactitud de los datos en todas estas pipelines conlleva un gran esfuerzo manual y hace que el proceso sea propenso a errores humanos. Además, este enfoque obliga a los equipos a solucionar de forma reactiva los problemas que solo pueden identificarse cuando afectan a otro consumer.
Operational estate and analytical state
Una arquitectura sencilla para obtener datos frescos y limpios
CDC pipeline architecture

Crear pipelines Change Data Capture (CDC) con Kafka y Flink te permite unificar tus cargas de trabajo de CDC y análisis por lotes, lo que permite eliminar los silos de procesamiento. En lugar de esperar a procesar tus datos por lotes, hacer frente a costes de procesamiento redundante o depender de pipelines frágiles, esta arquitectura ofrece ventajas imporantes:

  • Capturar datos de CDC como streams de eventos
  • Usar Flink para procesar esos streams en tiempo real
  • Materializar los flujos de CDC al instante en tus entornos operativos y analíticos

Cómo sacarle el máximo partido a tus datos y pagar menos por ello

Con Apache Flink® serverless en la plataforma de streaming de datos de Confluent, puedes desplazar el procesamiento a la izquierda —antes de la ingesta de datos— para mejorar la latencia, la portabilidad de los datos y la rentabilidad.

  • Enriquecimiento de datos: mejora los datos con contexto adicional para mejorar su precisión.
  • Reutilización de datos: comparte streams de datos consistentes en todas las aplicaciones.
  • En tiempo real, en cualquier lugar: permite que las aplicaciones de baja latencia respondan a los eventos al instante.
  • Reducción de costes: optimiza el uso de recursos y elimina redundancias en el procesamiento.

Los equipos de desarrollo de aplicaciones pueden crear pipelines de datos para activar acciones en el momento ideal

Al desplazar a la izquierda la ingesta de datos en data lakes y almacenes de datos, puedes realizar análisis, crear índices de búsqueda en tiempo real, desarrollar pipelines de ML y optimizar la administración de eventos e información de seguridad (SIEM).

Más información sobre Shift Left para análisis de datos

Los equipos de análisis pueden preparar y moldear datos para alimentar aplicaciones event-driven con triggers para cálculos, actualizaciones de estado y otras acciones externas

Por ejemplo, pueden usarlo en aplicaciones creadas para soluciones de IA generativa (GenAI), detección de fraude, alertas y notificaciones en tiempo real, personalización de marketing y mucho más.

Descubre los Streaming Agents

Tres pasos para crear pipelines de CDC con procesamiento en streaming de Confluent

Con Confluent, puedes procesar tus streams de CDC antes de materializarlos en tu entorno de análisis. Es muy sencillo: basta con filtrar, unir y enriquecer los datos de cambios capturados en tus topics de Kafka con Flink SQ. A continuación, podrás materializar streams de datos tanto en tu entorno operativo como en el analítico.

Modernize your tech stack image

Paso 1. Captura e integra fácilmente los datos de cambio con conectores CDC totalmente gestionados

Confluent ofrece conectores CDC totalmente gestionados para fuentes como Oracle, SQL Server, MySQL, Salesforce y Debezium. Estos conectores te permiten capturar un historial ordenado de todas las inserciones, actualizaciones y eliminaciones, lo que garantiza la precisión a la hora de integrar los datos de cambios en tiempo real, sin tener que programar, probar, mantener o gestionar los conectores internamente.

Crea tablas que se actualicen continuamente y reflejen los cambios en tiempo real de los streams de datos subyacentes para obtener resultados que pueden consultarse en directo. Además, puedes interpretar automáticamente los streams de Debezium CDC para simplificar la conversión de cambios en bruto de la base de datos en tablas que se actualizan continuamente.

CDC diagram

Paso 2. Enriquece, transforma y optimiza continuamente los datos de cambios en streaming con Flink

Puedes usar Confluent Cloud para Apache Flink®, dondequiera que se originen tus datos de cambio, para realizar un procesamiento en memoria (tanto stateless como stateful) usando una sintaxis SQL sencilla. Sus funcionalidades de procesamiento en streaming de baja latencia y alto rendimiento te permiten —⁠tanto a ti como a los equipos posteriores⁠— enriquecer y transformar in-flight las cargas de trabajo de CDC con filtrados, deduplicaciones, agregaciones, uniones y desnormalizaciones.

Expose CDC streams

Paso 3. Lleva tus streams de CDC a cualquier lugar

Las pipelines ETL son una forma frágil (y, a menudo, poco asequible) de entregar cargas de trabajo operativas a tu entorno analítico. Este proceso se vuelve aún más complicado cuando los datos limpios y enriquecidos deben estar disponibles en tu entorno operativo. Los saltos adicionales y la programación del procesamiento por lotes podrían afectar significativamente a la capacidad de ofrecer experiencias en tiempo real y event-driven.

Con Confluent, puedes integrar fácilmente estos sistemas, procesar las cargas de trabajo de CDC en tiempo real y materializarlas instantáneamente en aplicaciones tanto analíticas como operativas. La amplia biblioteca de conectores gestionados de Confluent hace que la integración sea mucho más sencilla y sin interrupciones. Tableflow , por su parte, materializa tus datos en streaming en formatos de tabla abierta en tiempo real.

CDC en streaming: Demos y estudios de caso

Los clientes de Confluent están usando Flink para mejorar sus casos de uso de CDC, como la sincronización de datos y la recuperación ante desastres, y hacer realidad nuevas funcionalidades en tiempo real.

Explora el repositorio de GitHub y descubre cómo implementar análisis en tiempo real para distintos casos de uso: Customer 360, ventas de productos o tendencias de compra.

Puedes elegir entre dos laboratorios:

Laboratorio de agregación de ventas de productos y Customer360

Limpia y agrega los datos de ventas de productos, ingiere los datos enriquecidos en Snowflake o Redshift y luego crea un producto de datos para que las bases de datos operativas lo consuman.

Empieza ahora

Laboratorio de tendencias de ventas diarias

Valida los pagos, analiza los patrones de ventas para identificar las tendencias diarias y materializa el topic de Kafka como una tabla de Iceberg en Amazon Athena para extraer conclusiones detalladas.

Empieza ahora
CDC data flow diagram
CDC en streaming: cómo dar tus primeros pasos con Confluent

¿Quieres empezar a procesar datos de CDC en tiempo real con Flink? Crea una cuenta de Confluent e implementa una arquitectura de procesamiento en streaming lista para cualquier entorno.

Prueba Confluent Cloud para Apache Flink ®—disponible en AWS, Google Cloud, Microsoft Azure— para crear aplicaciones que aprovechen Kafka y Flink de forma mucho más rentable y con toda la simplicidad de un entorno cloud-native y sin servidor.

Además, con Confluent Platform para Apache Flink®, puedes trasladar tus cargas de trabajo actuales de Flink a una plataforma de streaming de datos self-managed, lista para desplegarse en tus instalaciones on-prem o en tu nube privada.

Confluent Cloud

Servicio cloud-native totalmente gestionado para Apache Kafka®

Para recibir asistencia técnica personalizada de un experto de Confluent, introduce un correo electrónico de empresa.
País
  • País
  • Afganistán
  • Albania
  • Alemania
  • Andorra
  • Angola
  • Anguila
  • Antártida
  • Antigua y Barbuda
  • Arabia Saudita
  • Argelia
  • Argentina
  • Armenia
  • Aruba
  • Australia
  • Austria
  • Azerbaiyán
  • Bahamas
  • Bahrein
  • Bangladesh
  • Barbados
  • Bélgica
  • Belice
  • Benin
  • Bermudas
  • Bhután
  • Bolivia
  • Bonaire, San Eustaquio y Saba
  • Bosnia y Herzegovina
  • Botswana
  • Brasil
  • Brunei Darussalam
  • Bulgaria
  • Burkina Faso
  • Burundi
  • Cabo Verde
  • Camboya
  • Camerún
  • Canadá
  • Chad
  • Chile
  • China
  • Chipre
  • Colombia
  • Comoras
  • Congo
  • Congo (República Democrática del)
  • Costa de Marfil
  • Costa Rica
  • Croacia
  • Curaçao
  • Dinamarca
  • Djibouti
  • Dominica
  • Ecuador
  • Egipto
  • El Salvador
  • Emiratos Árabes Unidos
  • Eritrea
  • Eslovaquia
  • Eslovenia
  • España
  • Estados Unidos
  • Estonia
  • Etiopía
  • Fiji
  • Filipinas
  • Finlandia
  • Francia
  • Gabón
  • Gambia
  • Georgia
  • Georgia del Sur y las Islas Sandwich del Sur
  • Ghana
  • Gibraltar
  • Granada
  • Grecia
  • Groenlandia
  • Guadeloupe
  • Guam
  • Guatemala
  • Guayana Francesa
  • Guernsey
  • Guinea
  • Guinea Bissau
  • Guinea Ecuatorial
  • Guyana
  • Haití
  • Heard e Islas McDonald
  • Honduras
  • Hong Kong
  • Hungría
  • India
  • Indonesia
  • Iraq
  • Irlanda
  • Isla Bouvet
  • Isla de Man
  • Isla de Navidad
  • Isla Marianas del Norte
  • Isla Norfolk
  • Islandia
  • Islas Åland
  • Islas Caimán
  • Islas Cocos (Keeling)
  • Islas Cook
  • Islas Feroe
  • Islas Malvinas
  • Islas Marshall
  • Islas Salomón
  • Islas Turcas y Caicos
  • Islas Ultramarinas Menores de los Estados Unidos
  • Islas Vírgenes británicas
  • Islas Vírgenes de los Estados Unidos
  • Israel
  • Italia
  • Jamaica
  • Japón
  • Jersey
  • Jordania
  • Kazajstán
  • Kenya
  • Kirguistán
  • Kiribati
  • Kuwait
  • Lesotho
  • Letonia
  • Líbano
  • Liberia
  • Libia
  • Liechtenstein
  • Lituania
  • Luxemburgo
  • Macao
  • Macedonia del Norte
  • Madagascar
  • Malasia
  • Malawi
  • Maldivas
  • Malí
  • Malta
  • Marruecos
  • Martinique
  • Mauricio
  • Mauritania
  • Mayotte
  • México
  • Micronesia
  • Moldavia
  • Mónaco
  • Mongolia
  • Montenegro
  • Montserrat
  • Mozambique
  • Myanmar
  • Namibia
  • Nauru
  • Nepal
  • Nicaragua
  • Níger
  • Nigeria
  • Niue
  • Noruega
  • Nueva Caledonia
  • Nueva Zelanda
  • Omán
  • Países Bajos
  • Pakistán
  • Palau
  • Palestina
  • Panamá
  • Papua Nueva Guinea
  • Paraguay
  • Perú
  • Pitcairn
  • Polinesia Francesa
  • Polonia
  • Portugal
  • Puerto Rico
  • Qatar
  • Reino Unido
  • República Centroafricana
  • República Checa
  • República de Corea
  • República Democrática Popular de Lao
  • República Dominicana
  • Reunión
  • Rumania
  • Rwanda
  • Sahara Occidental
  • Saint Barthélemy
  • Saint Kitts y Nevis
  • Saint Martin (francesa)
  • Samoa
  • Samoa Americana
  • San Marino
  • San Pedro y Miquelón
  • San Vicente y las Granadinas
  • Santa Helena, Ascensión y Tristán de Acuña
  • Santa Lucía
  • Santa Sede
  • Santo Tomé y Príncipe
  • Senegal
  • Serbia
  • Seychelles
  • Sierra Leona
  • Singapur
  • Sint Maarten (neerlandesa)
  • Somalia
  • Sri Lanka
  • Sudáfrica
  • Sudán del Sur
  • Suecia
  • Suiza
  • Suriname
  • Svalbard y Jan Mayen
  • Swazilandia
  • Tailandia
  • Taiwán
  • Tanzania
  • Tayikistán
  • Territorio Británico del Océano Índico
  • Tierras Australes Francesas
  • Timor-Leste
  • Togo
  • Tokelau
  • Tonga
  • Trinidad y Tobago
  • Túnez
  • Turkmenistán
  • Turquía
  • Tuvalu
  • Ucrania
  • Uganda
  • Uruguay
  • Uzbekistán
  • Vanuatu
  • Venezuela
  • Vietnam
  • Wallis y Futuna
  • Yemen
  • Zambia
  • Zimbabwe

Tengo una cuenta. Iniciar sesión

Al hacer clic en «EMPIEZA GRATIS», aceptas los Términos de servicio y la Política de privacidad.

Para recibir asistencia técnica personalizada de un experto de Confluent, introduce un correo electrónico de empresa.
País
  • País
  • Afganistán
  • Albania
  • Alemania
  • Andorra
  • Angola
  • Anguila
  • Antártida
  • Antigua y Barbuda
  • Arabia Saudita
  • Argelia
  • Argentina
  • Armenia
  • Aruba
  • Australia
  • Austria
  • Azerbaiyán
  • Bahamas
  • Bahrein
  • Bangladesh
  • Barbados
  • Bélgica
  • Belice
  • Benin
  • Bermudas
  • Bhután
  • Bolivia
  • Bonaire, San Eustaquio y Saba
  • Bosnia y Herzegovina
  • Botswana
  • Brasil
  • Brunei Darussalam
  • Bulgaria
  • Burkina Faso
  • Burundi
  • Cabo Verde
  • Camboya
  • Camerún
  • Canadá
  • Chad
  • Chile
  • China
  • Chipre
  • Colombia
  • Comoras
  • Congo
  • Congo (República Democrática del)
  • Costa de Marfil
  • Costa Rica
  • Croacia
  • Curaçao
  • Dinamarca
  • Djibouti
  • Dominica
  • Ecuador
  • Egipto
  • El Salvador
  • Emiratos Árabes Unidos
  • Eritrea
  • Eslovaquia
  • Eslovenia
  • España
  • Estados Unidos
  • Estonia
  • Etiopía
  • Fiji
  • Filipinas
  • Finlandia
  • Francia
  • Gabón
  • Gambia
  • Georgia
  • Georgia del Sur y las Islas Sandwich del Sur
  • Ghana
  • Gibraltar
  • Granada
  • Grecia
  • Groenlandia
  • Guadeloupe
  • Guam
  • Guatemala
  • Guayana Francesa
  • Guernsey
  • Guinea
  • Guinea Bissau
  • Guinea Ecuatorial
  • Guyana
  • Haití
  • Heard e Islas McDonald
  • Honduras
  • Hong Kong
  • Hungría
  • India
  • Indonesia
  • Iraq
  • Irlanda
  • Isla Bouvet
  • Isla de Man
  • Isla de Navidad
  • Isla Marianas del Norte
  • Isla Norfolk
  • Islandia
  • Islas Åland
  • Islas Caimán
  • Islas Cocos (Keeling)
  • Islas Cook
  • Islas Feroe
  • Islas Malvinas
  • Islas Marshall
  • Islas Salomón
  • Islas Turcas y Caicos
  • Islas Ultramarinas Menores de los Estados Unidos
  • Islas Vírgenes británicas
  • Islas Vírgenes de los Estados Unidos
  • Israel
  • Italia
  • Jamaica
  • Japón
  • Jersey
  • Jordania
  • Kazajstán
  • Kenya
  • Kirguistán
  • Kiribati
  • Kuwait
  • Lesotho
  • Letonia
  • Líbano
  • Liberia
  • Libia
  • Liechtenstein
  • Lituania
  • Luxemburgo
  • Macao
  • Macedonia del Norte
  • Madagascar
  • Malasia
  • Malawi
  • Maldivas
  • Malí
  • Malta
  • Marruecos
  • Martinique
  • Mauricio
  • Mauritania
  • Mayotte
  • México
  • Micronesia
  • Moldavia
  • Mónaco
  • Mongolia
  • Montenegro
  • Montserrat
  • Mozambique
  • Myanmar
  • Namibia
  • Nauru
  • Nepal
  • Nicaragua
  • Níger
  • Nigeria
  • Niue
  • Noruega
  • Nueva Caledonia
  • Nueva Zelanda
  • Omán
  • Países Bajos
  • Pakistán
  • Palau
  • Palestina
  • Panamá
  • Papua Nueva Guinea
  • Paraguay
  • Perú
  • Pitcairn
  • Polinesia Francesa
  • Polonia
  • Portugal
  • Puerto Rico
  • Qatar
  • Reino Unido
  • República Centroafricana
  • República Checa
  • República de Corea
  • República Democrática Popular de Lao
  • República Dominicana
  • Reunión
  • Rumania
  • Rwanda
  • Sahara Occidental
  • Saint Barthélemy
  • Saint Kitts y Nevis
  • Saint Martin (francesa)
  • Samoa
  • Samoa Americana
  • San Marino
  • San Pedro y Miquelón
  • San Vicente y las Granadinas
  • Santa Helena, Ascensión y Tristán de Acuña
  • Santa Lucía
  • Santa Sede
  • Santo Tomé y Príncipe
  • Senegal
  • Serbia
  • Seychelles
  • Sierra Leona
  • Singapur
  • Sint Maarten (neerlandesa)
  • Somalia
  • Sri Lanka
  • Sudáfrica
  • Sudán del Sur
  • Suecia
  • Suiza
  • Suriname
  • Svalbard y Jan Mayen
  • Swazilandia
  • Tailandia
  • Taiwán
  • Tanzania
  • Tayikistán
  • Territorio Británico del Océano Índico
  • Tierras Australes Francesas
  • Timor-Leste
  • Togo
  • Tokelau
  • Tonga
  • Trinidad y Tobago
  • Túnez
  • Turkmenistán
  • Turquía
  • Tuvalu
  • Ucrania
  • Uganda
  • Uruguay
  • Uzbekistán
  • Vanuatu
  • Venezuela
  • Vietnam
  • Wallis y Futuna
  • Yemen
  • Zambia
  • Zimbabwe

Tengo una cuenta. Iniciar sesión

Al hacer clic en «EMPIEZA GRATIS», aceptas los Términos de servicio y la Política de privacidad.

Streaming CDC With Flink | FAQs

How does a streaming approach improve on batch ELT/ETL pipelines?

A streaming approach allows you to "shift left," processing and governing data closer to the source. Instead of running separate, costly ELT jobs in multiple downstream systems, you process the data once in-stream with Flink to create a single, reusable, high-quality data product. This improves data quality, reduces overall processing costs and risks, and gets trustworthy data to your teams faster.

Why use Apache Flink® for processing real-time CDC Data?

Apache Flink® is the de facto standard for stateful stream processing, designed for high-performance, low-latency workloads—making it ideal for CDC. Its ability to handle stateful computations allows it to accurately interpret streams of inserts, updates, and deletes to maintain a correct, materialized view of data over time. Confluent offers a fully managed, serverless Flink service that removes the operational burden of self-management.

How do you handle data consistency and quality in real-time CDC pipeline?

Data consistency is maintained by processing CDC events in-flight to filter duplicates, join streams for enrichment, and aggregate data correctly before it reaches any downstream system. Confluent's platform integrates Flink with Stream Governance, including Schema Registry, to define and enforce universal data standards, ensuring data compatibility, quality, and lineage tracking across your organization.

How does Confluent Cloud handle changes to the source database schema?

When your CDC pipeline is integrated with Confluent Schema Registry, it can automatically and safely handle schema evolution. This ensures that changes to the source table structure—like adding or removing columns—do not break downstream applications or data integrity. The platform manages schema compatibility, allowing your data streams to evolve seamlessly.

What are the main benefits of using a Fully managed service for Apache Flink® like Confluent Cloud?

A fully managed service eliminates the significant operational complexity, steep learning curve, and high in-house support costs associated with self-managing Apache Flink®. With Confluent, you get a serverless experience with elastic scalability, automated updates, and pay-as-you-go pricing, allowing your developers to focus on building applications rather than managing infrastructure. In addition, native integration between Apache Kafka® and Apache Flink® and pre-built connectors allow teams to build and scale fast.

How does Confluent Cloud simplify processing Debezium CDC events?

Confluent Cloud provides first-class support for Debezium, an open source distributed platform for change data capture. Pre-built connectors can automatically interpret the complex structure of Debezium CDC event streams, simplifying the process of integrating with Kafka and Flink.