Elevating Kafka: Driving operational excellence with Albertsons + Forrester | Watch Webinar

Scrapinghub, Confluent Cloud로 차세대 웹 스크래핑 서비스 가속화

AutoExtract를 제공할 때 Confluent Cloud의 주요 이점은 출시 시간입니다. Kafka 클러스터를 직접 설정할 필요가 없었고 인프라 팀에서 이를 수행할 때까지 기다릴 필요도 없었습니다. Confluent Cloud를 통해 당사는 최첨단 Kafka 클러스터를 신속하게 구축하고 완벽히 원활하게 실행했습니다. 그리고 문제가 발생하면 Confluent의 전문가가 문제를 조사하고 해결할 수 있도록 지원을 제공합니다. 이는 하나의 팀이자 회사로서의 당사에 탁월한 경쟁 우위를 가져다줍니다.

Ian Duffy | DevOps 엔지니어
ScrapingHub

과제

다운타임 없이 증가하는 고객 요구를 처리할 수 있는 차세대 웹 스크래핑 서비스 제공을 가속화합니다.

솔루션

Confluent Cloud 및 Apache Kafka를 사용하여 웹 크롤러를 AI 지원 데이터 추출 구성 요소와 연결하는 안정적이고 확장 가능한 이벤트 스트리밍 백본을 구현합니다.

결과

  • 배포 시간 절반으로 단축
  • 몇 분 안에 초기 설정 완료
  • 100%의 출시 후 가동 시간
  • 클라우드 공급업체에 대한 종속 없이 지연 시간 최소화
scrapinghub-featured

Each day thousands of companies and more than a million developers rely on Scrapinghub tools and services to extract the data they need from the web. To strengthen its position as a market leader, Scrapinghub recently launched a new product, AutoExtract, that provides customers with AI-enabled, automated web data extraction at scale. Scrapinghub built AutoExtract on Confluent Cloud running on Google Cloud Platform (GCP), with an Apache Kafka®-based, event-streaming backbone for its service architecture. These technologies were chosen to shorten time to market, and to ensure reliability and scalability.

Resources

Scrapinghub, Confluent Cloud로 차세대 웹 스크래핑 서비스 가속화

Scrapinghub의 AutoExtract가 Kafka 요구에 Confluent Cloud를 선택한 이유

더 많은 고객 사례

SSC lgho

SecurityScorecard는 Confluent를 활용하여 대규모 실시간 360도 보안 예방 및 대응을 비용 효율적으로 지원합니다

Singapore Exchange, Confluent를 활용한 거래 플랫폼 업데이트로 지연 시간 및 처리량 개선

Storyblocks logo

Storyblocks는 Confluent와 협력하여 데이터 파이프라인을 재설계하고 기술 부채를 대폭 절감합니다.