Wer wir sind

Seit 10 Jahren fokussieren wir uns auf das Big Data Ökosystem und wir sorgen dafür, dass unsere internationalen Kunden diese Technologien und neue Einsatzmöglichkeiten verstehen und optimal an ihre individuellen Bedürfnisse angepasst bekommen. Weiterlesen…

Was wir machen

Wir entwerfen Architekturen für große unstrukturierte Datenmengen. Wir schaffen robuste Verbindungen zu ihren bestehenden Systemen. Wir implementieren und schulen in Big Data-Technologien. Wir operationalisieren Machine-Learning Modelle und gestalten Arbeitsumgebungen für Data Scientists. Wir helfen ihnen, neuartige Fragen zu stellen. Weiterlesen…

Technologien

Wir skalieren ihre Datenverarbeitung mit Cloud-Diensten, Hadoop-Distributionen oder Streamingtechnologien wie Apache Kafka, Apache Flink oder Apache Spark – On premise, auf Kubernetes oder in der Cloud.  Wir entwickeln auf der Basis von Open-Source Projekten wie Presto, Apache Drill oder Apache Hive Analyseplattformen. Wir realisieren robuste, verzahnte Prozesse – in Echtzeit per Streaming oder auch batch-orientiert.   Weiterlesen…

Aus unserem Developer Blog

Auf unserer englischsprachigen Seite bloggen wir über Technologien und den täglichen Umgang mit Hadoop, Spark, Kafka und co:

Apache Pulsar: configuring tiered-storage (aws s3) via helm

In the third part of our blog post series “getting started with pulsar on kubernetes” we setup tiered storage (aws s3) with pulsar’s helm chart.

Hands on: basic apache pulsar producer and consumer

In the second part of our blog post series “getting started with pulsar on kubernetes” we create a very simple pulsar producer and consumer. It will use json Serde and the project setup includes dockerization of the application and a simple helm chart to deploy it on Kubernetes.

GDELT on SCDF 2.2.0: Implementing an advanced processor to drop duplicate data with kafka streams

In the 4th part of our blog post series “processing GDELT data with SCDF on kubernetes” we will reimplement the deduplication filter from the last post as a kafka streams application including custom SerDes.

Installing Apache Pulsar on Kubernetes using helm

In the first part of our blog post series “getting started with pulsar on kubernetes” we go through the steps of deploying the core components of Apache Pulsar on Kubernetes using Helm.

GDELT on SCDF: Implementing a custom reactive source application

In the second part of our blog post series “processing GDELT data with SCDF on kubernetes” we will create a custom source application based on spring cloud stream and the reactive framework to pull GDELT data and use it in a very simple flow.

GDELT on SCDF: Bootstrapping Spring Cloud Data Flow on Kubernetes

In the first part of our planned blog posts (processing GDELT data with SCDF on kubernetes) we go through the steps to deploy the latest Spring Cloud Data Flow (SCDF) Release 1.7.0 on Kubernetes , including the latest version of starter apps that will be used in the examples.

Vielen Dank an die Organisatoren des Java Forum Nord 2019 #jfn19 , welches wir als Goldsponsor gerne unterstützt haben !