Apache Flink ist ein open-source, verteiltes Hochleistungs-Computing-Framework, das für die Verarbeitung großer Datenströme und Batchdaten entwickelt wurde. Es ist bekannt f… Read More
O Apache Kafka é uma plataforma de streaming de mensagens de alto desempenho, desenvolvida pela Apache Software Foundation. Ele foi projetado para lidar com volumes massivos de dados… Read More
MLOps, oder Machine Learning Operations, ist ein aufstrebender Bereich, der die Prinzipien von DevOps mit Machine Learning kombiniert, um den Lebenszyklus von Machine Learning zu verwalten u… Read More
De sistemas operacionais a mecanismos de segurança e fluxo de dados, transparência e inclusão são a essência do código aberto. Por meio da troca de… Read More
Apache Parquet ist ein open-source, spaltenorientiertes Dateiformat und zählt zu den NoSQL Datenbanken. Es ermöglicht die effiziente Datenspeicherung von großen Datenmengen u… Read More
Das CAP Theorem beschreibt insgesamt drei Eigenschaften von Datenbanken auf verteilten Systemen, die nie alle gleichzeitig erfüllt sein können. CAP steht dabei als Abkürzung f… Read More
Cloudera Data Platform (CDP) is a cloud computing platform for businesses. It provides integrated and multifunctional self-service tools in order to analyze and centralize data. It brings… Read More
Die Normalisierung bezeichnet ein Konzept aus dem Datenbankdesign mit dem Ziel, die Redundanzen, also die Dopplungen in der Datenbank, zu eliminieren. Dadurch lässt sich Speicherplatz s… Read More
CSV ist die Abkürzung für Comma Separated Values und ist ein häufig genutztes Dateiformat beim Austausch von strukturierten Daten. Es wird von vielen gängigen Datenbanken… Read More
Der Modern Data Stack ist Cloud-basiert und bietet ein Data Warehouse, das sich in der Cloud befindet. Dies gewährleistet eine schnelle und effiziente Datenverarbeitung. Optimalerweise… Read More
Você já ouviu falar de Fundamentos de Big Data?
Sumi um pouco aqui do site, mas por um bom motivo: estudos, estudos e mais estudos (rs).
Conheci a área de aná… Read More
Das Apache Hadoop Distributed Filesystem (kurz: HDFS ist ein verteiltes Filesystem, um große Datenmengen im Bereich von Big Data abspeichern und auf verschiedenen Computern verteilen z… Read More
Das Online Transaction Processing (kurz: OLTP) beschreibt die gleichzeitige Verarbeitung von mehreren sogenannten Transaktionen. Zu den Transaktionen zählen beispielsweise Abhebungen am… Read More
JSON ist die Abkürzung für das Dateiformat JavaScript Object Notation. Es beschreibt ein standardisiertes Datenformat zur Speicherung von Daten. Es zählt zu den Textdateiforma… Read More
In diesem Artikel findest Du die wichtigsten SQL Befehle zur grundlegenden Arbeit mit relationalen Datenbanken. Die Structured Query Language (SQL) ist die am häufigsten genutzte Sprach… Read More
Online Analytical Processing (kurz: OLAP) ist eine Technologie zur Organisation von großen, unübersichtlichen Datenbanken, damit sie für Business Intelligence Anwendungen aus… Read More
XML steht für Extensible Markup Language und dient heutzutage als textbasiertes Datenformat zum Austausch von strukturierten Daten. Es war ursprünglich dafür entwickelt um HTM… Read More
Die Abkürzung ACID (Atomicity, Consistency, Isolation, Durability) ist ein Begriff aus der Datenbanktheorie und beschreibt Regeln und Vorgehensweisen bei Datenbanktransaktionen. Wenn di… Read More
Was ist SQL?
SQL ist eine Programmiersprache, die in den 1970er Jahren entwickelt wurde.
Lösungen für Softwareentwicklung entdecken
Was ist SQL?
Merk… Read More
Um dos setores mais importantes do mundo moderno é a indústria tecnológica e no Brasil isso não é exceção. Este setor representa 6,9% do PIB… Read More
Para que serve o Big Data ?
Big data é um termo que descreve grandes volumes de dados difíceis de gerenciar – estruturados e não estruturados – Isto é… Read More
In this article, we will figure out what is considered Big Data and what is not, how to store, process and benefit from this information.
Definition of Big Data
These are Petabytes (an… Read More
A Apache Software Foundation publicou um relatório do ano fiscal de 2019 destacando seus mais de 350 projetos/iniciativas de código aberto. Além disso, o relatóri… Read More
Analisado em um relatório publicado pela empresa de segurança Zscaler, a nova ameaça DreamBus (executada em servidores Linux) é uma variante de um botnet mais ant… Read More
(also available in english)
Wir freuen uns, die Verfügbarkeit von Azure HDInsight in der Microsoft Cloud Deutschland bekanntgeben zu können.
Azure HDInsight macht die Hadoop-Kompon… Read More
Ever since the evolution of big data, it speaks big by making promises in terms of business value, but it can be difficult for businesses to determine how to go about deploying the architec… Read More