Wiki ‣ Kobold AI

Dubletten in Daten verursachen viele Probleme - Zeit sie zu entfernen

Dubletten in den Daten: Warum die Beseitigung von Duplikaten unerlässlich ist

In der heutigen digitalen Welt sammeln Unternehmen täglich eine enorme Menge an Daten. Diese Daten werden verwendet, um Entscheidungen zu treffen, Trends …

Data Literacy ist fundamental für die Zukunftsfähigkeit von Unternehmen

Data Literacy Guide: Definition, Methoden und Framework

Da die Welt von Tag zu Tag vernetzter und datengesteuerter wird, ist es für Fachleute in allen Bereichen unerlässlich, effektiv auf Daten …

Generative KI brigt riesiges Potential - aber auch einige Risiken

Generative Artificial Intelligence (GAI): Alles was man wissen muss (Guide)

Dieser Artikel ist ein umfassender Leitfaden zur generativen KI (englisch “Generative Artificial Intelligence”, GAI). Es diskutiert die Konzepte hinter der generativen KI, …

Wiederkäufer sind oft zentral für B2B und B2C Unternehmen - Zeit sie besser zu verstehen

Wiederkäufer als Erfolgsfaktor für Unternehmen

Wiederkäufer sind Kunden, die bereits einmal einen Kauf bei einem Unternehmen getätigt haben und erneut einkaufen. Sie sind von großer Bedeutung für …

Schritt für Schritt: Wie man ein Data Governance-Programm einführt

Was ist Data Governance? Data Governance ist der Prozess der Verwaltung, Überwachung und Schutz von Daten innerhalb eines Unternehmens oder einer Organisation. …

Customer Lifetime Value (CLTV): Bedeutung & Berechnung

Customer Lifetime Value (CLTV) definiert die zu erwartende Gesamtsumme an Umsatz von einem Kunden bzw. einer Gruppe an Kunden.

Der Decision Scientist – ein aufgehender Stern in der Daten-Welt

Der Decision Scientist nutzt Daten und Algorithmen um Entscheidungen zu treffen; Data Science wird auf dem Weg zur Optimierung als Werkzeug eingesetzt.

Der Data Steward: Rolle, Aufgaben und Ziele

Data Steward: Rolle, Aufgaben und Ziele erklärt

Der Data Steward ist eine neue Rolle, die mit der nachhaltigen Dokumentation, Qualitätskontrolle und Zugänglichkeit von Daten beauftragt ist.

Was ist kaggle? Die Data Science Plattform einfach erklärt

Kaggle ist eine auf Wettbewerbe im Bereich Machine Learning spezialisierte Plattform, die mit oft sehr hohen Preisgeldern lockt.

Fünf rote Spielfiguren in einer Gruppe mit einer schwarzen Spielfigur in einer anderen, die etwas abseits ist

Der Clustering Guide: Definition, Methoden und Beispiele

Clustering bezeichnet die algorithmische Einordnung von Objekten, meist Daten, in Gruppen. Wir zeigen Methoden und Beispiele von Clusteranalysen.

Was sind unstrukturierte Daten: Definition und Beispiele

Unstrukturierte Daten: Wie sind sie definiert und welche Rolle werden sie in Zukunft spielen? Wir erklären alles, was man dazu wissen muss.

Der Data Warehouse (DWH) Guide: Alles was man wissen muss

Ein Data Warehouse speichert strukturierte Daten für analytische Verwendung. Wir definieren die Architektur und beantworten häufige Fragen.

Was ist Amazon Kendra? Review des Suchservices von AWS

Kendra ist die neue Suchengine von Amazon Web Services (AWS), die den Zugang zu Informationen mittels Machine Learning erleichtern soll. Mit Kendra …

Ein TV-Gerät auf einer TV-Bank, auf dem Display Netflix

Alles zu Collaborative Filtering: Algorithmen, Beispiele, Probleme

Collaborative Filtering ist eine Algorithmenkategorie für Empfehlungssysteme, die das Verhalten einer Gruppe für Vorhersagen nutzt.

Vier Microcomputer auf blauem Hintergrund

Alles zu Edge Computing: Definition, Probleme, Beispiele

Edge Computing bezeichnet die Erfassung und Analyse von Daten direkt auf (mobilen) Geräten. Dazu zählen Mobiltelefone, Sensoren und mehr.

Was sind eigentlich Daten?

Es sprechen alle über Daten und deren Auswertung. Doch was sind eigentlich genau Daten und wie können sie definiert werden?

Was ist der Unterschied zwischen Künstlicher Intelligenz, Maschinellen Lernen, Neuronalen Netzwerken und Deep Learning?

Machine Learning vs. Deep Learning: Was ist der Unterschied?

Machine Learning ist ein großes Feld mit einer Vielzahl an Methoden. Eine davon sind Neuronale Netze. Eine Unterart davon sind Deep Learning Netze.

Neuronen die ein wolkenartiges Gehirn formieren

Künstliche neuronale Netze und Deep Learning einfach erklärt

Die Grundlage von neuronalen Netzen in der künstlichen Intelligenz sind Layer, die aus Input-Information abstrahieren können und somit nicht linear arbeiten.

CRISP DM: Das Modell einfach erklärt (mit Infografik)

CRISP-DM steht für „CRoss Industry Standard Process for Data Mining“ und standardisiert den Einsatz von Data Mining durch 6 Schritte.

Was ist Google Data Studio und was kann es?

Google Data Studio ist eine kostenlose Visualisierungssoftware aus dem Hause Google. Doch was kann es und wo sind die Limits?

Big Data anhand seiner Merkmale einfach erklärt

Big Data bezeichnet Daten die in Größe, Art oder Varianz nicht mehr einfach verarbeitet werden können. Der Einsatz von 6 Vs unterstützt bei der Definition.

Data Warehouse vs Data Lake: Der Unterschied einfach erklärt

Einfach gesagt liegt der Unterschied zwischen einem Data Warehouse und einem Data Lake in Art der Daten, Pflege des Inhalts und Anwendungszweck.

Der Data Scientist: Alles was man wissen muss (mit Infografik)

Der Data Scientist agiert im Feld zwischen Datenvorbereitung, Analyse und künstlicher Intelligenz. Sein klares Ziel ist Mehrwert durch den Einsatz von Daten.

Was ist Big Data Veracity? Definition und Beispiele

Die 6 Vs von Big Data sind Volumen, Velocity, Variety, Value, Variability und Veracity. Veracity definiert dabei die Qualität der Daten in Herkunft und Inhalt.

Data Science: Ultimativer Guide zu allem was man wissen muss

Data Science: Alles was man wissen muss (mit Infografik)

Die Datenwissenschaft gewinnt immer mehr an Relevanz. Hier geben wir eine klare Definition und zeigen Beispiele für die Anwendung von Data Science.

Internet of things (IoT): Definition, Technologie & Beispiele

Das Internet of Things (Internet der Dinge) bringt physische Dinge in die digitale Welt und erlaubt neue Analysen, Services und Personalisierung.

Feature Engineering: Erklärung, Methoden und Beispiele

Feature Engineering nennt man die Transformation von Rohdaten in passende Attribute für das Training eines Machine Learning Modells.

Data Mining: Definition, Merkmale und Tools

Was ist Data Mining? Definition, Methoden und Tools

Data Mining ist die explorative Suche nach Mustern in großen Datensätzen. Dieser Artikel erklärt Definition, Methoden, Tools, Rollen und Probleme.

Was ist Big Data? Definition, Merkmale und Technologien

Was genau ist Big Data, welche Merkmale werden damit assoziiert und welche Technologien dafür eingesetzt? Diese Fragen beantwortet dieser Artikel.

Eine alte Schreibmaschine neben einem modernen Laptop

Was ist ein Legacy System? Probleme und Lösungen

Als Legacy System (deutsch: „Altsystem“) wird ein veraltetes System bezeichnet, das aufgrund des Aufwands noch nicht ersetzt wurde.

Big Data Value: Was ist das? Definition und Beispiele

Big Data Value ist eines der Merkmale für Big Data. Dieser Wert definiert das Potential, Daten innovativ oder optimierend einzusetzen.

Eine abstrakte Darstellung von künstlichen Netzen auf die eine Roboterhand zugreift

Was ist künstliche Intelligenz (KI)? Definition und Beispiele

Künstliche Intelligenz bezeichnet Computerprogramme, die menschliches Verhalten nachahmen. Wir geben Einblick in Methoden und Beispiele.

Programmier-Code auf Bildschirmen von denen eine Brille liegt

Was ist Explainable AI (XAI)? Alles was man wissen muss

Explainable AI (XAI) beschreibt die Herausforderung, dass das Ergebnis von Algorithmen der künstlichen Intelligenz für Menschen interpretierbar sind.

Was ist Synthetic Data? Definition und Beispiele

Synthetic Data beschreibt künstlich erzeugte Daten, die in Bereichen wie Machine Learning und Softwareprogrammierung eingesetzt werden.

Was sind Deep Fakes und wie funktionieren sie?

Deepfakes sind durch künstliche Intelligenz erzeugte Inhalte (z.B. Videos), die sich von realem Material kaum unterscheiden lassen.

Ein in der Hand gehaltenes Mobiltelefon mit Analysen

Was ist Smart Data? Definition und Erklärung des Begriffs

Smart Data sind Daten, die zur Nutzung in sowohl Datenqualität als auch Bereitstellung für Analysen und künstliche Intelligenz aufbereitet wurden.

Was sind Digital Twins? Digitale Zwillinge einfach erklärt

Als Digital Twins bezeichnet man das digitale Abbild von realen Entitäten. Das Ziel ist die Kombination aller relevanten Daten und dazugehörige Analysen.

Was ist ein Data Lake? Definition, Architektur und Use Cases

Ein Data Lake (Datensee) erfasst strukturierte und unstrukturierte Daten zur Weiterverarbeitung durch Data Science, Advanced Analytics und KI.

Datenqualität: Definition, Merkmale und Analyse (Guide)

Datenqualität ist eines der bestimmenden Themen in vielen Unternehmen. Dieser Artikel vermittelt alles über Definition, Merkmale und Analyse was man wissen muss

Zwei Menschen arbeiten an einer Formel an einer Tafel

Machine Learning Labels einfach erklärt

Was sind Labels für Supervised Machine Learning? Wir definieren das Konzept und erklären, warum Labels so wichtig für überwachtes Lernen sind.

Memory sticks mit einem Label "Storage Engineer"

Data Staging Area: Definition, Grundlagen und Beispiel

Data Staging bezeichnet im ETL-Prozess den Bereich der Extraktion und Transformation von Daten als Basis für ein Data Warehouse.

Ein Tablet mit der Aufschrift "CONNECT" als Sinnbild der Digitalisierung

Was ist Digitalisierung? Eine einfache Erklärung.

Digitalisierung bezeichnet die Umstellung von analog-manuellen Prozessen, Werkzeugen und Methoden auf digital-automatische.

Customer Churn Prediction ist die Vorhersage von Kundenabwanderung durch Künstliche Intelligenz

Customer Churn Prediction: Vorhersagen, wann Kunden kündigen

Die Vorhersage der Abwanderung von Kunden, genannt Customer Churn Prediction, nutzt Daten und künstliche Intelligenz um gezielt Kunden ans Unternehmen zu binden

Batch Processing vs. Event Stream Processing in Big Data Infrastruktur

Batch Processing verarbeitet größere Datenblöcke, während Event Streams jede einzelne Information bearbeiten. Beide Big Data Methoden haben Vor- und Nachteile.

Der Citizen Data Scientist wird immer weiter an Bedeutung gewinnen.

Citizen Data Scientist: Was er macht und was er kann

Citizen Data Scientists schließen die Lücke zu Data Science indem sie Wissen über KI-Methoden verfügen, aber nicht notwendig die Umsetzung selbst durchführen.

Data Governance ist die umfassende Betrachung von verlässlichen, korrekten und zugänglichen Daten.

Data Governance Guide: Alles was man wissen muss

Data Governance ist die strategische und koordinierte Verwaltung von Daten. Wir stellen Merkmale, ein Framework und Beispiele vor.

Data Analyst und Data Scientist haben eine Bandbreite an unterschiedlichen Aufgaben und Fähigkeiten

Data Analyst vs Data Scientist: Was ist der Unterschied?

Der Unterschied zwischen Data Analyst und Data Scientist liegt in Methoden, verarbeiteten Daten, genutzter Infrastruktur und Tools.

Advanced Analytics nutzt Methoden die über historische Datenanalysen hinaus gehen.

Alles zu Advanced Analytics: Definition, Methoden und Beispiele

Advanced Analytics nutzt Daten und Künstliche Intelligenz um zu verstehen warum Dinge passieren, Prognosen zu erstellen und eine optimale Entscheidung zu geben.

Machine Learning vs. AI: Was ist der Unterschied?

Künstlicher Intelligenz, Maschinelles Lernen, Neuronale Netzwerke und Deep Learning sind hierarchisch aufeinander aufbauende Kategorien im Bereich KI.

Maschinelles Lernen identifiziert Muster in Daten

Machine Learning: Alles was man wissen muss (mit Infografik)

Maschinelles Lernen (Machine Learning, ML) nutzt Algorithmen, um statistische Muster aus Daten zu extrahieren. Die Ziele sind Automatisierung und Vorhersagen.

Self-Supervised Learning nutzt Machine Learning um Labels zu generieren und diese dann am Gesamtdatensatz zu prüfen.

Was ist Self-Supervised Learning? Eine verständliche Definition

Self-Supervised Learning nutzt Machine Learning um automatisch Labels für Algorithmen des überwachten Lernens zu generieren und einzusetzen.

Data Pipelines überführen Daten von einem System ins andere

Was ist eine Data Pipeline? Erklärung und Beispiele

Data Pipelines sind Skripte, die Daten von einem System in ein anderes überführt. Die Daten werden für weitere Verwendung (z.B. BI oder KI) bereitgestellt.

Alles was man zu Data Driven Marketing wissen muss

Was ist Data Driven Marketing? Definition und Beispiele

Was ist Data Driven Marketing? Wir definieren datengetriebenes Marketing und geben klare Beispiele, um die Vorteile aufzuzeigen.

Prescriptive Analytics ist die Abteilung und Umsetzung von Handlungsempfehlungen durch Daten

Prescriptive Analytics – Alles was man wissen muss

Prescriptive Analytics ist die Empfehlung und Umsetzung von Handlungen basierend auf Datenauswertung mittels künstlicher Intelligenz.

Data Mining einfach erklärt – mit Beispielen

Was ist Data Mining? In diesem Artikel geben wir eine einfache Erklärung und zeigen Anwendungsbeispiele wie Daten, Analysen und Data Science eingesetzt werden.

Data Engineer: Zentral für die Bereitstellung der Daten

Der Data Engineer: Alles was man wissen muss (+ Infografik)

Die Hauptaufgabe eines Data Engineers ist die verlässliche Bereitstellung von Daten für Business Intelligence, Data Science und künstliche Intelligenz.

Der Chief Data Officer wird zentral für jedes Unternehmen

Bedeutung und Aufgaben des Chief Data Officers (CDO)

Die Aufgaben des Chief Data Officer (CDO) im Unternehmen liegen an der Schnittstelle von Datenhaltung („Defensive“) und Dateninnovation („Offensive“).

Machine Learning einfach erklärt mit Beispielen

Einfach gesagt nutzt Machine Learning Daten, um Muster zu erkennen. Diese Muster werden eingesetzt um Vorhersagen (z.B. Ähnlichkeiten, Prognosen) zu erstellen.

Die drei Arten von künstlicher Intelligenz

Welche Arten von künstlicher Intelligenz gibt es?

Es gibt drei Arten von künstlicher Intelligenz: Stark, schwach und Superhuman. Manche sind noch weit entfernt real zu werden, andere hingegen schon im Einsatz.

Was ist künstliche Intelligenz (KI) und wieso ist es wichtig?

Künstliche Intelligenz ist die Simulierung menschlicher Verhaltensweisen durch Maschinen. Wir erklären alles, was man zu KI wissen muss.

AI vs KI: Der Unterschied einfach erklärt

Unterschied zwischen AI und KI einfach erklärt

AI, KI, ML, DS und viele mehr Abkürzungen erobern die Welt der Daten. Doch manchmal ist nicht klar, wofür die Begriffe stehen …

Clustering: Gruppen finden durch künstliche Intelligenz

Ähnliche Dinge zu finden ist oft nicht einfach. Vor allem in einer immer größer werdenden Flut von Daten ist es herausfordernd, ähnliche …