Zuletzt aktualisiert am 17.02.2026 9 Minuten Lesezeit

HashMap

Eine HashMap (auch Hashtabelle oder Hash Table genannt) ist eine Datenstruktur, die Schlüssel-Wert-Paare speichert und einen extrem schnellen Zugriff auf Daten ermöglicht. Das Besondere: Im Durchschnitt benötigen Einfügen, Suchen und Löschen nur konstante Zeit O(1) - unabhängig davon, wie viele Elemente gespeichert sind.

HashMaps nutzen eine Hashfunktion, um aus einem Schlüssel einen numerischen Index zu berechnen. Dieser Index bestimmt, wo der zugehörige Wert im internen Array gespeichert wird. Dadurch kann ein Wert direkt gefunden werden, ohne die gesamte Datenstruktur durchsuchen zu müssen - ein entscheidender Vorteil gegenüber Listen oder Arrays.

Wie funktioniert eine HashMap?

Das Grundprinzip einer HashMap basiert auf drei Komponenten: dem Schlüssel, der Hashfunktion und dem Bucket-Array.

Das Bucket-Array

Intern verwendet eine HashMap ein Array fester Größe. Jede Position in diesem Array wird als Bucket bezeichnet. Wenn du einen Wert speicherst, berechnet die HashMap zunächst den Hashwert des Schlüssels und ermittelt daraus den Index:

index = hashFunction(schlüssel) % arrayGröße

Der Modulo-Operator (%) stellt sicher, dass der Index immer innerhalb der Array-Grenzen liegt. Bei einem Array der Größe 16 ergibt der Hashwert 42 beispielsweise den Index 10 (42 % 16 = 10).

Beispiel: Speichern eines Wertes

Angenommen, du möchtest den Namen "Max" mit dem Alter 25 in einer HashMap speichern:

1. Schlüssel: "Max"
2. Hashwert berechnen: hashFunction("Max") = 7842
3. Index berechnen: 7842 % 16 = 2
4. Speichern: bucket[2] = {"Max", 25}

Beim späteren Abrufen wird derselbe Prozess durchlaufen: Der Hashwert von "Max" wird berechnet, der Index ermittelt, und der Wert kann direkt aus dem entsprechenden Bucket gelesen werden.

Kollisionen und deren Behandlung

Eine Kollision tritt auf, wenn zwei unterschiedliche Schlüssel denselben Hashwert und damit denselben Index erzeugen. Das ist mathematisch unvermeidlich, da die Anzahl möglicher Schlüssel praktisch unbegrenzt ist, während das Array eine feste Größe hat.

Separate Chaining (Verkettung)

Bei dieser Methode enthält jeder Bucket eine verkettete Liste. Wenn mehrere Schlüssel auf denselben Index hashen, werden ihre Werte einfach an die Liste angehängt. Bei der Suche wird erst der richtige Bucket gefunden und dann die Liste durchsucht.

Bucket[2]: [{"Max", 25}] -> [{"Tim", 30}] -> [{"Anna", 28}]

Diese Methode ist einfach zu implementieren und funktioniert auch bei vielen Kollisionen. Der Nachteil: Bei schlechter Hashfunktion können lange Listen entstehen, die die Suche verlangsamen.

Open Addressing (Offene Adressierung)

Bei Open Addressing werden alle Elemente direkt im Array gespeichert. Ist ein Bucket bereits belegt, sucht der Algorithmus nach dem nächsten freien Platz. Die einfachste Variante ist lineares Sondieren: Ist Position i belegt, probiere i+1, dann i+2, usw.

Position 2 belegt? -> Prüfe Position 3
Position 3 belegt? -> Prüfe Position 4
Position 4 frei!   -> Speichere hier

Der Vorteil: Keine zusätzlichen Datenstrukturen nötig. Der Nachteil: Bei vielen Kollisionen entstehen Cluster, die die Performance verschlechtern.

Zeitkomplexität

Die Zeitkomplexität ist einer der wichtigsten Gründe für die Beliebtheit von HashMaps. Hier der Vergleich zwischen durchschnittlichem und schlechtestem Fall:

Operation	Durchschnitt	Schlimmster Fall
Einfügen	O(1)	O(n)
Suchen	O(1)	O(n)
Löschen	O(1)	O(n)
Speicherplatz	O(n)	O(n)

Der schlimmste Fall O(n) tritt nur auf, wenn alle Schlüssel zum selben Index hashen - was bei einer guten Hashfunktion extrem selten ist. In der Praxis kannst du von konstanter Zeit O(1) ausgehen.

Der Load Factor

Der Load Factor (Auslastungsfaktor) beschreibt das Verhältnis zwischen gespeicherten Elementen und verfügbaren Buckets:

Load Factor = Anzahl Elemente / Anzahl Buckets

Ein Load Factor von 0,75 (75%) ist ein guter Kompromiss: Die HashMap ist effizient gefüllt, aber Kollisionen bleiben selten. Java verwendet standardmäßig diesen Wert.

Wird der Load Factor überschritten, führt die HashMap ein Rehashing durch: Das interne Array wird vergrößert (typischerweise verdoppelt) und alle Elemente werden neu eingefügt. Das kostet einmalig O(n) Zeit, hält aber die durchschnittliche Performance bei O(1).

HashMap in verschiedenen Programmiersprachen

Praktisch jede moderne Programmiersprache bietet eine HashMap-Implementierung. Die Syntax unterscheidet sich, das Grundprinzip bleibt gleich.

Java: HashMap

import java.util.HashMap;

// HashMap erstellen
HashMap<String, Integer> alter = new HashMap<>();

// Werte einfügen
alter.put("Max", 25);
alter.put("Anna", 30);
alter.put("Tim", 28);

// Wert abrufen
int maxAlter = alter.get("Max"); // 25

// Prüfen ob Schlüssel existiert
if (alter.containsKey("Anna")) {
    System.out.println("Anna ist " + alter.get("Anna") + " Jahre alt");
}

// Über alle Einträge iterieren
for (String name : alter.keySet()) {
    System.out.println(name + ": " + alter.get(name));
}

// Eintrag entfernen
alter.remove("Tim");

Java bietet neben HashMap auch LinkedHashMap (behält Einfügereihenfolge) und TreeMap (sortiert nach Schlüsseln, aber O(log n)). Für Multithreading-Szenarien gibt es ConcurrentHashMap.

Python: Dictionary

# Dictionary erstellen
alter = {
    "Max": 25,
    "Anna": 30,
    "Tim": 28
}

# Alternativ: dict() Konstruktor
alter = dict(Max=25, Anna=30, Tim=28)

# Wert abrufen
max_alter = alter["Max"]  # 25

# Sicherer Zugriff mit Standardwert
alter_oder_default = alter.get("Lisa", 0)  # 0 falls nicht vorhanden

# Prüfen ob Schlüssel existiert
if "Anna" in alter:
    print(f"Anna ist {alter['Anna']} Jahre alt")

# Über alle Einträge iterieren
for name, jahre in alter.items():
    print(f"{name}: {jahre}")

# Eintrag entfernen
del alter["Tim"]

JavaScript: Map und Object

// Map erstellen (empfohlen für Schlüssel-Wert-Paare)
const alter = new Map();

// Werte einfügen
alter.set("Max", 25);
alter.set("Anna", 30);
alter.set("Tim", 28);

// Wert abrufen
const maxAlter = alter.get("Max"); // 25

// Prüfen ob Schlüssel existiert
if (alter.has("Anna")) {
    console.log(`Anna ist ${alter.get("Anna")} Jahre alt`);
}

// Anzahl der Einträge
console.log(alter.size); // 3

// Über alle Einträge iterieren
for (const [name, jahre] of alter) {
    console.log(`${name}: ${jahre}`);
}

// Eintrag entfernen
alter.delete("Tim");

// Alternativ: Klassisches Object (nur String-Schlüssel)
const alterObj = { Max: 25, Anna: 30, Tim: 28 };

C++: unordered_map

#include <iostream>
#include <unordered_map>
#include <string>

int main() {
    // unordered_map erstellen
    std::unordered_map<std::string, int> alter;

    // Werte einfügen
    alter["Max"] = 25;
    alter["Anna"] = 30;
    alter.insert({"Tim", 28});

    // Wert abrufen
    int maxAlter = alter["Max"]; // 25

    // Prüfen ob Schlüssel existiert
    if (alter.find("Anna") != alter.end()) {
        std::cout << "Anna ist " << alter["Anna"] << " Jahre alt" << std::endl;
    }

    // Über alle Einträge iterieren
    for (const auto& [name, jahre] : alter) {
        std::cout << name << ": " << jahre << std::endl;
    }

    // Eintrag entfernen
    alter.erase("Tim");

    return 0;
}

Typische Anwendungsfälle

HashMaps sind in der Softwareentwicklung allgegenwärtig. Hier sind einige typische Einsatzszenarien:

Caching und Memoization

Bereits berechnete Ergebnisse werden gespeichert, um teure Berechnungen zu vermeiden. Bei erneutem Aufruf mit gleichen Parametern wird das gespeicherte Ergebnis zurückgegeben:

# Fibonacci mit Memoization
cache = {}

def fibonacci(n):
    if n in cache:
        return cache[n]
    if n <= 1:
        return n
    result = fibonacci(n-1) + fibonacci(n-2)
    cache[n] = result
    return result

Duplikate erkennen

Um Duplikate in einer Liste zu finden, speicherst du jedes Element in einer HashMap. Existiert es bereits, hast du ein Duplikat gefunden - in O(n) statt O(n²) Zeit:

public boolean hatDuplikate(int[] zahlen) {
    HashMap<Integer, Boolean> gesehen = new HashMap<>();
    for (int zahl : zahlen) {
        if (gesehen.containsKey(zahl)) {
            return true;
        }
        gesehen.put(zahl, true);
    }
    return false;
}

Häufigkeiten zählen

Wie oft kommt jedes Element vor? Mit einer HashMap lässt sich das elegant lösen:

def zaehle_woerter(text):
    woerter = text.lower().split()
    haeufigkeit = {}

    for wort in woerter:
        if wort in haeufigkeit:
            haeufigkeit[wort] += 1
        else:
            haeufigkeit[wort] = 1

    return haeufigkeit

text = "Der Hund sah den anderen Hund"
print(zaehle_woerter(text))  
# {'der': 1, 'hund': 2, 'sah': 1, 'den': 1, 'anderen': 1}

Two-Sum Problem

Ein klassisches Interview-Problem: Finde zwei Zahlen in einem Array, die zusammen einen Zielwert ergeben. Mit HashMap in O(n):

def two_sum(zahlen, ziel):
    gesehen = {}  # Zahl -> Index

    for i, zahl in enumerate(zahlen):
        komplement = ziel - zahl
        if komplement in gesehen:
            return [gesehen[komplement], i]
        gesehen[zahl] = i

    return None

print(two_sum([2, 7, 11, 15], 9))  # [0, 1] -> 2 + 7 = 9

HashMap vs. andere Datenstrukturen

Die Wahl der richtigen Datenstruktur hängt vom Anwendungsfall ab:

Datenstruktur	Suchen	Einfügen	Sortiert	Anwendungsfall
HashMap	O(1)	O(1)	Nein	Schneller Zugriff nach Schlüssel
Array	O(n)	O(1)	Nein	Index-basierter Zugriff
TreeMap	O(log n)	O(log n)	Ja	Sortierte Schlüssel benötigt
LinkedList	O(n)	O(1)	Nein	Häufiges Einfügen/Löschen am Anfang

Verwende eine HashMap, wenn du schnellen Zugriff über einen Schlüssel brauchst und die Reihenfolge unwichtig ist. Brauchst du sortierte Daten, ist eine TreeMap besser. Für reinen Index-Zugriff reicht ein Array.

Vor- und Nachteile

Vorteile

Schneller Zugriff: O(1) für Einfügen, Suchen und Löschen
Flexible Schlüssel: Beliebige Objekte als Schlüssel möglich
Effizient bei großen Datenmengen: Millionen Einträge ohne Performance-Einbußen
Einfache API: Intuitive Methoden in allen Programmiersprachen

Nachteile

Keine Sortierung: Elemente werden nicht geordnet gespeichert
Speicherverbrauch: Höher als bei Arrays durch interne Strukturen
Schlechte Hashfunktion: Kann Performance auf O(n) verschlechtern
Nicht für Bereichsabfragen: "Alle Schlüssel zwischen A und M" nicht effizient möglich

Best Practices

Für den effizienten Einsatz von HashMaps solltest du einige Punkte beachten:

Initiale Kapazität setzen: Wenn du die ungefähre Anzahl der Elemente kennst, setze die initiale Größe entsprechend, um Rehashing zu vermeiden
hashCode() und equals() korrekt implementieren: Bei eigenen Klassen als Schlüssel müssen beide Methoden konsistent sein
Immutable Schlüssel verwenden: Ändert sich der Hashwert eines Schlüssels nach dem Einfügen, ist der Wert nicht mehr auffindbar
Load Factor verstehen: Standardwerte (0,75) sind meist gut, aber für spezielle Anforderungen anpassbar

HashMap in der IT-Ausbildung

Als angehender Fachinformatiker für Anwendungsentwicklung wirst du HashMaps regelmäßig verwenden - von einfachen Konfigurationsspeichern bis zu komplexen Caching-Lösungen. Das Verständnis der Big-O-Notation hilft dir dabei, die richtige Datenstruktur für jeden Anwendungsfall zu wählen.

Auch für Fachinformatiker für Systemintegration sind HashMaps relevant: Viele Konfigurationsdateien (JSON, YAML) basieren auf dem Schlüssel-Wert-Prinzip, und Monitoring-Tools nutzen HashMaps zur effizienten Speicherung von Metriken.

Quellen und weiterführende Links

Java HashMap Dokumentation - Offizielle Oracle-Dokumentation
Python Dictionary Dokumentation - Python-Tutorial zu Dictionaries
MDN: JavaScript Map - Mozilla Developer Network
C++ unordered_map - C++ Referenz
Wikipedia: Hashtabelle - Ausführlicher Überblick

Zurück zum Lexikon