Fachkonzept - SQL-Join

Verbinden von Datensätzen in SQL

Will man in SQL Daten aus mehreren Tabellen ausgeben, so werden sog. "Joins" gebildet. Dabei muss der Programmierer angeben, wie die Tabellen miteinander verbunden werden sollen.

Die Abarbeitung eines Joins kann man sich in mehreren Schritten vorstellen:

1. Schritt: Auswahl der Tabellen

Zunächst werden im FROM-Teil alle Tabellen angegeben, die die auszugebenden Daten enthalten. Die Reihenfolge spielt dabei keine Rolle, z.B.:

SELECT *
  FROM land, kontinent

Das Ergebnis ist unerwartet:

Cross Join

Statt nur passende Daten auszugeben, wird jedes Land mit allen Ländern "gekreuzt"; es entsteht ein sog. cross join der Tabellen land und kontinent ("jeder mit jedem").

2. Schritt: Angabe der Verbindung

Gut erkennbar ist, dass die beiden Attribute KNR (einmal aus der land-Tabelle, einmal aus der kontinent-Tabelle) nicht zueinander passen. Diese Verbindung der Tabellen muss explizit bei der Abfrage im SQL-Befehl angegeben werden.

Um Doppeldeutigkeiten der Attributnamen zu vermeiden, wird jedem Attribut der Tabellenname vorangestellt:

SELECT *
  FROM land, kontinent
 WHERE land.KNR = kontinent.KNR

Dies liefert (fast) das gewünschte Ergebnis:

Inner Join

Um zwei Tabellen miteinander zu verbinden (engl. to join), muss im WHERE-Teil des SQL-Befehls eine Joinbedingung angegeben werden.
Diese legt fest, dass nur "passende" Datensätze ausgegeben werden, bei denen der Fremdschlüssel der abhängigen Tabelle zum Primärschlüssel der übergeordneten Tabelle passt (sog. inner join).

3. Schritt: Einschränken des Ergebnisses

Im letzten Schritt kann noch die Anzahl der Datensätze durch weitere Bedingungen eingeschränkt werden. Außerdem sollte die Liste der Attribute eingegrenzt werden (z.B. um die doppelten Angaben aus Fremd- und Primärschlüssel zu entfernen:

SELECT land.Name, land.Einwohner, kontinent.Name
  FROM land, kontinent
 WHERE land.KNR = kontinent.KNR
   AND land.Einwohner > 10

Beachte, dass jetzt bei allen Attributen die zugehörige Tabelle vorangestellt wird.

doppelte Attributnamen

Bei Bedingungen sollten niemals interne Werte der künstlichen Schlüsselattribute verwendet werden. Bedingungen der Form land.KNR='EU' sind sehr fehleranfällig (z.B. wenn intern einmal Schlüssel geändert werden) und können durch Joins ersetzt werden - auch wenn dadurch die Anfrage minimal länger dauert.

X

Fehler melden

X

Suche