Queryutføring

Algoritmer for queryprosessering og optimalisering, kap. 18 + notat

Fra Query til resultat (18.1)

Indeksering: Bruk WHERE-uttrykk til å trekke ut små mengder poster (seleksjon, join)
Iterasjon: Ofte er det raskest å scanne hele tabeller
Partisjonering: Sortering og hashing av input gir operasjoner på mindre datamengder
NTNU er kjent som pionerer på hashbaserte metoder (partisjonering). Kjell Bratbergsengen, VLDB 1984.

Partisjonering – Sorterer deler (partisjoner) som får plass i RAM
- Antall deler (partisjoner): nR
- Antall blokker av data: b
- Tilgjengelige buffer: nB
Fletting – Flett sammen sorterte delfiler i et antall pass – Flettegrad dM – antall delfiler som kan flettes i hvert pass – Flettepass – antall pass som filene må flettes i

J1: Nested-loop join – For hver blokk i den ene tabellen
- Scan hele den andre tabellen og se etter match
J2: Single-loop join (index nested loop)
- Loop gjennom den ene tabellen og bruk en indeks for å slå opp i den andre
J3: Sort-merge join:
- Hvis begge tabellene er sorterte på joinattributtene, kan vi bare flette de
- Hvis ikke, kan de sorteres først, og så flettes
J4: Partition-hash join
- Partisjoner tabellene ved hashing på joinattributtene
- Får mange små partisjoner som kan joines parvis i RA