Baustellen-KI: Ein Edge-Gerät für Diebstahlschutz und automatisches Bautagebuch

Baustellen-KI Edge-Gerät überwacht eine Berliner Baustelle

Dieser Artikel ist kein Verkaufsmaterial und kein fertiges Produkt. Er ist eine Roadmap — der aktuelle Stand meiner Überlegungen zu einem kleinen Edge-Gerät, das zwei Probleme derselben Baustelle mit einer einzigen Hardware-Investition adressiert.

Zwei Probleme, eine Baustelle

Eine Rohbau-Baustelle in Berlin hat zwei Zeitscheiben, die heute getrennt behandelt werden.

Tagsüber führt der Bauleiter nach VOB/B § 6 ein Bautagebuch. Zwei bis vier Stunden pro Tag — Fotos sortieren, Gewerke auflisten, Lieferungen vermerken.

Nachts ist dieselbe Baustelle ein leeres Feld mit Kupferkabel, Werkzeug und Dieselgeneratoren. Diebstähle sind kein Einzelfall, sondern Branchenphänomen.

Bisher kauft man dafür zwei Systeme: eine Wachcontainer-Lösung für die Nacht, ein Dokumentations-Abo für den Tag. Beide brauchen dieselbe Infrastruktur — Kameras, Strom, Mobilfunk. Die Idee:

Ein Edge-Gerät, zwei Modi, automatische Umschaltung nach Uhrzeit.

Problem 1: Baustellendiebstahl

Metall-, Werkzeug- und Kraftstoffdiebstahl verursachen dem deutschen Baugewerbe jährlich Schäden im hohen dreistelligen Millionenbereich (Branchenberichte, u.a. VHV/R+V). Für einen Mittelständler mit 5–10 parallelen Baustellen typisch: mehrere Ereignisse pro Jahr, je 5.000–30.000 € Schaden.

Was heute am Markt ist:

  • Mobile Bewachung (Liveye, Dallmeier): 400–800 €/Kamera/Monat
  • Passive NVR-Kameras (Dahua, Hikvision): verhindern nichts
  • Wachdienst: Nachtschicht Berlin 300–400 €/Nacht

Die Lücke: aktive Abschreckung durch Echtzeit-Ansprache, zu einem Preis, der auch für kleinere Baustellen trägt. Genau hier setzt der Nachtmodus an.

Problem 2: Der Bautagebuch-Aufwand

Das Bautagebuch ist vor Gericht zentrale Beweisgrundlage für Nachträge und Bauzeitverlängerungen. Trotzdem wird es erstaunlich manuell geführt — Handyfotos, PlanRadar-Einträge, Excel-Listen, E-Mails.

Der Zeitaufwand: zwei bis vier Stunden pro Tag und Baustelle. Bei zwei parallelen Projekten landet ein Bauleiter schnell bei 20–40 Wochenstunden für Dokumentation. Die Ähnlichkeit zum TGA-Tool-Problem ist kein Zufall.

Was fehlt: ein System, das aus den ohnehin vorhandenen Kamerabildern einen Entwurf erzeugt, den der Bauleiter nur noch prüft und freigibt.

Die Idee: Ein Gerät, zwei Modi

Modus-Umschaltung: Arbeitszeit vs. Nachtmodus nach Uhrzeit

Tagesmodus (Werktags 07:00–17:00)

Jede Stunde wird pro Kamera ein repräsentativer Keyframe ausgewählt. Um 17:00 Uhr fasst ein Vision-Language-Model 10–20 dieser Frames zu einem deutschsprachigen Entwurfs-Bautagebuch zusammen — mit Gewerke-Zählung, erkannten Lieferungen und aggregierten PPE-Beobachtungen.

Nachtmodus (17:00–07:00 und Wochenende)

Dasselbe Gerät, andere Aufgabe: Personenerkennung läuft kontinuierlich. Nach 3-Sekunden-Bestätigung spielt ein Lautsprecher eine deutsche Ansage; parallel geht eine SMS an den Polier, bei Verbleib folgt die Eskalation an einen Sicherheitsdienst.

Die Umschaltung selbst ist keine große Sache — Cron-Regel mit einem modulierten Detector-Profil.

Hardware

Offen, am Markt verfügbar. Keine exotischen Dev-Boards.

Recheneinheit

Raspberry Pi 5 mit AI HAT+ (Hailo-8, 26 TOPS)

Raspberry Pi 5 (8 GB) plus AI HAT+ 26 TOPS mit Hailo-8. Reicht für YOLOv8-Nano auf vier Streams parallel, 1080p, 30 FPS+. Seit November 2025 ist Frigate NVR offiziell Hailo-kompatibel — kein Custom-Treiber mehr.

KomponenteRichtpreis
Raspberry Pi 5 (8 GB)~85 €
AI HAT+ 26 TOPS~120 €
Aktiver Kühler + NVMe + HAT~80 €
PoE-HAT~25 €

Knapp 310 € für den Rechenteil.

Sensorik — zwei Kameratypen

Raspberry Pi AI Camera mit Sony IMX500 Sensor

Die Raspberry Pi AI Camera (Sony IMX500, ~71 €) ist der DSGVO-Trumpf. Die Inferenz läuft auf dem Bildsensor — das Rohbild verlässt den Chip nie. Ideal für Eingangszonen; für den Betriebsrat ein starkes Argument.

PoE-IP-Kamera für 24/7 Außenbereich-Überwachung

Für den Nachtmodus braucht es klassische PoE-Kameras mit IR und IP66 (z.B. Reolink RLC-823A, ~180 €). Rohmaterial wird spätestens nach 72 Stunden automatisch gelöscht.

Architektur

Systemarchitektur: Kamera → Pi 5 → Frigate + VLM → Reports & Alarme

Drei Designentscheidungen:

Offline-first

Fällt 4G aus, läuft der Nachtmodus weiter — er kann nur keine SMS mehr senden. Events werden lokal gepuffert. Auf einer Rohbau-Baustelle ist Netzabdeckung bis zur Gebäudehülle oft problematisch.

Keine Rohvideos in die Cloud

Tagsüber verlassen nur 10–20 Keyframes pro Tag das Gerät, alle mit automatischer Gesichtsunkenntlichmachung. Nachts nur Alarmclips, und auch nur bei bestätigtem Ereignis.

Cloud-Region EU

Als VLM-Provider kommen nur solche in Frage, die in der EU hosten oder das Modell offen veröffentlichen (Qwen3-VL self-hosted auf Hetzner Frankfurt). US-only Endpoints scheiden für Beschäftigtenbilder praktisch aus.

Software-Stack

Frigate NVR Dashboard mit Echtzeit-Objekterkennung

Frigate (MIT)

Das Fundament. Multi-Kamera, Zonen, Ereignis-Review, MQTT, brauchbares Web-UI. Ein YAML-Eintrag genügt für den Hailo-Detector:

detectors:
  hailo8l:
    type: hailo8l

Hailo Model Zoo

Fertige .hef-Dateien für YOLOv8/YOLOv11 und Pose-Estimation, die direkt auf dem Beschleuniger laufen.

Vision-Language-Model

Der eigentliche Grund, warum dieses Projekt 2026 und nicht 2022 sinnvoll wird. Qwen3-VL, Gemini 2.5 Pro, GPT-5 — mit sauberem Prompt liefern alle einen brauchbaren deutschsprachigen Text.

Als Detektor-Inspiration schaue ich auf yihong1120/Construction-Hazard-Detection. Referenz, kein Fork — die AGPL-3.0 dort ist für ein kommerzielles Produkt ungeeignet.

BauRapport-Pipeline

Beispiel eines automatisch generierten Bautagebuchs (PDF)

  1. Keyframe-Grab. FFmpeg, stündlich, pro Kamera. ~40 Bilder/Tag bei 4 Kameras.
  2. Deduplizierung. Perzeptueller Hash + CLIP-Embeddings. Übrig: 10–15.
  3. Face-Blur. Automatisch, nicht optional.
  4. VLM-Prompt. Streng formatiert, sechs feste Abschnitte, verbietet Spekulation.
  5. PDF-Rendering. WeasyPrint, VOB/B-Layout.
  6. Versand. E-Mail + optional PlanRadar-Webhook.

Das Dokument ist vor Freigabe ein Entwurf. Das Tool nimmt dem Bauleiter nicht die juristische Verantwortung ab — es ersetzt das leere Blatt.

Roadmap

Roadmap Woche 1 bis 12: vom Prototyp zum Pilotprojekt

Phase 1 — Hardware (Woche 1–4)

Beschaffung, Frigate + Hailo, erste Streams. M1: Personenerkennung läuft in Echtzeit.

Phase 2 — Nachtmodus (Woche 3–6)

ByteTrack-Bestätigung, PoE-Lautsprecher-Ansage, SMS via Twilio. M2: Nachtmodus MVP in der Werkstatt.

Phase 3 — Tagesmodus (Woche 5–9)

Keyframe-Pipeline, VLM-Integration, PDF-Vorlage, Versand. M3: Erstes vollautomatisches Bautagebuch.

Phase 4 — Pilot (Woche 9–12)

IP65-Gehäuse, 4G-Backup, Pilotbaustelle Berlin. M4: Pilot gestartet, erste Betriebsdaten.

Compliance

Keine Rechtsberatung. Stand meiner Recherche. Wird vor dem Pilot mit einem Fachanwalt abgestimmt.

DSGVO

Nachtmodus (leere Baustelle): berechtigtes Interesse nach Art. 6 Abs. 1 lit. f. Voraussetzungen: Hinweisschilder, Kontaktangaben, automatische Löschung nach 72 Stunden.

Tagesmodus (erfasst Beschäftigte): greift § 26 BDSG, "erforderlich" wird eng ausgelegt. Die Strategie ist deshalb aggregierte, pseudonyme Auswertung — nicht "Arbeiter X hat um 14:30 den Helm abgenommen", sondern "Zone C/D, nachmittags, 12 Personen-Stunden mit Verstoß".

BetrVG § 87 Abs. 1 Nr. 6

Kameras, die Leistung und Verhalten von Arbeitnehmern überwachen können, unterliegen der Mitbestimmung des Betriebsrats — auch wenn sie objektiv nur schützen sollen.

Praktisch: ohne Betriebsvereinbarung kein Roll-out in Unternehmen mit Betriebsrat. Für meinen Prototyp (Solo, kein BR) kein Hindernis; für das Produkt entscheidend. Eine BR-freundliche Vorlage steht auf der Roadmap.

EU AI Act

Ab 2. August 2026 greifen die Pflichten für Hochrisiko-KI-Systeme. Workplace-Monitoring fällt nach Anhang III Nr. 4 potenziell hinein.

Folgen: Einzelfallprüfung, Human Oversight, nachvollziehbare Protokollierung. Emotionserkennung am Arbeitsplatz ist seit Februar 2025 verboten — für dieses Projekt irrelevant, aber in der Marktkommunikation oft vermischt.

DGUV

Die BG BAU behandelt KI-Überwachung als Ergänzung, nicht als Ersatz der regulären Arbeitsschutzmaßnahmen. Das passt zur Positionierung: ein Dokumentations- und Abschreckungswerkzeug, kein funktionales Sicherheitssystem.

BOM pro Standort

KomponenteRichtpreis
Raspberry Pi 5 (8 GB)~85 €
AI HAT+ 26 TOPS~120 €
Kühler + NVMe + HAT~80 €
PoE-HAT~25 €
4G/LTE HAT~130 €
2× PoE-IP-Kamera~360 €
Pi AI Camera (IMX500)~71 €
PoE-Lautsprecher + Verstärker~80 €
Outdoor-Gehäuse IP65~50 €
Solar + LiFePO4 (optional)~140 €
Montage, Kabel~40 €
Summe≈ 1.180 €

Für einen Werkstatt-Prototyp auf dem Tisch reichen die ersten vier Zeilen plus eine Kamera — rund 450 €.

Nächste Schritte

Das Gerät steht Ende April 2026 auf dem Schreibtisch. Die nächsten drei Monate zeigen, ob "zwei Modi, ein Gerät" in der Praxis hält — oder ob ein Modus den anderen kompromittiert.


Bildquellen

  • Raspberry Pi 5, AI HAT+, AI Camera: Produktfotos der Raspberry Pi Foundation (raspberrypi.com).
  • PoE-IP-Kamera: Produktfoto Reolink (reolink.com).
  • Frigate-Dashboard: offizielle Dokumentation (docs.frigate.video, MIT).
  • Alle Diagramme und das Bautagebuch-Mockup sind eigene Arbeiten.