Architektur – Ostler

Drei-Speicher-Architektur

Ostler nutzt drei spezialisierte Datenbanken, jede optimiert für einen anderen Abfragetyp:

Speicher	Technologie	Zweck
Vektorspeicher	Qdrant	Semantic search. “Find people similar to this description.” Stores your embeddings (nomic-embed-text), scaling to hundreds of thousands of vectors.
Wissensgraph	Oxigraph	Structured relationships. SPARQL queries over your knowledge-graph triples. “Who knows whom? What happened when?”
Cache + Message-Bus	Valkey	Schnelle Lookups, Echtzeit-Nachrichtenrouting zwischen Diensten, Sitzungszustand. (Linux-Foundation-Fork von Redis 7.2.)

Alle drei laufen als launchd-Dienste. Auf einem Mac Mini M4 benötigen die Datenbanken unter 2GB RAM, sodass der Rest für Ollama und die KI-Modelle bleibt (die je nach Modellgröße 6–12GB benötigen).

Lokale LLM-Inferenz

Die gesamte KI-Inferenz läuft lokal über Ollama. Keine Cloud-API-Aufrufe. Keine nutzungsbasierte Abrechnung. Keine Datenexfiltration.

Modell	Verwendung	Leistung
Qwen 3.5 9B	KI-Assistent, Gesprächsverarbeitung, Faktenextraktion	~30 Tok/s auf M4
nomic-embed-text	Vektor-Embeddings für die semantische Suche	~200 Embeddings/s

Das System ist hardware-adaptiv. Einstellungsprofile konfigurieren die Modellauswahl und Batch-Größen basierend auf der verfügbaren Hardware. Ein Mac Mini M1 führt kleinere Modelle aus; ein Mac Studio M2 Ultra führt größere aus.

Sofortiges Onboarding (macOS-Daten)

Sobald Sie installieren, liest Ostler Daten direkt aus den integrierten Apps Ihres Mac’s. Keine Exporte nötig. Kein Warten.

Quelle	Was wir lesen	Berechtigung
Safari	Browserverlauf, Lesezeichen, Leseliste	Full Disk Access
iMessage	Gespräche, Teilnehmer, Zeitstempel	Full Disk Access
Apple Notes	Notiztitel, Textinhalt, Ordner	Full Disk Access
Calendar	Ereignisse, Teilnehmer, Orte	Full Disk Access
Photos	Gesichtsbezeichnungen, GPS-Standorte, Daten (nicht der Bildinhalt)	Full Disk Access
Reminders	Aufgaben, Fälligkeitsdaten, Listen	Full Disk Access
Apple Mail	Betreffe, Absender, Daten (nicht der E-Mail-Text)	Full Disk Access

Alle Datenbanken werden schreibgeschützt geöffnet, um Beschädigungen zu vermeiden. Jeder Extraktor behandelt Schema-Unterschiede zwischen macOS-Versionen (Ventura, Sonoma, Sequoia). Full Disk Access ist optional – Sie können es überspringen und trotzdem DSGVO-Importe nutzen.

DSGVO-Import-Pipeline

Für tiefere historische Daten lesen 20 Parser aus DSGVO-Datenexporten:

Plattform	Importierte Daten	Format
LinkedIn	Kontakte, Werdegang, Bestätigungen, Nachrichten (Metadaten)	CSV
Facebook	Freunde, Veranstaltungen, Chronik	JSON
Instagram	Follower, gefolgte Konten, enge Freunde	JSON
WhatsApp	Telefon-Querverweise	JSON
Twitter / X	Synchronisierte Kontakte (Telefon-Querverweis)	JS
Google Calendar	Ereignisse, Teilnehmer, Orte	ICS
iCloud	Kontakte (über CardDAV)	vCard
E-Mail	Signatur-Mining, Header-Analyse	MBOX
Browser	Verlaufs-URLs, Seitentitel	Safari / Chrome

Identitätsauflösung

Dieselbe Person erscheint plattformübergreifend unterschiedlich. “John Smith” auf LinkedIn, “johnnyboy” auf Instagram, “+44 7XXX XXXXXX” auf WhatsApp. Der Identitäts-Resolver gleicht diese ab mithilfe von:

Exakter Abgleich: LinkedIn-URL, E-Mail-Adresse, Telefonnummer (letzte 8 Ziffern).
Unscharfer Abgleich: Jaro-Winkler-Zeichenkettendistanz bei Namen, untermauert durch gemeinsame Organisation, E-Mail-Domain oder Plattform-Überschneidung.
Manuelle Prüfwarteschlange: Unsichere Übereinstimmungen landen in einer Prüfwarteschlange. Der Nutzer bestätigt oder lehnt ab. Keine automatischen Zusammenführungen ohne Sicherheit.

Der Resolver verfügt über 38 automatisierte Tests, die exakte, unscharfe, Telefon-, E-Mail- und Namens-Teilmengen-Abgleichstrategien abdecken.

Gesprächsverarbeitung

Wenn ein Gespräch aufgezeichnet wird (über die Ostler-RemoteCapture-App auf Ihrem Mac oder per manuellem Import), durchläuft es eine mehrstufige Pipeline:

Klassifizierung – Kontext (beruflich/sozial/familiär), Form (Meeting/1:1/Gruppe), Tragweite (hoch/mittel/niedrig).
Faktenextraktion – durchschnittlich 12,6 Fakten pro Gespräch, mit Qualitätsprüfungen.
Beziehungssignale – Wärme, Gegenseitigkeit, Energie, Machtdynamik.
Coaching-Beobachtungen – langfristige Muster darin, wie der Nutzer kommuniziert.
Gesprächsübergreifende Verknüpfung – semantische Ähnlichkeit zwischen Gesprächszusammenfassungen.

Jeder Schritt ist idempotent (ohne Duplikate erneut ausführbar), verfügt über einen exponentiellen Backoff bei Fehlern und protokolliert die Prompt-Version, die ihn erzeugt hat.

Stack-Übersicht

Erfassungsebene
  macOS databases (instant)  ·  GDPR imports  ·  macOS app  ·  iOS app  ·  Browser extension

Verarbeitungsebene
  Conversation pipeline  ·  Identity resolver  ·  Fact extraction  ·  Relationship signals

Intelligenzebene
  Ollama (Qwen 3.5 9B)  ·  nomic-embed-text  ·  SPARQL queries  ·  Vector search

Speicherebene
  Qdrant (vectors)  ·  Oxigraph (RDF graph)  ·  Valkey (cache + bus)  ·  SQLite (coaching)

Schnittstellenebene
  Assistant (iMessage · Email)  ·  Personal Wiki  ·  iOS app

Gesamte Abhängigkeiten: Python 3.11+, Ollama. Keine Cloud-Konten erforderlich. Keine API-Schlüssel. Keine Abonnements.

Wie Ostler aufgebaut ist.

Drei-Speicher-Architektur

Lokale LLM-Inferenz

Sofortiges Onboarding (macOS-Daten)

DSGVO-Import-Pipeline

Identitätsauflösung

Gesprächsverarbeitung

Stack-Übersicht

Gebaut, um zu Hause zu laufen.