Wie Ostler aufgebaut ist.

Für Entwickler und technisch Interessierte. Alles läuft auf einem Mac Mini. Nichts verlässt Ihr Netzwerk.

Drei-Speicher-Architektur

Ostler nutzt drei spezialisierte Datenbanken, jede optimiert für einen anderen Abfragetyp:

SpeicherTechnologieZweck
Vektorspeicher Qdrant Semantic search. “Find people similar to this description.” Stores your embeddings (nomic-embed-text), scaling to hundreds of thousands of vectors.
Wissensgraph Oxigraph Structured relationships. SPARQL queries over your knowledge-graph triples. “Who knows whom? What happened when?”
Cache + Message-Bus Valkey Schnelle Lookups, Echtzeit-Nachrichtenrouting zwischen Diensten, Sitzungszustand. (Linux-Foundation-Fork von Redis 7.2.)

Alle drei laufen als launchd-Dienste. Auf einem Mac Mini M4 benötigen die Datenbanken unter 2GB RAM, sodass der Rest für Ollama und die KI-Modelle bleibt (die je nach Modellgröße 6–12GB benötigen).

Lokale LLM-Inferenz

Die gesamte KI-Inferenz läuft lokal über Ollama. Keine Cloud-API-Aufrufe. Keine nutzungsbasierte Abrechnung. Keine Datenexfiltration.

ModellVerwendungLeistung
Qwen 3.5 9B KI-Assistent, Gesprächsverarbeitung, Faktenextraktion ~30 Tok/s auf M4
nomic-embed-text Vektor-Embeddings für die semantische Suche ~200 Embeddings/s

Das System ist hardware-adaptiv. Einstellungsprofile konfigurieren die Modellauswahl und Batch-Größen basierend auf der verfügbaren Hardware. Ein Mac Mini M1 führt kleinere Modelle aus; ein Mac Studio M2 Ultra führt größere aus.

Sofortiges Onboarding (macOS-Daten)

Sobald Sie installieren, liest Ostler Daten direkt aus den integrierten Apps Ihres Mac’s. Keine Exporte nötig. Kein Warten.

QuelleWas wir lesenBerechtigung
SafariBrowserverlauf, Lesezeichen, LeselisteFull Disk Access
iMessageGespräche, Teilnehmer, ZeitstempelFull Disk Access
Apple NotesNotiztitel, Textinhalt, OrdnerFull Disk Access
CalendarEreignisse, Teilnehmer, OrteFull Disk Access
PhotosGesichtsbezeichnungen, GPS-Standorte, Daten (nicht der Bildinhalt)Full Disk Access
RemindersAufgaben, Fälligkeitsdaten, ListenFull Disk Access
Apple MailBetreffe, Absender, Daten (nicht der E-Mail-Text)Full Disk Access

Alle Datenbanken werden schreibgeschützt geöffnet, um Beschädigungen zu vermeiden. Jeder Extraktor behandelt Schema-Unterschiede zwischen macOS-Versionen (Ventura, Sonoma, Sequoia). Full Disk Access ist optional – Sie können es überspringen und trotzdem DSGVO-Importe nutzen.

DSGVO-Import-Pipeline

Für tiefere historische Daten lesen 20 Parser aus DSGVO-Datenexporten:

PlattformImportierte DatenFormat
LinkedInKontakte, Werdegang, Bestätigungen, Nachrichten (Metadaten)CSV
FacebookFreunde, Veranstaltungen, ChronikJSON
InstagramFollower, gefolgte Konten, enge FreundeJSON
WhatsAppTelefon-QuerverweiseJSON
Twitter / XSynchronisierte Kontakte (Telefon-Querverweis)JS
Google CalendarEreignisse, Teilnehmer, OrteICS
iCloudKontakte (über CardDAV)vCard
E-MailSignatur-Mining, Header-AnalyseMBOX
BrowserVerlaufs-URLs, SeitentitelSafari / Chrome

Identitätsauflösung

Dieselbe Person erscheint plattformübergreifend unterschiedlich. “John Smith” auf LinkedIn, “johnnyboy” auf Instagram, “+44 7XXX XXXXXX” auf WhatsApp. Der Identitäts-Resolver gleicht diese ab mithilfe von:

  • Exakter Abgleich: LinkedIn-URL, E-Mail-Adresse, Telefonnummer (letzte 8 Ziffern).
  • Unscharfer Abgleich: Jaro-Winkler-Zeichenkettendistanz bei Namen, untermauert durch gemeinsame Organisation, E-Mail-Domain oder Plattform-Überschneidung.
  • Manuelle Prüfwarteschlange: Unsichere Übereinstimmungen landen in einer Prüfwarteschlange. Der Nutzer bestätigt oder lehnt ab. Keine automatischen Zusammenführungen ohne Sicherheit.

Der Resolver verfügt über 38 automatisierte Tests, die exakte, unscharfe, Telefon-, E-Mail- und Namens-Teilmengen-Abgleichstrategien abdecken.

Gesprächsverarbeitung

Wenn ein Gespräch aufgezeichnet wird (über die Ostler-RemoteCapture-App auf Ihrem Mac oder per manuellem Import), durchläuft es eine mehrstufige Pipeline:

  • Klassifizierung – Kontext (beruflich/sozial/familiär), Form (Meeting/1:1/Gruppe), Tragweite (hoch/mittel/niedrig).
  • Faktenextraktion – durchschnittlich 12,6 Fakten pro Gespräch, mit Qualitätsprüfungen.
  • Beziehungssignale – Wärme, Gegenseitigkeit, Energie, Machtdynamik.
  • Coaching-Beobachtungen – langfristige Muster darin, wie der Nutzer kommuniziert.
  • Gesprächsübergreifende Verknüpfung – semantische Ähnlichkeit zwischen Gesprächszusammenfassungen.

Jeder Schritt ist idempotent (ohne Duplikate erneut ausführbar), verfügt über einen exponentiellen Backoff bei Fehlern und protokolliert die Prompt-Version, die ihn erzeugt hat.

Stack-Übersicht

Erfassungsebene
  macOS databases (instant)  ·  GDPR imports  ·  macOS app  ·  iOS app  ·  Browser extension

Verarbeitungsebene
  Conversation pipeline  ·  Identity resolver  ·  Fact extraction  ·  Relationship signals

Intelligenzebene
  Ollama (Qwen 3.5 9B)  ·  nomic-embed-text  ·  SPARQL queries  ·  Vector search

Speicherebene
  Qdrant (vectors)  ·  Oxigraph (RDF graph)  ·  Valkey (cache + bus)  ·  SQLite (coaching)

Schnittstellenebene
  Assistant (iMessage · Email)  ·  Personal Wiki  ·  iOS app

Gesamte Abhängigkeiten: Python 3.11+, Ollama. Keine Cloud-Konten erforderlich. Keine API-Schlüssel. Keine Abonnements.

Gebaut, um zu Hause zu laufen.

Lokal  ·  Nachvollziehbar  ·  Ihres