Vollständiges Konzeptpapier
Wie eine selbst gehostete, privacy-first KI-Plattform entsteht — Architektur, Token-Ökonomie, Businessmodell und Roadmap.
Die Vision
Jede kommerzielle KI-Lösung — ChatGPT, Gemini, Copilot — funktioniert nach demselben Prinzip: Du gibst Daten, du bekommst KI. Deine Fragen, deine Dokumente, deine Gesundheitsdaten landen auf fremden Servern. Sie trainieren deren Modelle. Sie stärken deren Monopol.
PPAA dreht dieses Modell um. Die KI läuft auf deiner Hardware. Deine Daten verlassen niemals dein Netzwerk. Du zahlst anonym, ohne Konto, ohne Identitätsnachweis. Und du bekommst trotzdem dieselbe Funktionalität — oder besser.
| Merkmal | PPAA | ChatGPT Plus | Gemini Advanced |
|---|---|---|---|
| Daten lokal | ✓ 100% lokal | ✗ OpenAI-Server | ✗ Google-Server |
| Offline-Betrieb | ✓ vollständig | ✗ nur online | ✗ nur online |
| Anonyme Zahlung | ✓ Monero/Cashu | ✗ Kreditkarte | ✗ Google Account |
| Eigene Wissensbasis | ✓ unbegrenzt lokal | ~ begrenzt | ~ begrenzt |
| Medizinisches RAG | ✓ Health-Pi Modul | ✗ nicht verfügbar | ✗ nicht verfügbar |
| Preis/Monat | ab €3,99 | $20 | $19,99 |
| Datenweitergabe ans Modell-Training | ✓ nie | ✗ ohne Opt-out | ✗ ohne Opt-out |
Technische Architektur
PPAA ist eine mehrschichtige Plattform. Jede Schicht ist austauschbar und unabhängig. Das LLM kann ausgetauscht werden (Ollama macht das trivial). Die Vektordatenbank ist portabel. Das Bezahlsystem ist modular.
Python Textual (26k+ GitHub Stars) als TUI-Framework. Läuft über SSH auf jedem Endgerät, optional über Textual-Web auch im Browser ohne Code-Änderung.
Paketmanager mit YAML-Manifesten (ähnlich pi-apps / DietPi). Jedes Modul hat install.sh, uninstall.sh, status.sh und ein Manifest mit Abhängigkeiten, Architektur-Support und Lizenzinformationen. Ed25519-Kryptographie für Offline-Lizenzvalidierung — kein Server-Ping nötig.
BioLORD-2023-M (FremyCompany, JAMIA 2024) ist das einzige medizinische Embedding-Modell mit nativem Deutsch-Support und Training auf UMLS Knowledge Graph + SNOMED-CT. 420MB, 768-dim, State-of-the-Art bei medizinischer Semantiksuche.
ChromaDB als Vektordatenbank (SQLite-backed, Python-nativ, ~50MB). Hybride Abfrage: Persönliche Dokumente (Arztbriefe, Laborbefunde) + kurierte Collections (PubMed Open Access: 3,5M Artikel, TCMBank: 9.192 Kräuter, IMPPAT: indische Heilpflanzen, Cochrane Reviews).
Der Orientierungs-Regler (0–100%) steuert Quellengewichtung und Sprachgestaltung: 100% = nur Cochrane/PubMed + "Evidenz zeigt"; 0% = primär TCM/Ayurveda + starke Disclaimer; 50% = neutral beides.
Chaumian Blind Signatures (David Chaum, 1983) garantieren mathematisch, dass der Mint eine Zahlung nicht mit einer späteren Token-Nutzung verknüpfen kann. Selbst mit vollständigem Server-Zugriff ist kein Rückschluss möglich.
Flow: Nutzer sendet Monero/Lightning → Mint signiert Token blind → Nutzer entblindet → erhält gültige Cashu-Tokens → Token im X-Cashu-Token Header bei jeder Anfrage → Einlösung ohne Identitätsbezug. Referenzimplementierung: Cashu Nutshell (Python, MIT, aktiv entwickelt).
Token-Ökonomie
Token sind das universelle Maß für KI-Rechenleistung. 1 Token ≈ ¾ Wort. Jede Anfrage hat Input-Token (deine Frage + Kontext) und Output-Token (die Antwort des Modells).
Wichtig: Bei Eigeninfrastruktur (eigener Pi) fallen Token-Kosten nur für Cloud-Backup-Anfragen an. Lokale Inferenz ist kostenlos — du zahlst nur Strom (~€4/Monat für den Pi 5).
Wochenend-Peaks (Samstag 10–14 Uhr, Sonntag 15–20 Uhr) erreichen bis zu 150% der normalen Last. Kritischer Sonderfall: Onboarding-Nutzer im ersten Monat (Scan-Phase) können bis zu 2 Millionen Token verbrauchen — entspricht der Last von 2–3 normalen Werktagen.
Lösung: Onboarding-Anfragen werden in eine separate Rate-Limited-Queue eingereiht (max. 20 gleichzeitige Batch-Requests). Peak-Overflow ab ~50 Nutzern über RunPod/Vast.ai Spot-GPUs (€0,20–0,60/h, nur bei Bedarf aktiviert via LiteLLM-Routing).
Businessmodell
PPAA profitiert von einer außergewöhnlich günstigen Kostenstruktur: Die Kern-Infrastruktur (AI-NAS, ESXi-Server, Synology NAS) ist bereits vorhanden. Der monatliche Betrieb kostet ~€81 für 25–50 Nutzer.
Systemzentrale fertigstellen, Cashu-Mint live, erste 3–8 Beta-Nutzer aus Freundeskreis. Erstes Feedback, erste Einnahmen. Break-Even bei nur 7 zahlenden Nutzern.
FamilyMeal + Beihilfe polieren, Health-Pi RAG-Setup, Monero-Zahlung. Ziel: 15 aktive Nutzer, Cashflow-positiv.
Pi-Bundles fertig konfiguriert verfügbar, Onboarding-Flow, API-Public-Launch. Ziel: 25+ Nutzer, €200+/Monat Reinvestitions-Budget.
Recherchemaschine Beta, Privacy-Communities ansprechen, B2B-Erkundung (Heilpraktiker, Beamten-Verbände). Ziel: 50+ Nutzer, €500+/Monat.
Break-Even: 7 Nutzer. Bei einem Durchschnitts-ARPU von €12/Monat und €81 Fixkosten ist das System ab dem siebten zahlenden Nutzer selbsttragend. Mit 25 Nutzern (realistisches 6-Monats-Ziel) sind €215/Monat Reinvestition möglich. Ab 100 Nutzern: ~€1.000/Monat — ein vollwertiges Nebeneinkommen.
Hardware-Bundles 2026: Starter €329 (Pi5 4GB + 1TB NVMe), Pro €449 (Pi5 8GB + 2TB NVMe), NAS-Kit €699 (Pi5 16GB + UPS + 2TB NVMe). Preisgrundlage: Geizhals Feb 2026 — Pi5 8GB ab €127, Samsung 990 Pro 2TB ab €225.
Beta-Zugang
PPAA ist aktuell für einen ausgewählten Beta-Kreis verfügbar. Wenn du dabei sein möchtest, melde dich direkt.