Vollständiges Konzeptpapier

Das PPAA-Konzept

Wie eine selbst gehostete, privacy-first KI-Plattform entsteht — Architektur, Token-Ökonomie, Businessmodell und Roadmap.

KI ohne Kompromisse.

Jede kommerzielle KI-Lösung — ChatGPT, Gemini, Copilot — funktioniert nach demselben Prinzip: Du gibst Daten, du bekommst KI. Deine Fragen, deine Dokumente, deine Gesundheitsdaten landen auf fremden Servern. Sie trainieren deren Modelle. Sie stärken deren Monopol.

PPAA dreht dieses Modell um. Die KI läuft auf deiner Hardware. Deine Daten verlassen niemals dein Netzwerk. Du zahlst anonym, ohne Konto, ohne Identitätsnachweis. Und du bekommst trotzdem dieselbe Funktionalität — oder besser.

Merkmal PPAA ChatGPT Plus Gemini Advanced
Daten lokal✓ 100% lokal✗ OpenAI-Server✗ Google-Server
Offline-Betrieb✓ vollständig✗ nur online✗ nur online
Anonyme Zahlung✓ Monero/Cashu✗ Kreditkarte✗ Google Account
Eigene Wissensbasis✓ unbegrenzt lokal~ begrenzt~ begrenzt
Medizinisches RAG✓ Health-Pi Modul✗ nicht verfügbar✗ nicht verfügbar
Preis/Monatab €3,99$20$19,99
Datenweitergabe ans Modell-Training✓ nie✗ ohne Opt-out✗ ohne Opt-out

Wie PPAA aufgebaut ist.

PPAA ist eine mehrschichtige Plattform. Jede Schicht ist austauschbar und unabhängig. Das LLM kann ausgetauscht werden (Ollama macht das trivial). Die Vektordatenbank ist portabel. Das Bezahlsystem ist modular.

┌─────────────────────────────────────────────────────────┐
PPAA Platform
├──────────────┬──────────────┬──────────────────────────┤
PiControlModuleBezahl-Layer
│ TUI (Textual)│ Health-Pi │ Cashu Mint (Nutshell) │
│ Paketmgr │ Beihilfe-Pi │ Monero Gateway │
│ Backup (rsync│ FamilyMeal │ LiteLLM Proxy │
│ systemd Mgmt │ Schwurbelwiki│ SQLite Token-DB │
├──────────────┴──────────────┴──────────────────────────┤
LLM Engine
│ Ollama · Qwen3 4B · DeepSeek R1 1.5B │
│ ~4GB RAM · ~25–40 Tok/s auf Pi5 (8GB) │
├────────────────────────────────────────────────────────┤
Wissensspeicher (RAG)
│ ChromaDB · BioLORD-2023-M Embeddings · SQLite │
│ Persönliche Docs + Kurierte Medical Collections │
└────────────────────────────────────────────────────────┘
↑ Alles auf deiner Hardware. Offline-fähig.

🖥 PiControl — Die Systemzentrale

Python Textual (26k+ GitHub Stars) als TUI-Framework. Läuft über SSH auf jedem Endgerät, optional über Textual-Web auch im Browser ohne Code-Änderung.

Paketmanager mit YAML-Manifesten (ähnlich pi-apps / DietPi). Jedes Modul hat install.sh, uninstall.sh, status.sh und ein Manifest mit Abhängigkeiten, Architektur-Support und Lizenzinformationen. Ed25519-Kryptographie für Offline-Lizenzvalidierung — kein Server-Ping nötig.

🏥 Health-Pi — Medizinisches RAG

BioLORD-2023-M (FremyCompany, JAMIA 2024) ist das einzige medizinische Embedding-Modell mit nativem Deutsch-Support und Training auf UMLS Knowledge Graph + SNOMED-CT. 420MB, 768-dim, State-of-the-Art bei medizinischer Semantiksuche.

ChromaDB als Vektordatenbank (SQLite-backed, Python-nativ, ~50MB). Hybride Abfrage: Persönliche Dokumente (Arztbriefe, Laborbefunde) + kurierte Collections (PubMed Open Access: 3,5M Artikel, TCMBank: 9.192 Kräuter, IMPPAT: indische Heilpflanzen, Cochrane Reviews).

Der Orientierungs-Regler (0–100%) steuert Quellengewichtung und Sprachgestaltung: 100% = nur Cochrane/PubMed + "Evidenz zeigt"; 0% = primär TCM/Ayurveda + starke Disclaimer; 50% = neutral beides.

💴 Cashu-Gateway — Anonymes Bezahlen

Chaumian Blind Signatures (David Chaum, 1983) garantieren mathematisch, dass der Mint eine Zahlung nicht mit einer späteren Token-Nutzung verknüpfen kann. Selbst mit vollständigem Server-Zugriff ist kein Rückschluss möglich.

Flow: Nutzer sendet Monero/Lightning → Mint signiert Token blind → Nutzer entblindet → erhält gültige Cashu-Tokens → Token im X-Cashu-Token Header bei jeder Anfrage → Einlösung ohne Identitätsbezug. Referenzimplementierung: Cashu Nutshell (Python, MIT, aktiv entwickelt).

Wie Token funktionieren.

Token sind das universelle Maß für KI-Rechenleistung. 1 Token ≈ ¾ Wort. Jede Anfrage hat Input-Token (deine Frage + Kontext) und Output-Token (die Antwort des Modells).

💬 Einfacher Chat ~600 Token
0,3 Cent
📄 Dokument (1 Seite) ~1.800 Token
0,9 Cent
🔍 Recherche-Query ~2.500 Token
1,25 Cent
🏥 Health-Analyse ~4.000 Token
2,0 Cent
🍽 Wochenmenü ~3.000 Token
1,5 Cent

Wichtig: Bei Eigeninfrastruktur (eigener Pi) fallen Token-Kosten nur für Cloud-Backup-Anfragen an. Lokale Inferenz ist kostenlos — du zahlst nur Strom (~€4/Monat für den Pi 5).

Peak-Analyse: Wochenend-Lastspitzen

Wochenend-Peaks (Samstag 10–14 Uhr, Sonntag 15–20 Uhr) erreichen bis zu 150% der normalen Last. Kritischer Sonderfall: Onboarding-Nutzer im ersten Monat (Scan-Phase) können bis zu 2 Millionen Token verbrauchen — entspricht der Last von 2–3 normalen Werktagen.

Lösung: Onboarding-Anfragen werden in eine separate Rate-Limited-Queue eingereiht (max. 20 gleichzeitige Batch-Requests). Peak-Overflow ab ~50 Nutzern über RunPod/Vast.ai Spot-GPUs (€0,20–0,60/h, nur bei Bedarf aktiviert via LiteLLM-Routing).

Warum das funktioniert.

PPAA profitiert von einer außergewöhnlich günstigen Kostenstruktur: Die Kern-Infrastruktur (AI-NAS, ESXi-Server, Synology NAS) ist bereits vorhanden. Der monatliche Betrieb kostet ~€81 für 25–50 Nutzer.

MONAT 1–2

Beta-Launch: PiControl + Cashu

Systemzentrale fertigstellen, Cashu-Mint live, erste 3–8 Beta-Nutzer aus Freundeskreis. Erstes Feedback, erste Einnahmen. Break-Even bei nur 7 zahlenden Nutzern.

MONAT 3–4

Module + Monero-Integration

FamilyMeal + Beihilfe polieren, Health-Pi RAG-Setup, Monero-Zahlung. Ziel: 15 aktive Nutzer, Cashflow-positiv.

MONAT 5–6

Hardware-Bundles + Public Launch

Pi-Bundles fertig konfiguriert verfügbar, Onboarding-Flow, API-Public-Launch. Ziel: 25+ Nutzer, €200+/Monat Reinvestitions-Budget.

MONAT 7–12

Skalierung + Schwurbelwiki

Recherchemaschine Beta, Privacy-Communities ansprechen, B2B-Erkundung (Heilpraktiker, Beamten-Verbände). Ziel: 50+ Nutzer, €500+/Monat.

Break-Even: 7 Nutzer. Bei einem Durchschnitts-ARPU von €12/Monat und €81 Fixkosten ist das System ab dem siebten zahlenden Nutzer selbsttragend. Mit 25 Nutzern (realistisches 6-Monats-Ziel) sind €215/Monat Reinvestition möglich. Ab 100 Nutzern: ~€1.000/Monat — ein vollwertiges Nebeneinkommen.

Hardware-Bundles 2026: Starter €329 (Pi5 4GB + 1TB NVMe), Pro €449 (Pi5 8GB + 2TB NVMe), NAS-Kit €699 (Pi5 16GB + UPS + 2TB NVMe). Preisgrundlage: Geizhals Feb 2026 — Pi5 8GB ab €127, Samsung 990 Pro 2TB ab €225.

Interesse?

PPAA ist aktuell für einen ausgewählten Beta-Kreis verfügbar. Wenn du dabei sein möchtest, melde dich direkt.

Preise ansehen → ← Startseite