RHORPOST

Kevin Klein (medium)

01. Apr. 2026

VERARBEITET
00:0000:00

Zusammenfassung

Teilnehmer: Kevin, Frank

Neues Tool: Sprachnotiz-Transkription und -Zusammenfassung



Tool-Features


  • Funktionsweise: Sprachnotizen aufnehmen → automatische Transkription → KI-gestützte Zusammenfassung
  • Performance: 6-Minuten-Nachricht in 1,5 Minuten verarbeitet, 8-Minuten-Feedback (2000 Wörter) in 3 Minuten
  • Erkennung: Automatisches Herausfiltern von Füllwörtern und irrelevantem Content
  • Strukturierung: To-Dos vs. reine Informationen werden differenziert

Anwendungsszenarien


  • Sabrina's Feedback-Nachrichten: 8-Minuten-Sprachnachrichten effizient zusammenfassen
  • Meeting-Protokolle: Automatische Zusammenfassungen für 3-Personen-Gespräche
  • Content-Erstellung: Gesprochene Inhalte zu strukturierten Artikeln verarbeiten
  • Projekt-Erstbesprechungen: Strukturierte Dokumentation statt manueller Notizen

Technische Herausforderungen


  • SQLite-Deployment: Probleme bei Windows/Linux-Binaries
  • Speaker-Erkennung: Whisper erkennt nicht automatisch verschiedene Sprecher
  • Lösungsansätze:
- Whisper-X für Speaker-Labels
- Audio-Chunking (5-Minuten-Segmente) für große Dateien
- Video-Support durch Audio-Extraktion

Verkaufspotential


  • Biotop-Projekt: Tool als zusätzliche Lösung anbieten
  • Allgemeine Vermarktung: Zeitersparnis für Meetings und Feedback-Schleifen

Terminverwaltungs-App (Rückblick Q1)


Aufwand: 3 Wochen intensiv
Features:
  • Magic-Link-Authentifizierung für Einrichtungen
  • Termin-Eingabe durch einzelne Einrichtungen
  • Zentrale Freigabe und Website-Integration

Server-Infrastruktur


GPU-Hosting Überlegungen


  • Hetzner GPU-Server: Ab 254€/Monat (RTX 4000 SFF, 20GB VRAM, 2TB Storage)
  • Mitwald AI-Hosting: Token-basierte Abrechnung verfügbar
  • Whisper Large V3 Turbo: Als Hosting-Option erkannt

AI-Entwicklungen


  • Claude Deep Sleep: Selbst-optimierende Kontextverwaltung
  • Notebook-LM: Projekt-Research und Visualisierungen aus Gesprächen
  • Spekulationen: Neues Modell von Anthropic vor Börsengang

Offene Punkte


  • Whisper-X für Speaker-Differenzierung testen
  • Video-Transkription implementieren
  • GPU-Hosting für AI-Workloads evaluieren
11674 TOKENS$0.0446
Modelle vergleichen