Show HN Tägliche Auswahl (2025-06-27)
- Magnitude – Open-Source-AI-Browser-Automatisierungsframework
- Ich habe einen KI-Datensatzgenerator gebaut
- Wie spät ist es in der Unternehmenswelt
- Einen Lebensmittel-Scanner für Langlebigkeit gebaut
- Ich habe eine JSON-RPC-Bibliothek für Zig mit Compile-Time-Reflection erstellt
- Chatte mit ChatGPT, Claude, Grok, Gemini und Llama in einer Benutzeroberfläche
- Rust ↦ WASM, K-Means-Farbquantisierung für Bild-zu-Pixel-Art
- Inworld TTS – hochwertige, erschwingliche und latenzarme Sprachsynthese
- Pocket2Linkding – Migration von Mozilla Pocket zu Linkding
- KI-Telefoninterviewer – erhalte einen Anruf in 30 Sekunden
- Anytype – eine lokale und kollaborative Datenbank mit API und MCP-Server
- Eine Open-Source-App, um 10 KI-Modelle gleichzeitig abzufragen
- Piper-mode – Text-zu-Sprache für Emacs mit der Piper-TTS-Engine
- Tinder-ähnliche Reiseplanung – Reiseplanung für die Brainrot-Ära
- Nutze Apple Container mit Gemini CLI
- Voice-Mode MCP – Konversationelle Programmierung für Claude Code, Gemini CLI
Magnitude – Open-Source-AI-Browser-Automatisierungsframework [Entwickler-Tools]
37 Punkte, 14 Kommentare
Open-Source-AI-Browser-Automatisierungsframework mit einem visuellen Ansatz für zuverlässige Web-Interaktionen.
- Visueller Ansatz vermeidet fehleranfällige DOM-Navigation und verbessert die Leistung bei komplexen Interaktionen.
- Unterstützt Drag-and-Drop, Datenvisualisierungen, Legacy-Apps, Canvas-/WebGL-lastige Seiten und Remote-Desktops.
- Verwendet visuell fundierte Modelle (Claude Sonnet 4 oder Qwen-2.5-VL 72B) für präzise pixelbasierte Aktionen.
- Fein abgesteuerte Kontrolle mit
act()
undextract()
Syntax, ermöglicht die Integration von benutzerdefiniertem Code. - Ermöglicht hochgradige Aufgabenautomatisierung, Low-Level-Aktionen und intelligente Datenextraktion mit zod-Schemas.
- Einfache Einrichtung via "npx create-magnitude-app" für schnelles Experimentieren.
Diskussionslink, Original-Link
Ich habe einen KI-Datensatzgenerator gebaut [Entwickler-Tools]
115 Punkte, 22 Kommentare
Ein KI-Datensatzgenerator-Tool.
- Generiert Datensätze für KI-Training
- Vereinfacht den Datenerfassungsprozess
- Unterstützt verschiedene Datentypen und Formate
Diskussionslink, Original-Link
Wie spät ist es in der Unternehmenswelt [Business]
5 Punkte, 0 Kommentare
Ein Visualisierungstool für Unternehmenszeitformate, einschließlich des National Retail Federation 4-5-4-Kalenders und anderer angefragter Kalendertypen.
- Visualisiert den National Retail Federation 4-5-4-Kalender für Klarheit
- Unterstützt mehrere Unternehmenskalendertypen
- Plant die Integration von SEC-Datensätzen für Unternehmenssymbolsuche (noch nicht implementiert)
Diskussionslink, Original-Link
Einen Lebensmittel-Scanner für Langlebigkeit gebaut [Gesundheit]
3 Punkte, 1 Kommentar
Eine Lebensmittel-Scanner-App, die Produkte basierend auf ihrem Einfluss auf Langlebigkeitsfaktoren wie Entzündungen und Toxine bewertet.
- Scannt Lebensmittelprodukte, um deren Einfluss auf die Langlebigkeit zu bewerten
- Bewertet Faktoren wie Entzündungen, Omega-Verhältnis und Toxine
- Derzeit in einer privaten Beta für Feedback
- Fokus auf Gesundheitsspanne und tiefgreifende Ernährung
Diskussionslink, Original-Link
Ich habe eine JSON-RPC-Bibliothek für Zig mit Compile-Time-Reflection erstellt [Entwickler-Tools]
6 Punkte, 0 Kommentare
Eine JSON-RPC-Bibliothek für Zig, die Compile-Time-Reflection nutzt, um dynamische Funktionsverteilung in einer statisch typisierten Sprache zu ermöglichen.
- Nutzt Zigs Comptime-Funktion für Compile-Time-Reflection, um Funktionsparameter- und Rückgabetypen zu bestimmen
- Verpackt Funktionen in einheitlich typisierte Aufrufobjekte für dynamische Verteilung
- Löst die Herausforderung, Funktionen mit variierenden Parameteranzahlen und -typen in einem statischen Typsystem zu handhaben
- Bietet ein sauberes Schnittstellenmuster für die Verwaltung von Funktionsaufrufen in einer Map
Diskussionslink, Original-Link
Chatte mit ChatGPT, Claude, Grok, Gemini und Llama in einer Benutzeroberfläche [ChatBots]
4 Punkte, 3 Kommentare
Eine einheitliche Benutzeroberfläche, um mit mehreren KI-Modellen zu chatten und ihre Antworten zu vergleichen.
- Unterstützt ChatGPT, Claude, Grok, Gemini und Llama in einer Benutzeroberfläche
- Ermöglicht den direkten Vergleich von Antworten verschiedener Modelle
- Hilft Nutzern, das beste KI-Modell für spezifische Anfragen oder Recherchen zu identifizieren
- Vereinfacht die Recherche, indem der Wechsel zwischen Plattformen entfällt
Diskussionslink, Original-Link
Rust ↦ WASM, K-Means-Farbquantisierung für Bild-zu-Pixel-Art [Bild]
6 Punkte, 0 Kommentare
Rust-zu-WASM-Crate zur Konvertierung von Bildern in Pixel-Art mittels K-Means-Farbquantisierung.
- Konvertiert Bilder in Pixel-Art
- Verwendet K-Means-Farbquantisierung
- Geschrieben in Rust und zu WASM kompiliert
Diskussionslink, Original-Link
Inworld TTS – hochwertige, erschwingliche und latenzarme Sprachsynthese [Audio]
18 Punkte, 11 Kommentare
Inworld TTS bietet hochwertige, erschwingliche und latenzarme Text-zu-Sprache mit mehrsprachiger Unterstützung und emotionaler Markierung.
- Zwei Modelle: TTS-1 (klein, SOTA-Qualität) und TTS-1-Max (größer, 3,5% bessere WER)
- Unterstützt 11 Sprachen und emotionale Markierung (z.B. "[happy]")
- Basierend auf LLaMA 1B/8B-Backbones, trainiert mit GRPO und Xcodec2 neuronalem Audiocodec
- ~500ms p90 Latenz für Streaming-API (TTS-1)
- Einfache Preisgestaltung bei $5/1M Zeichen
- Trainings- und Benchmarking-Code wird auf GitHub Open-Source veröffentlicht
- Optimiertes Serving mit Modular und Mojo-geschriebenem MAX-Server
Diskussionslink, Original-Link
Pocket2Linkding – Migration von Mozilla Pocket zu Linkding [Produktivität]
3 Punkte, 0 Kommentare
Ein Tool zur Migration von Lesezeichen von Mozilla Pocket zum selbst gehosteten Linkding-Dienst.
- Erleichtert den Übergang aufgrund der bevorstehenden Einstellung von Mozilla Pocket
- Unterstützt selbst gehostetes Linkding als alternative Lesezeichenlösung
- Plant zukünftige Erweiterungen über Linkdings derzeitige Funktionen hinaus
- Exportdienst bleibt bis zum 8. Oktober 2025 verfügbar
Diskussionslink, Original-Link
KI-Telefoninterviewer – erhalte einen Anruf in 30 Sekunden [Business]
14 Punkte, 7 Kommentare
KI-Telefoninterviewer bietet sofortige KI-gestützte Screening-Anrufe für Einstellungsprozesse.
- Erhalte einen Anruf in 30 Sekunden für ein 2–3-minütiges Interview
- Bearbeitet allgemeine Screening-Fragen und generiert Berichte
- Plant die Erweiterung um technisches Screening, ATS-Integrationen und Mehrsprachenunterstützung
- Zielgruppe sind Recruiter und Startup-Gründer für Feedback
- Sprachqualität soll sich natürlich anfühlen
- MVP-Phase, sucht Validierung für zukünftige Entwicklung
Anytype – eine lokale und kollaborative Datenbank mit API und MCP-Server [Produktivität]
14 Punkte, 0 Kommentare
Anytype ist eine lokal-first, datenschutzorientierte kollaborative Datenbank und Wiki-Tool mit End-to-End-Verschlüsselung und Peer-to-Peer-Sync.
- Lokale API für Workflow-Automatisierung (derzeit nur Desktop)
- MCP-Server für LLM-Integration
- Raycast-Erweiterungsbeispiel
- CRDT-basierter Sync für Kollaboration
- Nutzereigene Schlüssel für Authentifizierung
- Open-Source-Kern (teilweise MIT-lizenziert)
- Unterstützt Dokumente, Notizen, Aufgaben, Tabellen und Medien
- Echtzeit-Kollaboration über Nutzer und Geräte hinweg
- Web-Publishing vom Desktop
- Native mobile Begleit-Apps
Diskussionslink, Original-Link
Eine Open-Source-App, um 10 KI-Modelle gleichzeitig abzufragen [Entwickler-Tools]
4 Punkte, 2 Kommentare
Eine Open-Source-App, die 10+ KI-Modelle gleichzeitig abfragt und ihre Antworten mit einem Kombinations-KI-Modell zusammenfasst.
- Unterstützt parallele Abfragen über mehrere KI-Modelle (Gemini, Claude, etc.)
- Fasst Antworten für einfacheren Vergleich zusammen
- Open-Source und für lokale Nutzung verfügbar
- Enthält eine Demo-GIF und detaillierten technischen Blogpost
Diskussionslink, Original-Link
Piper-mode – Text-zu-Sprache für Emacs mit der Piper-TTS-Engine [Audio]
3 Punkte, 1 Kommentar
Emacs-Text-zu-Sprache-Modus mit der Piper-TTS-Engine.
- Integriert Piper TTS mit Emacs
- Ermöglicht Text-zu-Sprache-Funktionalität innerhalb von Emacs
- Leichte und effiziente Implementierung
Diskussionslink, Original-Link
Tinder-ähnliche Reiseplanung – Reiseplanung für die Brainrot-Ära [Reisen]
4 Punkte, 2 Kommentare
Eine Tinder-ähnliche Reiseplanungs-App zum Durchswipen von Sehenswürdigkeiten und Erstellen von Reiserouten.
- Swipe-basierte Auswahl von Sehenswürdigkeiten
- Drag-and-Drop-Reiseplaner
- Notizen für jeden Ort
- Automatische Reisezeitberechnung
- Automatische Reiseroutenanordnung (begrenzte Effektivität)
- Reisefreigabe mit Freunden
- Open-Source-Code verfügbar
Diskussionslink, Original-Link
Nutze Apple Container mit Gemini CLI [Entwickler-Tools]
4 Punkte, 0 Kommentare
Gemini CLI unterstützt jetzt Apple Container für M1/M2/M3-Macs und erweitert seine Sandbox-Fähigkeiten über Docker hinaus.
- Native Apple-Container-Unterstützung für M-Serie-Macs
- Erweitert die Sandbox-Funktionalität von Gemini CLI
- GitHub-Integration für die Einrichtung verfügbar
Diskussionslink, Original-Link
Voice-Mode MCP – Konversationelle Programmierung für Claude Code, Gemini CLI [Entwickler-Tools]
7 Punkte, 0 Kommentare
Voice-Mode MCP ermöglicht Zwei-Wege-Sprachkonversationen mit KI-Programmierassistenten wie Claude Code und Gemini CLI.
- Open-Source-MCP-Server für Sprachinteraktion
- Unterstützt konversationelle Programmierworkflows
- Kompatibel mit Gemini CLI via Konfiguration
- Demo auf YouTube verfügbar
- GitHub-Repository für Selbsthosting