Selezione Quotidiana di Show HN (2025-06-27)
- Magnitude – Framework open-source per l'automazione del browser basato su AI
- Ho creato un generatore di dataset per AI
- Che ore sono nel mondo Corporate
- Creato uno scanner alimentare per la longevità
- Ho creato una libreria JSON-RPC per Zig con reflection a tempo di compilazione
- Chatta con ChatGPT, Claude, Grok, Gemini e Llama su una singola interfaccia
- Rust ↦ WASM, Crate per la quantizzazione dei colori K-Means per convertire immagini in pixel-art
- Inworld TTS – sintesi vocale di alta qualità, economica e a bassa latenza
- Pocket2Linkding – Migra da Mozilla Pocket a Linkding
- AI Phone Interviewer – ricevi una chiamata in 30 secondi
- Anytype – un database locale e collaborativo con API e server MCP
- Un'app open-source per interrogare 10 modelli AI contemporaneamente
- Piper-mode – Sintesi vocale per Emacs utilizzando il motore TTS Piper
- Pianificazione viaggi in stile Tinder – Pianificazione viaggi per l'era del brainrot
- Usa Apple Container con Gemini CLI
- Voice-Mode MCP – Programmazione conversazionale per Claude Code, Gemini CLI
Magnitude – Framework open-source per l'automazione del browser basato su AI [Strumenti per Sviluppatori]
37 punti, 14 commenti
Framework open-source per l'automazione del browser basato su AI che utilizza un approccio vision-first per interazioni web affidabili.
- Approccio vision-first per evitare navigazione DOM instabile, migliorando le prestazioni su interazioni complesse.
- Supporta drag-and-drop, visualizzazioni dati, app legacy, siti con canvas/webGL e desktop remoti.
- Utilizza modelli basati su visione (Claude Sonnet 4 o Qwen-2.5-VL 72B) per azioni precise basate sui pixel.
- Controllo granulare con sintassi
act()
eextract()
, permettendo integrazione di codice personalizzato. - Abilita automazione di task ad alto livello, azioni a basso livello ed estrazione intelligente di dati con schemi zod.
- Configurazione semplice tramite "npx create-magnitude-app" per sperimentazione rapida.
Link Discussione, Link Originale
Ho creato un generatore di dataset per AI [Strumenti per Sviluppatori]
115 punti, 22 commenti
Strumento generatore di dataset per AI.
- Genera dataset per l'addestramento di AI
- Semplifica il processo di raccolta dati
- Supporta vari tipi e formati di dati
Link Discussione, Link Originale
Che ore sono nel mondo Corporate [Business]
5 punti, 0 commenti
Uno strumento di visualizzazione per i formati temporali aziendali, incluso il calendario National Retail Federation 4-5-4 e altri tipi di calendario richiesti.
- Visualizza il calendario National Retail Federation 4-5-4 per chiarezza
- Supporta multiple tipologie di calendario aziendale
- Piani per integrare dataset SEC per la ricerca di simboli aziendali (non ancora implementato)
Link Discussione, Link Originale
Creato uno scanner alimentare per la longevità [Salute]
3 punti, 1 commento
Un'app scanner alimentare che valuta i prodotti in base al loro impatto su fattori di longevità come infiammazione e tossine.
- Scansiona prodotti alimentari per valutarne l'impatto sulla longevità
- Valuta fattori come infiammazione, rapporto omega e tossine
- Attualmente in beta privata per feedback
- Focalizzato su salute e nutrizione profonda
Link Discussione, Link Originale
Ho creato una libreria JSON-RPC per Zig con reflection a tempo di compilazione [Strumenti per Sviluppatori]
6 punti, 0 commenti
Una libreria JSON-RPC per Zig che utilizza la reflection a tempo di compilazione per abilitare il dispacciamento dinamico di funzioni in un linguaggio tipizzato staticamente.
- Utilizza la funzionalità comptime di Zig per reflection a tempo di compilazione per determinare i tipi di parametri e ritorno delle funzioni
- Incapsula funzioni in oggetti di chiamata uniformemente tipati per il dispacciamento dinamico
- Risolve la sfida di gestire funzioni con numero e tipi di parametri variabili in un sistema di tipi statici
- Fornisce un pattern di interfaccia pulito per gestire chiamate di funzioni in una mappa
Link Discussione, Link Originale
Chatta con ChatGPT, Claude, Grok, Gemini e Llama su una singola interfaccia [ChatBots]
4 punti, 3 commenti
Un'interfaccia unificata per chattare con più modelli AI e confrontare le loro risposte.
- Supporta ChatGPT, Claude, Grok, Gemini e Llama in un'unica interfaccia
- Permette confronto side-by-side delle risposte di diversi modelli
- Aiuta gli utenti a identificare il miglior modello AI per query o ricerche specifiche
- Semplifica la ricerca eliminando la necessità di passare tra piattaforme
Link Discussione, Link Originale
Rust ↦ WASM, Crate per la quantizzazione dei colori K-Means per convertire immagini in pixel-art [Immagini]
6 punti, 0 commenti
Crate Rust to WASM per convertire immagini in pixel-art utilizzando la quantizzazione dei colori K-means.
- Converte immagini in pixel-art
- Utilizza quantizzazione dei colori K-means
- Scritto in Rust e compilato in WASM
Link Discussione, Link Originale
Inworld TTS – sintesi vocale di alta qualità, economica e a bassa latenza [Audio]
18 punti, 11 commenti
Inworld TTS offre sintesi vocale di alta qualità, economica e a bassa latenza con supporto multilingue e markup emotivo.
- Due modelli: TTS-1 (piccolo, qualità SOTA) e TTS-1-Max (più grande, 3.5% migliore WER)
- Supporta 11 lingue e markup emotivo (es., "[happy]")
- Basato su backbone LLaMA 1B/8B, addestrato con GRPO e codec audio neurale Xcodec2
- ~500ms p90 latenza per API streaming (TTS-1)
- Prezzi semplici a $5/1M caratteri
- Codice di addestramento e benchmark sarà open-sourced su GitHub
- Servizio ottimizzato con Modular e server MAX scritto in Mojo
Link Discussione, Link Originale
Pocket2Linkding – Migra da Mozilla Pocket a Linkding [Produttività]
3 punti, 0 commenti
Uno strumento per migrare i segnalibri da Mozilla Pocket al servizio self-hosted Linkding.
- Facilita la transizione a causa dell'imminente chiusura di Mozilla Pocket
- Supporta Linkding self-hosted come soluzione alternativa per i segnalibri
- Piani per miglioramenti futuri oltre le attuali funzionalità di Linkding
- Servizio di esportazione disponibile fino all'8 ottobre 2025
Link Discussione, Link Originale
AI Phone Interviewer – ricevi una chiamata in 30 secondi [Business]
14 punti, 7 commenti
AI Phone Interviewer fornisce chiamate di screening istantanee basate su AI per i processi di assunzione.
- Ricevi una chiamata in 30 secondi per un'intervista di 2–3 minuti
- Gestisce domande generali di screening e genera report
- Piani per aggiungere screening tecnici, integrazioni ATS e supporto multilingue
- Puntato a recruiter e founder di startup per feedback
- Qualità vocale progettata per sembrare naturale
- Fase MVP, cerca validazione per sviluppo futuro
Anytype – un database locale e collaborativo con API e server MCP [Produttività]
14 punti, 0 commenti
Anytype è un database collaborativo e strumento wiki local-first, focalizzato sulla privacy con crittografia end-to-end e sincronizzazione peer-to-peer.
- API locale per automazione dei flussi di lavoro (attualmente solo desktop)
- Server MCP per integrazione LLM
- Esempio di estensione Raycast
- Sincronizzazione basata su CRDT per collaborazione
- Chiavi di proprietà dell'utente per autenticazione
- Core open-source (parte licenza MIT)
- Supporta documenti, note, task, tabelle e media
- Collaborazione in tempo reale tra utenti e dispositivi
- Pubblicazione web da desktop
- App mobile native companion
Link Discussione, Link Originale
Un'app open-source per interrogare 10 modelli AI contemporaneamente [Strumenti per Sviluppatori]
4 punti, 2 commenti
Un'app open-source che interroga 10+ modelli AI simultaneamente e riassume le loro risposte utilizzando un modello AI combinatore.
- Supporta query parallele su più modelli AI (Gemini, Claude, ecc.)
- Riassume le risposte per un confronto più semplice
- Open-source e disponibile per uso locale
- Include una GIF demo e un post tecnico dettagliato
Link Discussione, Link Originale
Piper-mode – Sintesi vocale per Emacs utilizzando il motore TTS Piper [Audio]
3 punti, 1 commento
Modalità Emacs per sintesi vocale utilizzando il motore TTS Piper.
- Integra Piper TTS con Emacs
- Abilita funzionalità di sintesi vocale in Emacs
- Implementazione leggera ed efficiente
Link Discussione, Link Originale
Pianificazione viaggi in stile Tinder – Pianificazione viaggi per l'era del brainrot [Viaggi]
4 punti, 2 commenti
Un'app di pianificazione viaggi in stile Tinder per scorrere attrazioni e creare itinerari.
- Selezione attrazioni tramite swipe
- Pianificatore itinerari con drag-and-drop
- Note per ogni luogo
- Stima automatica dei tempi di viaggio
- Auto-organizzazione itinerari (efficacia limitata)
- Condivisione viaggi con amici
- Codice open-source disponibile
Link Discussione, Link Originale
Usa Apple Container con Gemini CLI [Strumenti per Sviluppatori]
4 punti, 0 commenti
Gemini CLI ora supporta Apple Containers per Mac M1/M2/M3, estendendo le sue capacità di sandbox oltre Docker.
- Supporto nativo Apple Container per Mac serie M
- Estende le funzionalità di sandbox di Gemini CLI
- Integrazione GitHub disponibile per la configurazione
Link Discussione, Link Originale
Voice-Mode MCP – Programmazione conversazionale per Claude Code, Gemini CLI [Strumenti per Sviluppatori]
7 punti, 0 commenti
Voice-Mode MCP abilita conversazioni vocali bidirezionali con assistenti di programmazione AI come Claude Code e Gemini CLI.
- Server MCP open-source per interazione vocale
- Supporta flussi di lavoro di programmazione conversazionale
- Compatibile con Gemini CLI via configurazione
- Demo disponibile su YouTube
- Repository GitHub per self-hosting