Show HN 每日精选 (2025-06-27)
- Magnitude – 开源的AI浏览器自动化框架
- 我构建了一个AI数据集生成器
- 企业时间是什么时候
- 为长寿打造的食物扫描仪
- 我用Zig构建了支持编译时反射的JSON-RPC库
- 在统一界面与ChatGPT、Claude、Grok、Gemini和Llama聊天
- Rust转WASM的K-Means色彩量化库,用于图像转像素艺术
- Inworld TTS – 高质量、经济实惠且低延迟的文本转语音
- Pocket2Linkding – 从Mozilla Pocket迁移到Linkding
- AI电话面试官 – 30秒内获得来电
- Anytype – 具有API和MCP服务器的本地协作数据库
- 可同时查询10个AI模型的开源应用
- Piper-mode – 使用Piper TTS引擎为Emacs实现的文本转语音
- 类Tinder的旅行规划 – 为脑残时代设计的旅行规划
- 在Gemini CLI中使用Apple容器
- 语音模式MCP – 为Claude Code和Gemini CLI打造的对话式编程
Magnitude – 开源的AI浏览器自动化框架 [开发者工具]
37分,14条评论
采用视觉优先方法的开源AI浏览器自动化框架,实现可靠的网页交互。
- 视觉优先方法避免脆弱的DOM导航,提升复杂交互的性能
- 支持拖放、数据可视化、遗留应用、canvas/webGL密集型网站和远程桌面
- 使用视觉基础模型(Claude Sonnet 4或Qwen-2.5-VL 72B)实现精确的像素级操作
- 通过
act()
和extract()
语法实现细粒度控制,支持自定义代码集成 - 支持高级任务自动化、低级操作和基于zod模式的智能数据提取
- 通过"npx create-magnitude-app"快速搭建实验环境
我构建了一个AI数据集生成器 [开发者工具]
115分,22条评论
AI数据集生成工具。
- 为AI训练生成数据集
- 简化数据收集流程
- 支持多种数据类型和格式
企业时间是什么时候 [商业]
5分,0条评论
企业时间格式可视化工具,包括国家零售联合会4-5-4日历及其他需求日历类型。
- 清晰展示国家零售联合会4-5-4日历
- 支持多种企业日历类型
- 计划整合SEC数据集实现公司符号搜索(尚未实现)
为长寿打造的食物扫描仪 [健康]
3分,1条评论
一款根据食物对炎症和毒素等长寿因素的影响进行评分的扫描应用。
- 扫描食品评估其对长寿的影响
- 考量炎症、omega比例和毒素等因素
- 目前处于私测阶段收集反馈
- 专注于健康寿命和深度营养
我用Zig构建了支持编译时反射的JSON-RPC库 [开发者工具]
6分,0条评论
利用Zig的编译时反射特性,在静态类型语言中实现动态函数调度的JSON-RPC库。
- 使用Zig的comptime特性在编译时反射确定函数参数和返回类型
- 将函数打包成统一类型的调用对象以实现动态调度
- 解决静态类型系统中处理不同参数数量和类型函数的挑战
- 提供清晰接口模式管理映射中的函数调用
在统一界面与ChatGPT、Claude、Grok、Gemini和Llama聊天 [聊天机器人]
4分,3条评论
与多个AI模型聊天并比较其响应的统一界面。
- 在单一界面支持ChatGPT、Claude、Grok、Gemini和Llama
- 可并排比较不同模型的响应
- 帮助用户识别特定查询或研究的最佳AI模型
- 通过消除平台切换需求简化研究流程
Rust转WASM的K-Means色彩量化库,用于图像转像素艺术 [图像]
6分,0条评论
使用K-means色彩量化将图像转换为像素艺术的Rust转WASM库。
- 将图像转换为像素艺术
- 使用K-means色彩量化算法
- 采用Rust编写并编译为WASM
Inworld TTS – 高质量、经济实惠且低延迟的文本转语音 [音频]
18分,11条评论
Inworld TTS提供支持多语言和情感标记的高质量、经济实惠、低延迟文本转语音服务。
- 两种模型:TTS-1(小型,SOTA质量)和TTS-1-Max(大型,WER降低3.5%)
- 支持11种语言和情感标记(如"[happy]")
- 基于LLaMA 1B/8B主干,使用GRPO和Xcodec2神经音频编解码器训练
- 流式API(TTS-1)p90延迟约500ms
- 简单定价:5美元/100万字符
- 训练和基准测试代码将在GitHub开源
- 使用Modular和Mojo编写的MAX服务器优化服务
Pocket2Linkding – 从Mozilla Pocket迁移到Linkding [生产力]
3分,0条评论
将书签从Mozilla Pocket迁移到自托管Linkding服务的工具。
- 因Mozilla Pocket即将关闭而设计
- 支持自托管Linkding作为替代书签解决方案
- 计划未来增强超越Linkding现有功能
- 导出服务持续至2025年10月8日
AI电话面试官 – 30秒内获得来电 [商业]
14分,7条评论
AI电话面试官为招聘流程提供即时AI驱动的筛选通话。
- 30秒内接到2-3分钟面试电话
- 处理通用筛选问题并生成报告
- 计划增加技术筛选、ATS集成和多语言支持
- 面向招聘人员和初创企业创始人收集反馈
- 语音质量设计自然
- MVP阶段,寻求未来发展验证
Anytype – 具有API和MCP服务器的本地协作数据库 [生产力]
14分,0条评论
Anytype是注重隐私、端到端加密的本地优先协作数据库和维基工具,支持点对点同步。
- 本地API实现工作流自动化(目前仅限桌面端)
- MCP服务器支持LLM集成
- 提供Raycast扩展示例
- 基于CRDT的同步协作
- 用户自有密钥认证
- 核心开源(部分MIT许可)
- 支持文档、笔记、任务、表格和媒体
- 跨用户设备实时协作
- 桌面端网页发布功能
- 原生移动端配套应用
可同时查询10个AI模型的开源应用 [开发者工具]
4分,2条评论
可同时查询10+个AI模型并使用组合AI模型汇总其响应的开源应用。
- 支持跨多个AI模型(Gemini、Claude等)并行查询
- 汇总响应便于比较
- 开源支持本地使用
- 包含演示GIF和技术博客详情
Piper-mode – 使用Piper TTS引擎为Emacs实现的文本转语音 [音频]
3分,1条评论
使用Piper TTS引擎的Emacs文本转语音模式。
- 将Piper TTS集成至Emacs
- 在Emacs内实现文本转语音功能
- 轻量高效实现
类Tinder的旅行规划 – 为脑残时代设计的旅行规划 [旅行]
4分,2条评论
通过滑动选择景点创建行程的类Tinder旅行规划应用。
- 滑动式景点选择
- 拖放行程规划
- 各地点笔记功能
- 自动估算交通时间
- 行程自动排列(效果有限)
- 与朋友分享行程
- 提供开源代码
在Gemini CLI中使用Apple容器 [开发者工具]
4分,0条评论
Gemini CLI现支持M1/M2/M3 Mac的Apple容器,将其沙盒能力扩展至Docker之外。
- 为M系列Mac原生支持Apple容器
- 扩展Gemini CLI沙盒功能
- 提供GitHub集成设置
语音模式MCP – 为Claude Code和Gemini CLI打造的对话式编程 [开发者工具]
7分,0条评论
语音模式MCP实现与Claude Code和Gemini CLI等AI编程助手的双向语音对话。
- 开源MCP服务器支持语音交互
- 支持对话式编程工作流
- 通过配置兼容Gemini CLI
- YouTube提供演示视频
- GitHub仓库支持自托管