Show HN デイリーセレクション (2025-06-27)
- Magnitude – オープンソースAIブラウザ自動化フレームワーク
- AIデータセットジェネレーターを構築しました
- 企業時間は何時ですか
- 長寿のための食品スキャナーを構築
- Zig用JSON-RPCライブラリをコンパイル時リフレクションで構築
- 1つのUIでChatGPT、Claude、Grok、Gemini、Llamaとチャット
- Rust ↦ WASM、画像からピクセルアートへのK平均法カラー量子化クレート
- Inworld TTS – 高品質で手頃な価格の低遅延TTS
- Pocket2Linkding – Mozilla PocketからLinkdingへの移行ツール
- AI電話面接官 – 30秒で電話がかかってくる
- Anytype – APIとMCPサーバーを備えたローカル&コラボレーションデータベース
- 10のAIモデルを同時にクエリするオープンソースアプリ
- Piper-mode – Piper TTSエンジンを使ったEmacs用テキスト読み上げ
- ティンダースタイル旅行計画 – 脳が腐った時代の旅行計画
- Apple ContainerをGemini CLIで使用
- Voice-Mode MCP – Claude Code、Gemini CLI用会話型コーディング
Magnitude – オープンソースAIブラウザ自動化フレームワーク [開発者ツール]
37ポイント, 14コメント
ビジュアルファーストアプローチで信頼性の高いWeb操作を実現するオープンソースAIブラウザ自動化フレームワーク。
- ビジュアルファーストアプローチにより不安定なDOM操作を回避、複雑な操作でも高性能
- ドラッグ&ドロップ、データ可視化、レガシーアプリ、canvas/WebGL多用サイト、リモートデスクトップに対応
- 視覚に基づくモデル(Claude Sonnet 4またはQwen-2.5-VL 72B)を使用したピクセル単位の精密操作
act()
とextract()
構文で細かい制御が可能、カスタムコード統合をサポート- 高レベルタスク自動化、低レベル操作、zodスキーマを使ったインテリジェントなデータ抽出が可能
- "npx create-magnitude-app"で簡単セットアップ、すぐに試せる
AIデータセットジェネレーターを構築しました [開発者ツール]
115ポイント, 22コメント
AIトレーニング用データセット生成ツール。
- AIトレーニング用データセットを生成
- データ収集プロセスを簡素化
- 様々なデータタイプとフォーマットをサポート
企業時間は何時ですか [ビジネス]
5ポイント, 0コメント
企業用時間フォーマットの可視化ツール。全国小売業協会4-5-4カレンダーなど各種企業カレンダーを表示。
- 全国小売業協会4-5-4カレンダーを分かりやすく可視化
- 複数の企業カレンダータイプをサポート
- SECデータセット統合による企業シンボル検索を計画中(未実装)
長寿のための食品スキャナーを構築 [健康]
3ポイント, 1コメント
食品製品をスキャンし、炎症や毒素など長寿要因への影響を評価するアプリ。
- 食品製品をスキャンして長寿への影響を評価
- 炎症、オメガ比率、毒素などの要因を分析
- 現在はフィードバック用プライベートベータ版
- 健康寿命と深い栄養に焦点
Zig用JSON-RPCライブラリをコンパイル時リフレクションで構築 [開発者ツール]
6ポイント, 0コメント
コンパイル時リフレクションを使用し、静的型付け言語で動的関数ディスパッチを可能にするZig用JSON-RPCライブラリ。
- Zigのcomptime機能を使用してコンパイル時に関数パラメータと戻り値の型を決定
- 均一に型付けされた呼び出しオブジェクトに関数をパッケージ化し動的ディスパッチを実現
- 静的型システム内で様々なパラメータ数と型を持つ関数を扱う課題を解決
- マップ内での関数呼び出し管理のためのクリーンなインターフェースパターンを提供
1つのUIでChatGPT、Claude、Grok、Gemini、Llamaとチャット [チャットボット]
4ポイント, 3コメント
複数のAIモデルとチャットし、応答を比較できる統合インターフェース。
- ChatGPT、Claude、Grok、Gemini、Llamaを1つのUIでサポート
- 異なるモデルからの応答を並べて比較可能
- 特定のクエリや調査に最適なAIモデルを特定するのに役立つ
- プラットフォーム間の切り替え不要で調査を効率化
Rust ↦ WASM、画像からピクセルアートへのK平均法カラー量子化クレート [画像]
6ポイント, 0コメント
K平均法カラー量子化を使用して画像をピクセルアートに変換するRustからWASMのクレート。
- 画像をピクセルアートに変換
- K平均法カラー量子化を使用
- Rustで記述されWASMにコンパイル
Inworld TTS – 高品質で手頃な価格の低遅延TTS [音声]
18ポイント, 11コメント
Inworld TTSは高品質で手頃な価格の低遅延テキスト読み上げサービス。多言語対応と感情マークアップをサポート。
- 2つのモデル:TTS-1(小型、SOTA品質)とTTS-1-Max(大型、3.5%優れたWER)
- 11言語と感情マークアップ(例:「[happy]」)をサポート
- LLaMA 1B/8Bバックボーンを基に構築、GRPOとXcodec2ニューラルオーディオコーデックでトレーニング
- ストリーミングAPI(TTS-1)で約500msのp90遅延
- シンプルな価格設定:500万文字あたり5ドル
- トレーニングとベンチマークコードはGitHubでオープンソース化予定
- ModularとMojoで書かれたMAXサーバーで最適化されたサービス提供
Pocket2Linkding – Mozilla PocketからLinkdingへの移行ツール [生産性]
3ポイント, 0コメント
Mozilla Pocketからセルフホスト型Linkdingサービスへのブックマーク移行ツール。
- Mozilla Pocketの終了に伴う移行を容易に
- 代替ブックマークソリューションとしてセルフホスト型Linkdingをサポート
- Linkdingの現行機能を超える将来の拡張を計画
- エクスポートサービスは2025年10月8日まで利用可能
AI電話面接官 – 30秒で電話がかかってくる [ビジネス]
14ポイント, 7コメント
AI電話面接官は採用プロセス向けにAIによる即時スクリーニング電話を提供。
- 30秒で2-3分の面接電話がかかってくる
- 一般的なスクリーニング質問を処理しレポートを生成
- 技術面接、ATS統合、多言語サポートの追加を計画
- 採用担当者やスタートアップ創業者からのフィードバックを募集
- 自然な感じの音声品質を設計
- MVP段階、今後の開発に向けた検証中
Anytype – APIとMCPサーバーを備えたローカル&コラボレーションデータベース [生産性]
14ポイント, 0コメント
Anytypeはローカルファーストでプライバシー重視のコラボレーションデータベース&Wikiツール。エンドツーエンド暗号化とP2P同期を備える。
- ワークフロー自動化のためのローカルAPI(現在はデスクトップのみ)
- LLM統合用MCPサーバー
- Raycast拡張機能の例
- コラボレーション用CRDTベース同期
- 認証用ユーザー所有キー
- コアはオープンソース(一部MITライセンス)
- ドキュメント、メモ、タスク、表、メディアをサポート
- ユーザーとデバイスを跨いだリアルタイムコラボレーション
- デスクトップからのWeb公開
- ネイティブモバイルコンパニオンアプリ
10のAIモデルを同時にクエリするオープンソースアプリ [開発者ツール]
4ポイント, 2コメント
10以上のAIモデルに同時にクエリを送信し、コンバイナーAIモデルで応答を要約するオープンソースアプリ。
- Gemini、Claudeなど複数AIモデルへの並列クエリをサポート
- 応答を要約して比較を容易に
- オープンソースでローカル使用可能
- デモGIFと詳細な技術ブログ記事を含む
Piper-mode – Piper TTSエンジンを使ったEmacs用テキスト読み上げ [音声]
3ポイント, 1コメント
Piper TTSエンジンを使用したEmacsテキスト読み上げモード。
- Piper TTSをEmacsに統合
- Emacs内でテキスト読み上げ機能を有効化
- 軽量で効率的な実装
ティンダースタイル旅行計画 – 脳が腐った時代の旅行計画 [旅行]
4ポイント, 2コメント
観光地をスワイプして旅程を作成するティンダースタイル旅行計画アプリ。
- スワイプベースの観光地選択
- ドラッグ&ドロップ旅程プランナー
- 各場所へのメモ作成
- 自動移動時間推定
- 旅程自動配置(効果は限定的)
- 友人との旅行共有
- オープンソースコード利用可能
Apple ContainerをGemini CLIで使用 [開発者ツール]
4ポイント, 0コメント
Gemini CLIがM1/M2/M3 Mac向けにApple Containerをサポート。Dockerを超えるサンドボックス機能を拡張。
- MシリーズMac向けネイティブApple Containerサポート
- Gemini CLIのサンドボックス機能を拡張
- セットアップ用GitHub統合が利用可能
Voice-Mode MCP – Claude Code、Gemini CLI用会話型コーディング [開発者ツール]
7ポイント, 0コメント
Voice-Mode MCPはClaude CodeやGemini CLIなどのAIコーディングアシスタントと双方向音声会話を可能に。
- 音声インタラクション用オープンソースMCPサーバー
- 会話型コーディングワークフローをサポート
- 設定によりGemini CLIと互換
- YouTubeにデモ動画あり
- セルフホスティング用GitHubリポジトリ