[6/16 - 6/22] GitHub Weekly Digest

June 22, 2025

📌 Shubhamsaboo/awesome-llm-apps

Description: Collection of awesome LLM apps with AI Agents and RAG using OpenAI, Anthropic, Gemini and opensource models.
🌐 Python|⭐️ 45,174 | 5464 stars this week

簡介

這個專案是一個精心挑選的出色大型語言模型 (LLM) 應用程式集合,它們使用 RAG、AI 代理、多代理團隊、MCP、語音代理等技術構建而成。此程式庫包含使用來自 OpenAI、Anthropic、Google 和開源模型(如 DeepSeek、Qwen 或 Llama)的 LLM 應用程式,這些應用程式可以在您的電腦上本地執行。 它展示了 LLM 在不同領域(從程式碼庫到電子郵件收件箱等)的實際應用,並結合了來自 OpenAI、Anthropic、Gemini 和開源替代方案的 LLM 與 AI 代理、代理團隊、MCP 和 RAG。 使用者可以從完善的專案中學習,並為不斷發展的 LLM 應用程式開源生態系統做出貢獻。

主要功能

  • 收錄大量基於大型語言模型 (LLM) 的應用程式範例。
  • 涵蓋多種技術,例如 RAG (Retrieval Augmented Generation)、AI 代理、多代理團隊、MCP (Memory-Capable Prompting) 和語音代理。
  • 支援多個 LLM 模型,包括 OpenAI、Anthropic、Google 和開源模型 (DeepSeek, Qwen, Llama)。
  • 提供本地和雲端部署選項。
  • 涵蓋多個應用領域,例如資料分析、醫療影像、音樂生成、旅遊規劃等。
  • 提供多種功能的 AI 代理,例如競爭情報、財務分析、法律諮詢、招聘等等。
  • 包含多代理團隊的應用程式,以實現更複雜的功能。
  • 提供語音 AI 代理和基於 MCP 的 AI 代理。
  • 提供關於如何使用 LLM 模型以及各種記憶體管理技術的教學。

如何使用

  • 複製這個程式庫:git clone <repository_url>
  • 瀏覽程式庫中不同類別的應用程式 (AI 代理、多代理團隊、RAG 等)。
  • 選擇一個感興趣的應用程式,仔細閱讀其說明檔案。
  • 根據應用程式的說明,執行程式碼或使用相關服務。
  • 部分應用程式可能需要安裝特定的軟體或套件。
  • 一些應用程式需要使用雲端服務,可能需要設定 API 金鑰。
  • 對於本地執行的應用程式,請確保您的電腦符合其系統需求。
  • 參考提供的教學檔案,學習如何使用 LLM 模型及其相關技術。

📌 DataExpert-io/data-engineer-handbook

Description: This is a repo with links to everything you'd ever want to learn about data engineering
🌐 Jupyter Notebook|⭐️ 33,279 | 3853 stars this week

簡介

  • 本資料庫彙整了成為優秀資料工程師所需的所有資源。
  • 提供2024年資料工程師入門路線圖,以及為期六週的免費YouTube訓練營。
  • 包含實作專案、面試技巧、書籍推薦、社群連結以及電子報等資源。
  • 收錄了超過25本書籍,以及超過10個社群的推薦清單。
  • 涵蓋資料工程領域的各個方面,例如資料湖泊、資料倉庫、資料整合、資料品質等等。
  • 提供了許多公司、教育機構和工具的列表。
  • 也有資料工程師的部落格、白皮書和社群媒體帳號的連結。

主要功能

  • 提供完整的學習路徑,從入門到進階,涵蓋理論知識和實踐技能。
  • 收錄豐富的學習資源,包括書籍、社群、線上課程等。
  • 提供關於資料工程師面試的建議和技巧。
  • 涵蓋各種資料工程工具和技術,例如Orchestration、Data Lake/Cloud、Data Warehouse、Data Quality等等。
  • 提供資料工程領域相關公司、教育機構和社群媒體帳號的資訊。
  • 整合了多個平臺的資源,方便使用者學習和交流。
  • 針對不同學習階段的使用者,提供不同的學習資源。
  • 提供大量業界領袖和專家的資訊,方便使用者學習和交流。

如何使用

  • 對於資料工程新手,建議從2024年資料工程師入門路線圖開始。
  • 欲參加六週免費YouTube訓練營的使用者,可參考相關資訊。
  • 可參考「Projects」、「Interviews」、「Books」、「Communities」和「Newsletter」等區塊獲取更多資源。
  • 可根據自身需求,選擇適合的學習資源,例如書籍、社群、線上課程等。
  • 可參考提供的公司、工具和技術列表,學習相關知識和技能。
  • 可關注推薦的社群媒體帳號,獲取最新的資料工程資訊。
  • 可參考提供的資料工程師部落格和白皮書,深入瞭解相關領域的知識。
  • 可利用提供的資源,建立完整的學習計畫,逐步提升自身的資料工程技能。

📌 anthropics/anthropic-cookbook

Description: A collection of notebooks/recipes showcasing some fun and effective ways of using Claude.
🌐 Jupyter Notebook|⭐️ 16,611 | 3376 stars this week

簡介

Anthropic Cookbook 是一個提供程式碼範例和指南的資源,幫助開發者利用 Claude 建立應用程式。它包含可直接複製到專案中的程式碼片段,主要使用 Python 語言撰寫,但概念可應用於任何支援 Anthropic API 的程式語言。 需要 Anthropic API 金鑰才能使用提供的範例。 本 Cookbook 鼓勵開發者社群貢獻,持續改進和擴充其內容。

主要功能

  • 提供可複製的程式碼範例,方便整合至個人專案。
  • 包含多種技能的教學,例如文字和資料分類 (Classification)、摘要 (Summarization)、以及增強式生成 (Retrieval Augmented Generation)。
  • 示範如何整合 Claude 與外部工具,例如計算器、SQL 查詢以及向量資料庫 (Pinecone)。
  • 說明如何與第三方服務整合,例如 Wikipedia、網頁和網路搜尋引擎 (Brave)。
  • 探討多模態能力,包括使用 Claude 處理圖片、圖表和表格,以及與 Stable Diffusion 生成圖片。
  • 教授進階技巧,例如使用 Haiku 作為子代理程式 (sub-agent) 與 Opus 結合,以及將 PDF 上傳到 Claude 進行文字解析。

如何使用

  • 首先需要取得 Anthropic API 金鑰。
  • 參考 Cookbook 中提供的程式碼範例,這些範例主要使用 Python 語言撰寫。
  • 依照提供的指南,學習如何將 Claude 整合到你的應用程式中。
  • 針對不同的任務,選擇合適的技能和工具整合方式。
  • 參考提供的資源連結,例如 Anthropic 開發者檔案和社群論壇,進一步學習和獲得協助。
  • 歡迎參與社群貢獻,提交想法、修正錯誤或新增指南。

📌 menloresearch/jan

Description: Jan is an open source alternative to ChatGPT that runs 100% offline on your computer
🌐 TypeScript|⭐️ 32,710 | 3249 stars this week

簡介

Jan 是一款可在裝置上離線執行的 ChatGPT 替代方案,目標是讓使用者能輕鬆下載和執行大型語言模型 (LLMs),並在完全掌控和保護隱私的情況下使用 AI。目前 Jan 仍在積極開發中,提供 Windows、macOS 和 Linux 版本。它支援多種大型語言模型,例如 Llama、Gemma、Qwen 等,並具有雲端整合功能,可連線 OpenAI、Anthropic 等服務。Jan 強調使用者隱私,所有運算都在本地執行。

主要功能

  • 本地 AI 模型 (Local AI Models): 下載並執行來自 HuggingFace 的大型語言模型 (LLMs),例如 Llama、Gemma、Qwen 等。
  • 雲端整合 (Cloud Integration): 連線 OpenAI、Anthropic、Mistral、Groq 等雲端服務。
  • 自訂助理 (Custom Assistants): 建立專門針對特定任務的 AI 助理。
  • OpenAI 相容 API (OpenAI-Compatible API): 提供本機伺服器 (localhost:1337) 供其他應用程式使用。
  • 模型上下文協定 (Model Context Protocol): 整合 MCP 以增強功能。
  • 注重隱私 (Privacy First): 所有運算都在本地執行。

如何使用

  • 安裝 (Installation): 從 jan.ai 或 GitHub Releases 下載適用於您作業系統的安裝程式 (jan.exe, jan.dmg, jan.deb, jan.AppImage)。
  • 從原始碼建置 (Build from Source): 需要 Node.js ≥ 20.0.0、Yarn ≥ 1.22.0、Make ≥ 3.81 和 Rust (for Tauri)。使用 make devmise dev 命令進行開發環境設定和啟動應用程式。其他命令如 make build/mise build (建置)、make test/mise test (測試) 和 make clean/mise clean (清除) 也可用。
  • 手動命令 (Manual Commands): 使用 yarn installyarn build:coreyarn build:extensionsyarn dev 命令進行安裝和開發。
  • 系統需求 (System Requirements): macOS 13.6+ (8GB RAM for 3B models, 16GB for 7B, 32GB for 13B)、Windows 10+ with GPU support for NVIDIA/AMD/Intel Arc、多數 Linux 發行版皆相容。
  • 疑難排解 (Troubleshooting): 參考檔案或在 Discord 的 #🆘|jan-help 頻道尋求協助。

📌 linshenkx/prompt-optimizer

Description: 一款提示词优化器,助力于编写高质量的提示词
🌐 TypeScript|⭐️ 7,376 | 1610 stars this week

簡介

Prompt Optimizer 是一款強大的 AI 提示詞最佳化工具,旨在提升 AI 產出質量。它支援 Web 應用程式和 Chrome 擴充功能兩種使用方式,能有效最佳化提示詞,提升 AI 回覆的準確度,並支援多種主流 AI 模型,例如 OpenAI、Gemini、DeepSeek 等。 透過純客戶端處理,保障使用者資料安全與隱私。提供直觀易用的介面和豐富的功能,例如提示詞的智慧最佳化、原始與最佳化後提示詞的即時比較、多種模型的整合、高階引數設定以及資料的本地加密儲存和匯入匯出。

主要功能

  • 智慧最佳化 (Intelligent Optimization): 一鍵最佳化提示詞,並支援多輪迭代改進。
  • 對比測試 (Comparison Testing): 即時比較原始提示詞和最佳化後提示詞的效果。
  • 多模型整合 (Multi-Model Integration): 支援 OpenAI、Gemini、DeepSeek、智譜 AI、SiliconFlow 等主流 AI 模型。
  • 高階引數配置 (Advanced Parameter Configuration): 支援為每個模型個別配置 temperaturemax_tokens 等 LLM 引數。
  • 安全架構 (Secure Architecture): 純客戶端處理,資料直接與 AI 服務商互動,不經過中間伺服器。
  • 隱私保護 (Privacy Protection): 本地加密儲存歷史記錄和 API 金鑰,支援資料匯入匯出。
  • 多端支援 (Multi-Platform Support): 提供 Web 應用程式和 Chrome 擴充功能兩種使用方式。
  • 使用者體驗 (User Experience): 簡潔直觀的介面設計,響應式佈局和流暢的互動效果。
  • 跨域支援 (Cross-Origin Support): Vercel 部署時支援使用 Edge Runtime 代理解決跨域問題。
  • 訪問控制 (Access Control): 支援密碼保護功能,保障部署安全。

如何使用

  • 線上版本: 直接訪問 https://prompt.always200.com (推薦)。
  • Vercel 部署: 透過一鍵部署或 Fork 專案後在 Vercel 匯入,並設定環境變數 (包含 ACCESS_PASSWORD 等)。
  • Chrome 擴充功能: 從 Chrome 商店安裝。
  • Docker 部署: 使用 docker run 指令執行容器,可設定環境變數配置 API 金鑰和訪問密碼。
  • Docker Compose 部署: 使用 docker compose 指令,可透過 .env 檔案或 docker-compose.yml 檔案設定 API 金鑰和訪問密碼。
  • API 金鑰配置: 可透過介面設定或環境變數設定各 AI 服務商的 API 金鑰,並設定高階 LLM 引數 (例如 llmParams)。
  • 本地開發: 克隆專案、安裝依賴項,並執行 pnpm dev 命令啟動開發服務。