[10/20 - 10/26] GitHub Weekly Digest

📌 mountain-loop/yaak

Description: The most intuitive desktop API client. Organize and execute REST, GraphQL, WebSockets, Server Sent Events, and gRPC 🦬
🌐 TypeScript｜⭐️ 13,761 | 5695 stars this week

簡介

Yaak 是一款專為 REST, GraphQL, SSE, WebSocket, 和 gRPC 設計的桌面 API Client，其開發宗旨是提供一個快速、注重隱私且離線優先的工具。此應用程式採用 Tauri, Rust, 和 React 技術構建，確保其輕量化與高效能，同時承諾不收集任何遙測資料 (telemetry)，不依賴風投基金 (VC funding)，並且無雲端服務鎖定 (cloud lock-in)，完全保護使用者隱私。其開發主要由社群購買的許可證資助。

主要功能

支援廣泛的 API 型別，包括 REST, GraphQL, gRPC, WebSocket, 和 Server-Sent Events。
可從 Postman, Insomnia, OpenAPI, Swagger, 或 Curl 輕鬆匯入 API collections。
提供強大的 response 檢查工具，可使用 JSONPath 或 XPath 進行篩選。
內建多種安全認證機制，如 OAuth 2.0, JWT, Basic Auth，並支援自定義 plugins。
透過加密 secrets 保護敏感值，並將其安全地儲存於 OS keychain。
具備請求組織功能，可在 workspaces 和巢狀資料夾中管理 requests。
支援 environment variables，方便在 dev, staging, prod 環境間切換配置。
提供擴充套件與自定義選項，例如透過 template tags 插入動態值 (如 UUIDs, timestamps)，並支援多樣主題。

如何使用

提供的內容中未包含此部分的資訊。

📌 anthropics/claude-cookbooks

Description: A collection of notebooks/recipes showcasing some fun and effective ways of using Claude.
🌐 Jupyter Notebook｜⭐️ 25,329 | 4141 stars this week

簡介

Claude Cookbooks 提供了程式碼與指南，旨在協助開發者運用 Claude 進行建置，並提供可直接複製的程式碼片段，方便輕鬆整合至您的專案中。雖然範例主要以 Python 編寫，但其概念可應用於任何支援 Claude API 互動的程式語言。

提供程式碼範例和指南，協助開發者使用 Claude 進行建構。
包含可直接複製的程式碼片段，便於整合至個人專案。
主要以 Python 編寫程式碼範例，但概念可適用於任何支援 Claude API 互動的程式語言。
推薦新使用者從 Claude API Fundamentals 課程開始，建立穩固基礎。
提供 Anthropic 開發者檔案、支援檔案和 Discord 社群連結，供進一步探索。

主要功能

核心功能 (Capabilities)：
- Classification: 探索使用 Claude 進行文字和資料分類的技術。
- Retrieval Augmented Generation: 學習如何利用外部知識增強 Claude 的回應。
- Summarization: 發現使用 Claude 進行有效文字摘要的技術。
工具使用與整合 (Tool Use and Integration)：
- 學習如何將 Claude 與外部工具和功能整合，以擴充套件其能力，例如客戶服務代理、Calculator integration、SQL queries。
第三方整合 (Third-Party Integrations)：
- 透過外部資料來源補充 Claude 的知識，包括 Vector databases (Pinecone)、Wikipedia、Web pages。
- 使用 Voyage AI 進行 Embeddings。
多模態能力 (Multimodal Capabilities)：
- Vision with Claude: 涵蓋影象入門、視覺最佳實踐、圖表解釋、表單內容擷取。
- Generate images with Claude: 使用 Claude 結合 Stable Diffusion 進行影象生成。
進階技術 (Advanced Techniques)：
- Sub-agents: 學習如何將 Haiku 作為 sub-agent 與 Opus 結合使用。
- Upload PDFs to Claude: 解析 PDF 並將其內容作為文字傳遞給 Claude。

如何使用

需具備 Claude API key 才能充分利用 Cookbooks 中的範例。
程式碼範例主要以 Python 編寫，但其概念可適用於任何支援 Claude API 互動的程式語言。
建議不熟悉 Claude API 的使用者，可先修習 Claude API Fundamentals 課程以建立基礎。
Cookbooks 提供可直接複製的程式碼片段，方便開發者輕鬆整合到自己的專案中。

📌 PaddlePaddle/PaddleOCR

Description: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
🌐 Python｜⭐️ 61,179 | 2903 stars this week

PaddleOCR是一個業界領先的OCR與檔案AI引擎，提供從文字提取到智慧檔案理解的端到端解決方案，支援多語言檔案解析、複雜結構轉換及智慧資訊提取。

簡介

PaddleOCR 是一個業界領先、生產就緒的 OCR 和檔案 AI 引擎，提供從文字提取到智慧檔案理解的端到端解決方案。
它能將檔案和影象轉換為結構化的 AI 友好資料（如 JSON 和 Markdown），具有業界領先的準確性。
廣泛應用於獨立開發者、新創公司到大型企業的 AI 應用，以其在 AI 時代構建智慧檔案應用而聞名。
在 GitHub 上擁有超過 50,000 顆星，並深度整合至 MinerU、RAGFlow 和 OmniParser 等領先專案。
PaddleOCR 3.0 引入了重大介面變更，舊版程式碼可能不相容，建議閱讀相關檔案以匹配使用版本。
提供 PaddleOCR 3.0 和 PaddleOCR-VL 的技術報告，展示其最新進展。
除了卓越的模型庫外，PaddleOCR 3.0 還提供模型訓練、推理和服務部署等使用者友善工具，加速 AI 應用落地。

主要功能

PaddleOCR 3.0 核心功能包括：

PaddleOCR-VL：透過 0.9B VLM 實現多語言檔案解析，是一個 SOTA 且資源高效的模型，支援 109 種語言並能識別複雜元素（如 text, tables, formulas, charts）。
PP-OCRv5：通用場景文字識別模型，單一模型支援五種文字型別（簡體中文、繁體中文、英文、日文、拼音），準確度提升 13%。
PP-StructureV3：複雜檔案解析，能將複雜的 PDF 和檔案影象智慧轉換為保持原始結構的 Markdown 和 JSON 檔案，在公共基準測試中優於眾多商業解決方案。
PP-ChatOCRv4：智慧資訊提取，原生整合 ERNIE 4.5，準確度較上一代提升 15%，能讓檔案「理解」您的問題並提供準確答案。
最新更新 (3.3.0) 釋出 PaddleOCR-VL，增強對 109 種語言的支援，並在頁面級檔案解析和元素級識別方面達到 SOTA 效能。
PP-OCRv5 多語言識別模型提升了拉丁字母識別的準確度和覆蓋範圍，並新增支援西里爾、阿拉伯、梵文等多種語言系統，覆蓋 109 種語言。
PP-Chart2Table 模組增強圖表轉表格功能，PP-DocTranslation 支援基於 PP-StructureV3 和 ERNIE 4.5 的檔案翻譯。
部署能力升級，全面支援 PaddlePaddle 3.1.0/3.1.1，C++ 本地部署解決方案升級，並支援 CUDA 12 及 Paddle Inference/ONNX Runtime 後端。

如何使用

線上試用：可透過線上 Demo 快速體驗 PaddleOCR 功能。
安裝 PaddleOCR 工具包：
- 僅需基礎文字識別功能（返回文字位置座標及內容）：python -m pip install paddleocr
- 需要所有功能（如檔案解析、檔案理解、檔案翻譯、關鍵資訊提取）：python -m pip install "paddleocr[all]"
- 可依需求安裝部分選用功能，例如 doc-parser、ie、trans 等依賴組。

透過 CLI 執行推理：

# 執行 PP-OCRv5 推理
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False  

# 執行 PP-StructureV3 推理
paddleocr pp_structurev3 -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png --use_doc_orientation_classify False --use_doc_unwarping False

# 執行 PaddleOCR-VL 推理
paddleocr doc_parser -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/paddleocr_vl_demo.png

透過 API 執行推理：

PP-OCRv5 範例：

from paddleocr import PaddleOCR
ocr = PaddleOCR(
    use_doc_orientation_classify=False,
    use_doc_unwarping=False,
    use_textline_orientation=False)
result = ocr.predict(
    input="https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png")
for res in result:
    res.print()
    res.save_to_json("output")

PP-StructureV3 範例：

from paddleocr import PPStructureV3
pipeline = PPStructureV3(
    use_doc_orientation_classify=False,
    use_doc_unwarping=False
)
output = pipeline.predict(
    input="https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png",
)
for res in output:
    res.print()
    res.save_to_markdown(save_path="output")

PP-ChatOCRv4 範例：

from paddleocr import PPChatOCRv4Doc
# 初始化 PPChatOCRv4Doc 例項並配置 ChatBot 模組，例如：
# chat_bot_config = {"module_name": "chat_bot", "model_name": "ernie-3.5-8k", "base_url": "..."}
# pipeline = PPChatOCRv4Doc(chat_bot_config=chat_bot_config)

📌 lfnovo/open-notebook

Description: An Open Source implementation of Notebook LM with more flexibility and features
🌐 TypeScript｜⭐️ 8,091 | 2726 stars this week

簡介

Open Notebook 是一個開源、注重隱私的專案，旨在提供一個多模型、100% 本地化且功能齊全的 Google Notebook LM 替代方案。它讓使用者能完全掌控其研究資料，並自由選擇多種 AI 模型，突破單一供應商限制，實現知識獲取與思考的自主權。

主要功能

隱私優先： 您的所有研究資料皆由您完全掌控，無需依賴雲端服務。
多模型 AI 支援： 支援超過 16 種 AI 模型提供商，包括 OpenAI、Anthropic、Ollama、Google、LM Studio 等，提供極高的靈活性。
支援多媒體內容： 可組織並處理 PDF、影片、音訊、網頁、Office 檔案等多種內容格式。
智慧搜尋與對話： 提供內容的全文搜尋與向量搜尋，並支援基於您研究資料的 AI 對話 (Context-Aware Chat)。
專業播客生成： 具備進階的多說話者播客生成功能，並可自訂 Episode Profiles。
AI 輔助筆記： 可手動建立筆記或利用 AI 生成洞察。
強大的 API 存取： 提供完整的 REST API，便於客製化整合與自動化。
細粒度上下文控制： 精確選擇與 AI 模型共享的內容範圍。

如何使用

快速開始：
- 透過 Docker 映像檔部署，可選擇 Docker Hub (lfnovo/open_notebook:v1-latest-single) 或 GitHub Container Registry (ghcr.io/lfnovo/open-notebook:v1-latest-single)。
部署選項：
- 本機部署 (Local Machine Setup)： 使用 docker run 指令在本地機器上執行，透過 http://localhost:8502 存取。
- 遠端伺服器部署 (Remote Server Setup)： 適用於遠端伺服器，需將 API_URL 環境變數設定為您的伺服器 IP 或網域。
- 使用 Docker Compose (推薦)： 建立 docker-compose.yml 檔案以簡化管理，定義服務、連線埠、環境變數及資料卷。
重要設定須知：
- 需同時開放 Port 8502 (Web UI) 和 Port 5055 (API 後端)。
- API_URL 變數必須與您實際存取伺服器的方式一致，遠端存取時請勿使用 localhost。
問題排除：
- 提供常見問題（如 "Unable to connect to server"、空白頁面、"404" 錯誤）及其解決方案，建議檢查連線埠開放狀態及 API_URL 設定。
架構簡述：
- 瀏覽器 (Port 8502) 載入 Next.js 前端，前端將 /api/* 請求代理至 FastAPI 後端 (Port 5055)，後端再與 SurrealDB 資料庫 (Port 8000) 互動。
開發者安裝：
- 欲進行開發或客製化，可透過 git clone 專案後執行 make start-all。
尋求協助：
- 提供專案的 CustomGPT、Getting Started Guide、Installation Guide 及 Quick Start Tutorial 等資源以協助使用者。

📌 EbookFoundation/free-programming-books

Description: 📚 Freely available programming books
🌐 Python｜⭐️ 374,982 | 2291 stars this week

簡介

這個列表最初是 StackOverflow 上「List of Freely Available Programming Books」的複製版。它由 Victor Felder 移至 GitHub 進行協作更新與維護，並在 Karan Bhangui 和 George Stocker 的貢獻下發展。目前由非營利組織 The Free Ebook Foundation 管理，已成為 GitHub 上最受歡迎的儲存庫之一，提供多種語言的免費學習資源。

主要功能

提供大量免費的學習資源，包括書籍、Cheat Sheets、線上課程、互動式程式設計資源等。
資源依「型別」與「語言」進行詳細分類，方便使用者查詢。
涵蓋多種國際語言，不限於英文，例如中文、日文、德文、法文、西班牙文等。
書籍資源細分為英文（依程式語言、主題）及其他語言。
收錄 Free Online Courses、Interactive Programming Resources、Problem Sets、Podcasts 和 Screencasts。
透過專屬網站 https://ebookfoundation.github.io/free-programming-books-search/ 提供可搜尋的資源列表。
支援在多個社群媒體平臺分享此資源，如 Facebook, LinkedIn, Mastodon/Fediverse, Telegram, 𝕏 (Twitter)。

如何使用

請訪問 https://ebookfoundation.github.io/free-programming-books-search/ 網站以搜尋和瀏覽所有資源。
該頁面作為一個易於閱讀的網站版本提供，點選連結即可直接訪問。
若有意貢獻，請務必閱讀 CONTRIBUTING 檔案以瞭解貢獻指南。
請遵守專案的 Code of Conduct (行為準則)，其譯本亦可提供。
您可以透過點選相關徽章來瞭解如何參與或提供幫助。
若要分享此資源，可使用提供的選項在 Facebook, LinkedIn, Mastodon/Fediverse, Telegram, 𝕏 (Twitter) 上分享。
資源按 Books (英文、其他語言), Cheat Sheets, Free Online Courses, Interactive Programming Resources 等型別分類，請依需求瀏覽。