📌 mountain-loop/yaak
Description: The most intuitive desktop API client. Organize and execute REST, GraphQL, WebSockets, Server Sent Events, and gRPC 🦬
🌐 TypeScript|⭐️ 13,761 | 5695 stars this week
簡介
Yaak 是一款專為 REST, GraphQL, SSE, WebSocket, 和 gRPC 設計的桌面 API Client,其開發宗旨是提供一個快速、注重隱私且離線優先的工具。此應用程式採用 Tauri, Rust, 和 React 技術構建,確保其輕量化與高效能,同時承諾不收集任何遙測資料 (telemetry),不依賴風投基金 (VC funding),並且無雲端服務鎖定 (cloud lock-in),完全保護使用者隱私。其開發主要由社群購買的許可證資助。
主要功能
- 支援廣泛的 API 型別,包括 REST, GraphQL, gRPC, WebSocket, 和 Server-Sent Events。
- 可從 Postman, Insomnia, OpenAPI, Swagger, 或 Curl 輕鬆匯入 API collections。
- 提供強大的 response 檢查工具,可使用 JSONPath 或 XPath 進行篩選。
- 內建多種安全認證機制,如 OAuth 2.0, JWT, Basic Auth,並支援自定義 plugins。
- 透過加密 secrets 保護敏感值,並將其安全地儲存於 OS keychain。
- 具備請求組織功能,可在 workspaces 和巢狀資料夾中管理 requests。
- 支援 environment variables,方便在 dev, staging, prod 環境間切換配置。
- 提供擴充套件與自定義選項,例如透過 template tags 插入動態值 (如 UUIDs, timestamps),並支援多樣主題。
如何使用
- 提供的內容中未包含此部分的資訊。
📌 anthropics/claude-cookbooks
Description: A collection of notebooks/recipes showcasing some fun and effective ways of using Claude.
🌐 Jupyter Notebook|⭐️ 25,329 | 4141 stars this week
簡介
Claude Cookbooks 提供了程式碼與指南,旨在協助開發者運用 Claude 進行建置,並提供可直接複製的程式碼片段,方便輕鬆整合至您的專案中。雖然範例主要以 Python 編寫,但其概念可應用於任何支援 Claude API 互動的程式語言。
- 提供程式碼範例和指南,協助開發者使用 Claude 進行建構。
- 包含可直接複製的程式碼片段,便於整合至個人專案。
- 主要以 Python 編寫程式碼範例,但概念可適用於任何支援 Claude API 互動的程式語言。
- 推薦新使用者從 Claude API Fundamentals 課程開始,建立穩固基礎。
- 提供 Anthropic 開發者檔案、支援檔案和 Discord 社群連結,供進一步探索。
主要功能
- 核心功能 (Capabilities):
Classification: 探索使用 Claude 進行文字和資料分類的技術。Retrieval Augmented Generation: 學習如何利用外部知識增強 Claude 的回應。Summarization: 發現使用 Claude 進行有效文字摘要的技術。
- 工具使用與整合 (Tool Use and Integration):
- 學習如何將 Claude 與外部工具和功能整合,以擴充套件其能力,例如客戶服務代理、Calculator integration、SQL queries。
- 第三方整合 (Third-Party Integrations):
- 透過外部資料來源補充 Claude 的知識,包括 Vector databases (Pinecone)、Wikipedia、Web pages。
- 使用 Voyage AI 進行
Embeddings。
- 多模態能力 (Multimodal Capabilities):
Vision with Claude: 涵蓋影象入門、視覺最佳實踐、圖表解釋、表單內容擷取。Generate images with Claude: 使用 Claude 結合 Stable Diffusion 進行影象生成。
- 進階技術 (Advanced Techniques):
Sub-agents: 學習如何將 Haiku 作為sub-agent與 Opus 結合使用。Upload PDFs to Claude: 解析 PDF 並將其內容作為文字傳遞給 Claude。
如何使用
- 需具備 Claude API key 才能充分利用 Cookbooks 中的範例。
- 程式碼範例主要以 Python 編寫,但其概念可適用於任何支援 Claude API 互動的程式語言。
- 建議不熟悉 Claude API 的使用者,可先修習 Claude API Fundamentals 課程以建立基礎。
- Cookbooks 提供可直接複製的程式碼片段,方便開發者輕鬆整合到自己的專案中。
📌 PaddlePaddle/PaddleOCR
Description: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
🌐 Python|⭐️ 61,179 | 2903 stars this week
PaddleOCR是一個業界領先的OCR與檔案AI引擎,提供從文字提取到智慧檔案理解的端到端解決方案,支援多語言檔案解析、複雜結構轉換及智慧資訊提取。
簡介
- PaddleOCR 是一個業界領先、生產就緒的 OCR 和檔案 AI 引擎,提供從文字提取到智慧檔案理解的端到端解決方案。
- 它能將檔案和影象轉換為結構化的 AI 友好資料(如 JSON 和 Markdown),具有業界領先的準確性。
- 廣泛應用於獨立開發者、新創公司到大型企業的 AI 應用,以其在 AI 時代構建智慧檔案應用而聞名。
- 在 GitHub 上擁有超過 50,000 顆星,並深度整合至 MinerU、RAGFlow 和 OmniParser 等領先專案。
- PaddleOCR 3.0 引入了重大介面變更,舊版程式碼可能不相容,建議閱讀相關檔案以匹配使用版本。
- 提供 PaddleOCR 3.0 和 PaddleOCR-VL 的技術報告,展示其最新進展。
- 除了卓越的模型庫外,PaddleOCR 3.0 還提供模型訓練、推理和服務部署等使用者友善工具,加速 AI 應用落地。
主要功能
PaddleOCR 3.0 核心功能包括:
- PaddleOCR-VL:透過 0.9B VLM 實現多語言檔案解析,是一個 SOTA 且資源高效的模型,支援 109 種語言並能識別複雜元素(如 text, tables, formulas, charts)。
- PP-OCRv5:通用場景文字識別模型,單一模型支援五種文字型別(簡體中文、繁體中文、英文、日文、拼音),準確度提升 13%。
- PP-StructureV3:複雜檔案解析,能將複雜的 PDF 和檔案影象智慧轉換為保持原始結構的 Markdown 和 JSON 檔案,在公共基準測試中優於眾多商業解決方案。
- PP-ChatOCRv4:智慧資訊提取,原生整合 ERNIE 4.5,準確度較上一代提升 15%,能讓檔案「理解」您的問題並提供準確答案。
- 最新更新 (3.3.0) 釋出 PaddleOCR-VL,增強對 109 種語言的支援,並在頁面級檔案解析和元素級識別方面達到 SOTA 效能。
- PP-OCRv5 多語言識別模型提升了拉丁字母識別的準確度和覆蓋範圍,並新增支援西里爾、阿拉伯、梵文等多種語言系統,覆蓋 109 種語言。
- PP-Chart2Table 模組增強圖表轉表格功能,PP-DocTranslation 支援基於 PP-StructureV3 和 ERNIE 4.5 的檔案翻譯。
- 部署能力升級,全面支援 PaddlePaddle 3.1.0/3.1.1,C++ 本地部署解決方案升級,並支援 CUDA 12 及 Paddle Inference/ONNX Runtime 後端。
如何使用
- 線上試用:可透過線上 Demo 快速體驗 PaddleOCR 功能。
- 安裝 PaddleOCR 工具包:
- 僅需基礎文字識別功能(返回文字位置座標及內容):
python -m pip install paddleocr - 需要所有功能(如檔案解析、檔案理解、檔案翻譯、關鍵資訊提取):
python -m pip install "paddleocr[all]" - 可依需求安裝部分選用功能,例如
doc-parser、ie、trans等依賴組。
- 僅需基礎文字識別功能(返回文字位置座標及內容):
- 透過 CLI 執行推理:
# 執行 PP-OCRv5 推理 paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False # 執行 PP-StructureV3 推理 paddleocr pp_structurev3 -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png --use_doc_orientation_classify False --use_doc_unwarping False # 執行 PaddleOCR-VL 推理 paddleocr doc_parser -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/paddleocr_vl_demo.png - 透過 API 執行推理:
- PP-OCRv5 範例:
from paddleocr import PaddleOCR ocr = PaddleOCR( use_doc_orientation_classify=False, use_doc_unwarping=False, use_textline_orientation=False) result = ocr.predict( input="https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png") for res in result: res.print() res.save_to_json("output") - PP-StructureV3 範例:
from paddleocr import PPStructureV3 pipeline = PPStructureV3( use_doc_orientation_classify=False, use_doc_unwarping=False ) output = pipeline.predict( input="https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png", ) for res in output: res.print() res.save_to_markdown(save_path="output") - PP-ChatOCRv4 範例:
from paddleocr import PPChatOCRv4Doc # 初始化 PPChatOCRv4Doc 例項並配置 ChatBot 模組,例如: # chat_bot_config = {"module_name": "chat_bot", "model_name": "ernie-3.5-8k", "base_url": "..."} # pipeline = PPChatOCRv4Doc(chat_bot_config=chat_bot_config)
- PP-OCRv5 範例:
📌 lfnovo/open-notebook
Description: An Open Source implementation of Notebook LM with more flexibility and features
🌐 TypeScript|⭐️ 8,091 | 2726 stars this week
簡介
Open Notebook 是一個開源、注重隱私的專案,旨在提供一個多模型、100% 本地化且功能齊全的 Google Notebook LM 替代方案。它讓使用者能完全掌控其研究資料,並自由選擇多種 AI 模型,突破單一供應商限制,實現知識獲取與思考的自主權。
主要功能
- 隱私優先: 您的所有研究資料皆由您完全掌控,無需依賴雲端服務。
- 多模型 AI 支援: 支援超過 16 種 AI 模型提供商,包括 OpenAI、Anthropic、Ollama、Google、LM Studio 等,提供極高的靈活性。
- 支援多媒體內容: 可組織並處理 PDF、影片、音訊、網頁、Office 檔案等多種內容格式。
- 智慧搜尋與對話: 提供內容的全文搜尋與向量搜尋,並支援基於您研究資料的 AI 對話 (Context-Aware Chat)。
- 專業播客生成: 具備進階的多說話者播客生成功能,並可自訂 Episode Profiles。
- AI 輔助筆記: 可手動建立筆記或利用 AI 生成洞察。
- 強大的 API 存取: 提供完整的 REST API,便於客製化整合與自動化。
- 細粒度上下文控制: 精確選擇與 AI 模型共享的內容範圍。
如何使用
- 快速開始:
- 透過 Docker 映像檔部署,可選擇 Docker Hub (
lfnovo/open_notebook:v1-latest-single) 或 GitHub Container Registry (ghcr.io/lfnovo/open-notebook:v1-latest-single)。
- 透過 Docker 映像檔部署,可選擇 Docker Hub (
- 部署選項:
- 本機部署 (Local Machine Setup): 使用
docker run指令在本地機器上執行,透過http://localhost:8502存取。 - 遠端伺服器部署 (Remote Server Setup): 適用於遠端伺服器,需將
API_URL環境變數設定為您的伺服器 IP 或網域。 - 使用 Docker Compose (推薦): 建立
docker-compose.yml檔案以簡化管理,定義服務、連線埠、環境變數及資料卷。
- 本機部署 (Local Machine Setup): 使用
- 重要設定須知:
- 需同時開放 Port
8502(Web UI) 和 Port5055(API 後端)。 API_URL變數必須與您實際存取伺服器的方式一致,遠端存取時請勿使用localhost。
- 需同時開放 Port
- 問題排除:
- 提供常見問題(如 "Unable to connect to server"、空白頁面、"404" 錯誤)及其解決方案,建議檢查連線埠開放狀態及
API_URL設定。
- 提供常見問題(如 "Unable to connect to server"、空白頁面、"404" 錯誤)及其解決方案,建議檢查連線埠開放狀態及
- 架構簡述:
- 瀏覽器 (Port 8502) 載入 Next.js 前端,前端將
/api/*請求代理至 FastAPI 後端 (Port 5055),後端再與 SurrealDB 資料庫 (Port 8000) 互動。
- 瀏覽器 (Port 8502) 載入 Next.js 前端,前端將
- 開發者安裝:
- 欲進行開發或客製化,可透過
git clone專案後執行make start-all。
- 欲進行開發或客製化,可透過
- 尋求協助:
- 提供專案的 CustomGPT、Getting Started Guide、Installation Guide 及 Quick Start Tutorial 等資源以協助使用者。
📌 EbookFoundation/free-programming-books
Description: 📚 Freely available programming books
🌐 Python|⭐️ 374,982 | 2291 stars this week
簡介
這個列表最初是 StackOverflow 上「List of Freely Available Programming Books」的複製版。它由 Victor Felder 移至 GitHub 進行協作更新與維護,並在 Karan Bhangui 和 George Stocker 的貢獻下發展。目前由非營利組織 The Free Ebook Foundation 管理,已成為 GitHub 上最受歡迎的儲存庫之一,提供多種語言的免費學習資源。
主要功能
- 提供大量免費的學習資源,包括書籍、Cheat Sheets、線上課程、互動式程式設計資源等。
- 資源依「型別」與「語言」進行詳細分類,方便使用者查詢。
- 涵蓋多種國際語言,不限於英文,例如中文、日文、德文、法文、西班牙文等。
- 書籍資源細分為英文(依程式語言、主題)及其他語言。
- 收錄 Free Online Courses、Interactive Programming Resources、Problem Sets、Podcasts 和 Screencasts。
- 透過專屬網站
https://ebookfoundation.github.io/free-programming-books-search/提供可搜尋的資源列表。 - 支援在多個社群媒體平臺分享此資源,如 Facebook, LinkedIn, Mastodon/Fediverse, Telegram, 𝕏 (Twitter)。
如何使用
- 請訪問
https://ebookfoundation.github.io/free-programming-books-search/網站以搜尋和瀏覽所有資源。 - 該頁面作為一個易於閱讀的網站版本提供,點選連結即可直接訪問。
- 若有意貢獻,請務必閱讀
CONTRIBUTING檔案以瞭解貢獻指南。 - 請遵守專案的 Code of Conduct (行為準則),其譯本亦可提供。
- 您可以透過點選相關徽章來瞭解如何參與或提供幫助。
- 若要分享此資源,可使用提供的選項在 Facebook, LinkedIn, Mastodon/Fediverse, Telegram, 𝕏 (Twitter) 上分享。
- 資源按 Books (英文、其他語言), Cheat Sheets, Free Online Courses, Interactive Programming Resources 等型別分類,請依需求瀏覽。