[6/30 - 7/6] GitHub Weekly Digest

📌 microsoft/generative-ai-for-beginners

Description: 21 Lessons, Get Started Building with Generative AI 🔗 https://microsoft.github.io/generative-ai-for-beginners/
🌐 Jupyter Notebook｜⭐️ 91,226 | 5042 stars this week

簡介

此課程為 Microsoft Cloud Advocates 提供的 Generative AI 入門課程，包含 21 個教學單元，旨在教授建構 Generative AI 應用程式的基礎知識。課程涵蓋從 Generative AI 和大型語言模型 (LLM) 的基本概念到實際應用程式的開發，例如文字生成、聊天機器人、影像生成和搜尋應用程式等。課程支援多種語言，並提供 Python 和 TypeScript 的程式碼範例。學習者需要一個 GitHub 帳號以及 Azure OpenAI 服務、GitHub Marketplace 模型目錄或 OpenAI API 之一。課程也提供額外的學習資源和社群支援。

主要功能

提供 21 個教學單元，涵蓋 Generative AI 的各個面向。
每個單元包含簡短的影片介紹、書面教學、Python 和 TypeScript 程式碼範例以及額外的學習資源。
支援多種語言，方便全球學習者使用。
教學內容涵蓋各種 Generative AI 應用程式，例如文字生成、聊天機器人、影像生成、搜尋應用程式以及低程式碼 AI 應用程式。
涵蓋 prompt engineering 的技巧，以及如何負責任地開發 Generative AI 應用程式。
探討 Generative AI 應用程式的 UX 設計、安全性和生命週期管理。
提供使用 Azure OpenAI 服務、GitHub Marketplace 模型目錄和 OpenAI API 的程式碼範例。
提供社群支援平臺，方便學習者交流和獲得協助。

如何使用

建立一個 GitHub 帳號並複製此課程的程式碼庫。
根據課程提供的指示設定開發環境，選擇 Azure OpenAI Service、GitHub Marketplace Model Catalog 或 OpenAI API 作為程式碼執行環境。
按照課程順序或依據個人需求選擇單元進行學習。
每個單元包含影片、文字說明和程式碼範例，學習者可以參考這些資源學習相關概念並實作程式碼。
遇到問題可以參考額外的學習資源或加入 Azure AI Foundry Discord 伺服器尋求協助。
完成課程後，可以嘗試使用學習到的知識建構自己的 Generative AI 應用程式。
課程標示 "Learn" 單元為概念教學，"Build" 單元則包含程式碼實作範例。

📌 GraphiteEditor/Graphite

Description: An open source graphics editor for 2025: comprehensive 2D content creation tool suite for graphic design, digital art, and interactive real-time motion graphics — featuring node-based procedural editing
🌐 Rust｜⭐️ 18,308 | 4676 stars this week

簡介

Graphite 是一個免費且開源的向量和光柵圖形引擎，目前處於 Alpha 階段。
它結合了基於圖層的合成和基於節點的生成設計，提供完全非破壞性的編輯流程。
Graphite 起源於向量編輯器，現正發展成為一個多功能的圖形工具箱，其架構更像遊戲引擎而非傳統創意應用程式。
它將工具與節點圖核心整合，提供使用者友善的工作流程，適用於向量、光柵及其他圖形型別。
未來規劃包含照片編輯、動態圖形、數位繪畫、桌面出版和視覺特效合成等功能。
Graphite 致力於成為一個功能齊全且人人可用的藝術與設計工具。
專案完全由社群建立和資助。

主要功能

基於圖層的合成 (Layer-based compositing)
基於節點的生成設計 (Node-based generative design)
向量圖形編輯 (Vector graphics editing)
光柵圖形編輯 (Raster graphics editing)
非破壞性編輯流程 (Nondestructive editing workflow)
將持續擴充套件功能至照片編輯、動態圖形、數位繪畫、桌面出版和視覺特效合成等領域。

如何使用

目前資訊有限，需參考網站及其他檔案取得更詳細的使用說明。
專案仍處於 Alpha 階段，功能和介面可能持續更新。
可透過貢獻程式碼或捐款支援專案發展。
可訂閱電子報以獲取最新資訊。
可以參考提供的範例影片 Demo.Compilation.Video.mp4 (但檔案未提供)。
專案的程式碼也對開發者開放貢獻。

📌 NanmiCoder/MediaCrawler

簡介

MediaCrawler 是一個功能強大的多平臺自媒體資料採集工具，支援小紅書、抖音、快手、B站、微博、貼吧、知乎等主流平臺的公開資訊抓取。其核心技術基於 Playwright 瀏覽器自動化框架，無需 JS 逆向，利用保留登入態的瀏覽器上下文環境，透過 JS 表示式獲取簽名引數，大幅降低技術門檻。該專案提供多種資料儲存方式，包括 MySQL 資料庫、CSV 檔案和 JSON 檔案。此外，還有進階版 MediaCrawlerPro，提供更多功能和最佳化的架構設計，例如斷點續爬、多帳號和 IP 代理池支援等。

主要功能

支援多平臺：小紅書、抖音、快手、B站、微博、貼吧、知乎。
關鍵字搜尋：根據關鍵字搜尋相關帖子。
指定帖子 ID 爬取：根據 ID 爬取特定帖子。
二級評論爬取：獲取帖子的二級評論。
指定創作者主頁爬取：爬取指定創作者的主頁資訊。
登入態快取：儲存登入狀態以提高效率。
IP 代理池：支援使用 IP 代理池，提升爬取穩定性。
生成評論詞雲圖：將評論資料生成詞雲圖。
(MediaCrawlerPro) 斷點續爬功能。
(MediaCrawlerPro) 多帳號 + IP 代理池支援。

如何使用

安裝前置依賴：uv、Node.js (>= 16.0.0) 和 Python 相關套件 (使用 uv sync 或 pip install -r requirements.txt)。
安裝 Playwright 瀏覽器驅動：uv run playwright install 或 playwright install。
配置：修改 config/base_config.py 檔案中的設定，例如啟用評論爬取 (ENABLE_GET_COMMENTS) 等。
執行爬蟲程式：使用 uv run main.py --platform [平臺] --lt [登入方式] --type [搜尋型別] 命令執行，例如 uv run main.py --platform xhs --lt qrcode --type search (小紅書關鍵字搜尋)。 python main.py ... 適用於原生 Python 環境。
資料儲存：支援儲存至 MySQL 資料庫 (需自行初始化資料庫)、CSV 檔案或 JSON 檔案。資料儲存位置在 data/ 目錄下。使用 python db.py 初始化 MySQL 資料庫表格結構 (首次執行)。

📌 twentyhq/twenty

Description: Building a modern alternative to Salesforce, powered by the community.
🌐 TypeScript｜⭐️ 33,273 | 3340 stars this week

簡介

Twenty 是一款領先的開源 CRM 系統，旨在解決現有 CRM 系統價格昂貴且缺乏彈性的問題。它以使用者體驗為核心，從Notion、Airtable和Linear等工具汲取靈感，並藉由開源和社群的力量共同打造更完善的產品。Twenty 提供了一個全新的解決方案，讓使用者能自由掌控自己的客戶資料，並透過外掛生態系統持續擴充套件功能。

主要功能

客製化佈局：支援篩選、排序、分組、看板和表格檢視。
客製化物件和欄位：彈性調整資料結構以符合特定需求。
自定義許可權管理：透過自定義角色來管理使用者許可權。
工作流程自動化：利用觸發器和動作自動執行任務。
整合多種功能：支援電子郵件、日曆事件、檔案管理等功能。

如何使用

Twenty 提供兩種安裝方式：🚀 Self-hosting (自行託管) 和 🖥️ Local Setup (本地安裝)，詳細步驟請參考檔案說明。使用者可以根據自身需求選擇合適的安裝方法。目前已實作的功能包含客製化佈局、物件和欄位客製化、許可權管理以及工作流程自動化等，更多功能持續開發中。如有任何特定需求，歡迎提交 issue 反饋。

📌 stanford-oval/storm

Description: An LLM-powered knowledge curation system that researches a topic and generates a full-length report with citations.
🌐 Python｜⭐️ 26,156 | 1486 stars this week

簡介

STORM 是一個大型語言模型 (LLM) 系統，能根據網路搜尋結果從頭撰寫類似維基百科的文章。其後續版本 Co-STORM 更進一步強化功能，允許人類與 LLM 系統協作，以獲得更一致且符合偏好的資訊搜尋和知識整理結果。雖然系統無法產生可直接發表的文章（通常需要大量編輯），但經驗豐富的維基百科編輯發現它在撰寫前的階段非常有幫助。超過七萬人體驗過我們的線上研究預覽版。

主要功能

STORM: 將產生帶有引註的長篇文章分解成兩個步驟：預寫階段（收集參考資訊並產生大綱）和撰寫階段（使用大綱和參考資訊產生完整文章及引註）。
STORM 的問答策略: 採用「Perspective-Guided Question Asking」和「Simulated Conversation」兩種策略，提升問題的深度和廣度，避免直接提示語言模型提問的低效。
Co-STORM: 提出協作式論述協議，透過轉換管理策略支援人類與多種 LLM 代理（Co-STORM 專家、主持人）之間的順暢協作。
Co-STORM 的動態思維導圖: 組織收集到的資訊，建立使用者與系統間共享的概念空間，以減輕長時間深入討論時的認知負擔。
模組化設計: STORM 和 Co-STORM 都以高度模組化的方式使用 dspy 進行實作，方便客製化。
支援多種模型和搜尋引擎: 支援 litellm 支援的所有語言模型和嵌入模型，以及多種搜尋引擎 (YouRM, BingSearch, VectorRM 等)。

如何使用

安裝: 使用 pip install knowledge-storm 安裝套件，或複製原始碼並安裝所需套件。
API 使用 (STORM): 使用 STORMWikiRunner 類別，設定語言模型、搜尋引擎，並透過 run() 方法執行，引數 do_research, do_generate_outline, do_generate_article, do_polish_article 控制各階段執行與否。程式碼範例中使用了 You.com 搜尋引擎和 OpenAI 模型。
API 使用 (Co-STORM): 使用 CoStormRunner 類別，設定語言模型、搜尋引擎，並使用 warm_start() 方法啟動，接著透過 step() 方法逐步進行協作式討論，並使用 generate_report() 生成報告。程式碼範例中使用了 Bing 搜尋引擎和 OpenAI 模型。
範例指令碼: examples 資料夾提供範例指令碼，方便快速上手。
客製化 (STORM): 可修改 knowledge_storm/storm_wiki/modules/* 中的模組，客製化知識整理、大綱產生、文章產生和文章潤飾等模組。
客製化 (Co-STORM): 可修改 knowledge_storm/collaborative_storm/modules/co_storm_agents.py 中的 LLM 代理和 knowledge_storm/collaborative_storm/engine.py 中的 DiscourseManager，客製化 LLM 代理策略和轉換管理策略。
設定 API 金鑰: 使用 secrets.toml 檔案設定 API 金鑰。