📌 microsoft/generative-ai-for-beginners
Description: 21 Lessons, Get Started Building with Generative AI 🔗 https://microsoft.github.io/generative-ai-for-beginners/
🌐 Jupyter Notebook|⭐️ 91,226 | 5042 stars this week
簡介
此課程為 Microsoft Cloud Advocates 提供的 Generative AI 入門課程,包含 21 個教學單元,旨在教授建構 Generative AI 應用程式的基礎知識。課程涵蓋從 Generative AI 和大型語言模型 (LLM) 的基本概念到實際應用程式的開發,例如文字生成、聊天機器人、影像生成和搜尋應用程式等。課程支援多種語言,並提供 Python 和 TypeScript 的程式碼範例。 學習者需要一個 GitHub 帳號以及 Azure OpenAI 服務、GitHub Marketplace 模型目錄或 OpenAI API 之一。 課程也提供額外的學習資源和社群支援。
主要功能
- 提供 21 個教學單元,涵蓋 Generative AI 的各個面向。
- 每個單元包含簡短的影片介紹、書面教學、Python 和 TypeScript 程式碼範例以及額外的學習資源。
- 支援多種語言,方便全球學習者使用。
- 教學內容涵蓋各種 Generative AI 應用程式,例如文字生成、聊天機器人、影像生成、搜尋應用程式以及低程式碼 AI 應用程式。
- 涵蓋 prompt engineering 的技巧,以及如何負責任地開發 Generative AI 應用程式。
- 探討 Generative AI 應用程式的 UX 設計、安全性和生命週期管理。
- 提供使用 Azure OpenAI 服務、GitHub Marketplace 模型目錄和 OpenAI API 的程式碼範例。
- 提供社群支援平臺,方便學習者交流和獲得協助。
如何使用
- 建立一個 GitHub 帳號並複製此課程的程式碼庫。
- 根據課程提供的指示設定開發環境,選擇 Azure OpenAI Service、GitHub Marketplace Model Catalog 或 OpenAI API 作為程式碼執行環境。
- 按照課程順序或依據個人需求選擇單元進行學習。
- 每個單元包含影片、文字說明和程式碼範例,學習者可以參考這些資源學習相關概念並實作程式碼。
- 遇到問題可以參考額外的學習資源或加入 Azure AI Foundry Discord 伺服器尋求協助。
- 完成課程後,可以嘗試使用學習到的知識建構自己的 Generative AI 應用程式。
- 課程標示 "Learn" 單元為概念教學,"Build" 單元則包含程式碼實作範例。
📌 GraphiteEditor/Graphite
Description: An open source graphics editor for 2025: comprehensive 2D content creation tool suite for graphic design, digital art, and interactive real-time motion graphics — featuring node-based procedural editing
🌐 Rust|⭐️ 18,308 | 4676 stars this week
簡介
- Graphite 是一個免費且開源的向量和光柵圖形引擎,目前處於 Alpha 階段。
- 它結合了基於圖層的合成和基於節點的生成設計,提供完全非破壞性的編輯流程。
- Graphite 起源於向量編輯器,現正發展成為一個多功能的圖形工具箱,其架構更像遊戲引擎而非傳統創意應用程式。
- 它將工具與節點圖核心整合,提供使用者友善的工作流程,適用於向量、光柵及其他圖形型別。
- 未來規劃包含照片編輯、動態圖形、數位繪畫、桌面出版和視覺特效合成等功能。
- Graphite 致力於成為一個功能齊全且人人可用的藝術與設計工具。
- 專案完全由社群建立和資助。
主要功能
- 基於圖層的合成 (Layer-based compositing)
- 基於節點的生成設計 (Node-based generative design)
- 向量圖形編輯 (Vector graphics editing)
- 光柵圖形編輯 (Raster graphics editing)
- 非破壞性編輯流程 (Nondestructive editing workflow)
- 將持續擴充套件功能至照片編輯、動態圖形、數位繪畫、桌面出版和視覺特效合成等領域。
如何使用
- 目前資訊有限,需參考網站及其他檔案取得更詳細的使用說明。
- 專案仍處於 Alpha 階段,功能和介面可能持續更新。
- 可透過貢獻程式碼或捐款支援專案發展。
- 可訂閱電子報以獲取最新資訊。
- 可以參考提供的範例影片
Demo.Compilation.Video.mp4
(但檔案未提供)。 - 專案的程式碼也對開發者開放貢獻。
📌 NanmiCoder/MediaCrawler
Description: 小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
🌐 Python|⭐️ 27,299 | 3360 stars this week
簡介
MediaCrawler 是一個功能強大的多平臺自媒體資料採集工具,支援小紅書、抖音、快手、B站、微博、貼吧、知乎等主流平臺的公開資訊抓取。其核心技術基於 Playwright 瀏覽器自動化框架,無需 JS 逆向,利用保留登入態的瀏覽器上下文環境,透過 JS 表示式獲取簽名引數,大幅降低技術門檻。 該專案提供多種資料儲存方式,包括 MySQL 資料庫、CSV 檔案和 JSON 檔案。 此外,還有進階版 MediaCrawlerPro,提供更多功能和最佳化的架構設計,例如斷點續爬、多帳號和 IP 代理池支援等。
主要功能
- 支援多平臺:小紅書、抖音、快手、B站、微博、貼吧、知乎。
- 關鍵字搜尋:根據關鍵字搜尋相關帖子。
- 指定帖子 ID 爬取:根據 ID 爬取特定帖子。
- 二級評論爬取:獲取帖子的二級評論。
- 指定創作者主頁爬取:爬取指定創作者的主頁資訊。
- 登入態快取:儲存登入狀態以提高效率。
- IP 代理池:支援使用 IP 代理池,提升爬取穩定性。
- 生成評論詞雲圖:將評論資料生成詞雲圖。
- (MediaCrawlerPro) 斷點續爬功能。
- (MediaCrawlerPro) 多帳號 + IP 代理池支援。
如何使用
- 安裝前置依賴:uv、Node.js (>= 16.0.0) 和 Python 相關套件 (使用
uv sync
或pip install -r requirements.txt
)。 - 安裝 Playwright 瀏覽器驅動:
uv run playwright install
或playwright install
。 - 配置:修改
config/base_config.py
檔案中的設定,例如啟用評論爬取 (ENABLE_GET_COMMENTS
) 等。 - 執行爬蟲程式:使用
uv run main.py --platform [平臺] --lt [登入方式] --type [搜尋型別]
命令執行,例如uv run main.py --platform xhs --lt qrcode --type search
(小紅書關鍵字搜尋)。python main.py ...
適用於原生 Python 環境。 - 資料儲存:支援儲存至 MySQL 資料庫 (需自行初始化資料庫)、CSV 檔案或 JSON 檔案。 資料儲存位置在
data/
目錄下。 使用python db.py
初始化 MySQL 資料庫表格結構 (首次執行)。
📌 twentyhq/twenty
Description: Building a modern alternative to Salesforce, powered by the community.
🌐 TypeScript|⭐️ 33,273 | 3340 stars this week
簡介
Twenty 是一款領先的開源 CRM 系統,旨在解決現有 CRM 系統價格昂貴且缺乏彈性的問題。它以使用者體驗為核心,從Notion、Airtable和Linear等工具汲取靈感,並藉由開源和社群的力量共同打造更完善的產品。Twenty 提供了一個全新的解決方案,讓使用者能自由掌控自己的客戶資料,並透過外掛生態系統持續擴充套件功能。
主要功能
- 客製化佈局:支援篩選、排序、分組、看板和表格檢視。
- 客製化物件和欄位:彈性調整資料結構以符合特定需求。
- 自定義許可權管理:透過自定義角色來管理使用者許可權。
- 工作流程自動化:利用觸發器和動作自動執行任務。
- 整合多種功能:支援電子郵件、日曆事件、檔案管理等功能。
如何使用
Twenty 提供兩種安裝方式:🚀 Self-hosting (自行託管) 和 🖥️ Local Setup (本地安裝),詳細步驟請參考檔案說明。 使用者可以根據自身需求選擇合適的安裝方法。 目前已實作的功能包含客製化佈局、物件和欄位客製化、許可權管理以及工作流程自動化等,更多功能持續開發中。 如有任何特定需求,歡迎提交 issue 反饋。
📌 stanford-oval/storm
Description: An LLM-powered knowledge curation system that researches a topic and generates a full-length report with citations.
🌐 Python|⭐️ 26,156 | 1486 stars this week
簡介
STORM 是一個大型語言模型 (LLM) 系統,能根據網路搜尋結果從頭撰寫類似維基百科的文章。其後續版本 Co-STORM 更進一步強化功能,允許人類與 LLM 系統協作,以獲得更一致且符合偏好的資訊搜尋和知識整理結果。雖然系統無法產生可直接發表的文章(通常需要大量編輯),但經驗豐富的維基百科編輯發現它在撰寫前的階段非常有幫助。超過七萬人體驗過我們的線上研究預覽版。
主要功能
- STORM: 將產生帶有引註的長篇文章分解成兩個步驟:預寫階段(收集參考資訊並產生大綱)和撰寫階段(使用大綱和參考資訊產生完整文章及引註)。
- STORM 的問答策略: 採用「Perspective-Guided Question Asking」和「Simulated Conversation」兩種策略,提升問題的深度和廣度,避免直接提示語言模型提問的低效。
- Co-STORM: 提出協作式論述協議,透過轉換管理策略支援人類與多種 LLM 代理(Co-STORM 專家、主持人)之間的順暢協作。
- Co-STORM 的動態思維導圖: 組織收集到的資訊,建立使用者與系統間共享的概念空間,以減輕長時間深入討論時的認知負擔。
- 模組化設計: STORM 和 Co-STORM 都以高度模組化的方式使用 dspy 進行實作,方便客製化。
- 支援多種模型和搜尋引擎: 支援 litellm 支援的所有語言模型和嵌入模型,以及多種搜尋引擎 (YouRM, BingSearch, VectorRM 等)。
如何使用
- 安裝: 使用
pip install knowledge-storm
安裝套件,或複製原始碼並安裝所需套件。 - API 使用 (STORM): 使用
STORMWikiRunner
類別,設定語言模型、搜尋引擎,並透過run()
方法執行,引數do_research
,do_generate_outline
,do_generate_article
,do_polish_article
控制各階段執行與否。程式碼範例中使用了 You.com 搜尋引擎和 OpenAI 模型。 - API 使用 (Co-STORM): 使用
CoStormRunner
類別,設定語言模型、搜尋引擎,並使用warm_start()
方法啟動,接著透過step()
方法逐步進行協作式討論,並使用generate_report()
生成報告。程式碼範例中使用了 Bing 搜尋引擎和 OpenAI 模型。 - 範例指令碼:
examples
資料夾提供範例指令碼,方便快速上手。 - 客製化 (STORM): 可修改
knowledge_storm/storm_wiki/modules/*
中的模組,客製化知識整理、大綱產生、文章產生和文章潤飾等模組。 - 客製化 (Co-STORM): 可修改
knowledge_storm/collaborative_storm/modules/co_storm_agents.py
中的 LLM 代理和knowledge_storm/collaborative_storm/engine.py
中的DiscourseManager
,客製化 LLM 代理策略和轉換管理策略。 - 設定 API 金鑰: 使用
secrets.toml
檔案設定 API 金鑰。