1、all-rag-techniques
旨在通过简单、动手实践的方式,深入解析检索增强生成 (RAG) 的各种高级技术。项目不依赖 LangChain 或 FAISS 等框架,而是采用 Python 基础库实现,确保代码可读、可修改、具有教育意义。它涵盖了从 Simple RAG 到 Graph RAG、Hierarchy RAG、以及融合强化学习和知识图谱处理大数据的20多种 RAG 技术,并提供详细的解释、分步实现、代码示例和评估,帮助开发者理解 RAG 的工作原理,促进 RAG 技术的普及和应用。
2、DRA-Ctrl
DRA-Ctrl 是由 Hengyuan Cao 等人提出的一项创新研究,它探索了视频生成模型在可控图像合成领域的潜力。该方法通过维度降低攻击 (Dimension-Reduction Attack) 范式,将视频模型的长程上下文建模和全注意力优势应用于图像生成任务。为弥合视频连续性与图像离散性之间的鸿沟,DRA-Ctrl 引入了混合过渡策略和定制的注意力掩码机制,以更好地对齐文本提示和图像控制。实验证明,该方法在主体驱动和空间条件生成等任务中表现优于直接训练的图像模型,为统一视觉生成模型奠定了基础。
1、claudia
Claudia 是一款基于 Tauri 2 构建的强大桌面应用,旨在彻底改变用户与 Claude Code 的交互方式。它提供直观的图形用户界面,帮助用户管理 Claude Code 项目和会话,创建和定制化 AI 代理,并通过高级沙箱功能确保安全执行。此外,Claudia 还集成了详细的用量分析仪表盘、MCP 服务器管理、会话时间线与检查点功能,以及 CLAUDE.md 文件编辑工具,将命令行工具的强大功能与视觉化体验相结合,显著提升 AI 辅助开发的效率和生产力。
1、tools
Strands Agents Tools提供了一个强大的模型驱动方法,通过少量代码即可构建AI Agent。它提供了一系列即用型工具,弥合了大型语言模型与实际应用之间的鸿沟,涵盖文件操作、Shell集成、内存管理(支持Mem0和Amazon Bedrock知识库)、HTTP客户端、Slack客户端、Python执行、数学工具、AWS集成、图像/视频处理、音频输出、环境管理、日志记录、任务调度、高级推理以及群体智能(Swarm Intelligence)等。这些功能旨在为AI Agent提供全面的能力支持,简化开发流程,并支持并行调用多个工具,极大提升了Agent的实用性和效率。
2、watercrawl
WaterCrawl是一款功能强大的开源Web应用,它整合了Python、Django、Scrapy和Celery,用于高效的网页抓取和数据提取。该平台提供高度可定制的爬取选项、强大的多语言搜索功能、实时异步处理以及全面的REST API。WaterCrawl支持Dify、N8N等AI/自动化平台集成,并提供多种客户端SDK。它可进行本地Docker部署,并强调在生产环境部署前需更新MinIO配置和环境变量,确保数据安全和功能正常。
1、opencode
OpenCode 是一款 Go 语言开发的终端用户界面 (TUI) AI 助手,专为开发者设计。它提供交互式 TUI,支持多种 AI 模型(如 OpenAI、Anthropic Claude、Google Gemini 等),并具备会话管理、工具集成(执行命令、搜索文件、修改代码)、Vim-like 编辑器、LSP 集成以及文件变更追踪等核心功能。用户还可创建自定义命令,通过命名参数实现复杂操作。OpenCode 通过 Model Context Protocol (MCP) 集成外部工具,实现与数据源和服务的无缝连接,并支持自托管模型。这款工具旨在提升开发者效率,实现智能编码协助。
1、AgentsMeetRL
本列表汇集了使用强化学习训练 LLM 智能体的优秀开源项目。这些项目需具备多轮交互或工具使用功能。该列表基于 GitHub Copilot Agent 的代码分析,并经过人工审核,旨在总结各项目所依赖的强化学习框架、算法、奖励类型(如外部验证器、简单规则、基于模型、自定义)和环境,以供技术参考。我们欢迎社区提交新的项目,共同完善这份资源,并纠正任何可能存在的遗漏或错误。