1、owl
Manus类项目:OWL,GAIA上57.7%,超过Huggingface的Open Deep Research的55.15%。在整个复刻过程中,OWL对Manus的技术路线做了一波逆向工程。把Manus的核心工作流拆成了6步:
(1)启动一个Ubuntu容器(Agent远程工位就位)
(2)知识召回(把之前学过的内容捡起来用)
(3)连接数据源(数据库、网盘、云存储全覆盖)
(4)把数据挂载到Ubuntu(Agent的搬砖时刻)
(5)自动生成http://todo.md(规划任务+写待办清单)
(6)Ubuntu工具链+外接工具组合拳,执行全流程任务
所有Manus里智能体用到的操作,作者都会给OWL配齐。启动一个Ubuntu容器,OWL就能随时随地远程办公了。此前,他们开源过一个跨平台操作系统的通用智能体:CRAB,不止能操控Ubuntu容器,还能直接控制手机和电脑里的任何应用,后面他们会把CRAB融入OWL里,实现跨平台、多设备、全场景远程操作。
1、HunyuanVideo-I2V
腾讯最新混元I2V模型来了,HunyuanVideo-I2V已开源,图生视频能力强,视频流畅衔接的比较自然。支持720P分辨率,最长129帧视频生成。可定制LoRA训练,创建自定义特效,比如头发长长、拥抱等特效。
1、gitingest
一个可以把任意GitHub库转为适合LLM理解的格式的工具:GitIngest,LLM搭档,帮助开发者快速了解某个项目。自动提取重要代码、文档,生成结构化的摘要。把GitHub URL中的 "hub" 替换成"ingest" 即可获取对应的代码库摘要。
1、mahilo
一款多智能体人机协作框架:mahilo,可以构建相互之间共享上下文信息的多个AI智能体,并且支持人类监督。可以用来做客服系统、教育辅导、销售系统等等。它支持实时API和语音交互,可以自定义智能体,也支持集成其他框架的智能体。点对点通信,支持层级式通信,AI智能体可以根据场景自主决定与哪些其他智能体进行交流。支持人机协作,每个智能体都可以与人类用户实时交互,多个用户可以同时连接到同一个智能体,人可以随时干预智能体的决策。
1、prompt-optimizer
一款实用的AI提示词优化工具。
🎯 智能优化:一键优化提示词,支持多轮迭代改进,提升AI回复准确度
🔍 实时测试:直接测试优化后的提示词效果,对比优化前后差异
🔄 多模型集成:支持OpenAI、Gemini、DeepSeek等主流AI模型,满足不同需求
🔒 安全架构:纯客户端处理,数据直接与AI服务商交互,不经过中间服务器
💾 隐私保护:本地加密存储历史记录和API密钥,确保数据安全