编辑
2025-05-13
AI News
00

AI Repos

1、iap-diffusion-labs
从零开始带我们构建完整的扩散模型。通过三个精心设计的实验练习,循序渐进地引导我们实现流匹配和扩散模型,从基础 SDE 到条件图像生成,每一步都有详尽指导和完整代码,让复杂理论简单易懂。主要内容:全面讲解流匹配和扩散模型的数学基础和理论框架;三个循序渐进的实验练习,从零构建完整的图像生成扩散模型;包含详细的课程笔记、幻灯片和操作指南,自学友好;覆盖图像、视频、分子结构等多种数据模态的生成原理;配套 Colab 笔记本环境,无需复杂环境配置。学习该课程需要基本的线性代数、概率论和 Python 基础,适合想要深入了解生成式 Ai 底层原理的开发者。 iap-diffusion-labs.png

编辑
2025-05-12
AI News
00

AI Repos

1、UI-TARS
UI-TARS-1.5 是字节跳动开源的多模态智能体,基于强大的视觉语言模型构建,通过强化学习实现高级推理,显著提升了在虚拟世界中执行多样化任务的能力和适应性。相较前期模型,1.5 版本在 OSWorld、Windows Agent Arena 和 WebVoyager 等基准测试中取得了领先成果,并在 Poki 游戏和 Minecraft 等环境展现出卓越性能。该项目提供了快速上手指南、部署和后处理说明,以及针对桌面、移动和基础任务的不同提示模板。尽管性能强大,UI-TARS-1.5 仍面临潜在的滥用、高计算需求和幻觉等局限性,未来将致力于提升模型能力并探索在实际应用中的潜力。 UI-TARS.png

编辑
2025-05-09
AI News
00

AI Repos

1、ZeroSearch
ZeroSearch 是一种新颖的强化学习框架,旨在激励大型语言模型(LLM)的搜索能力,而无需与真实的搜索引擎交互。该方法通过监督微调将 LLM 转变为一个检索模块,使其能够生成相关和噪声文档以响应查询。此外,还引入了课程学习机制,通过逐步暴露更具挑战性的检索场景来激发模型的推理能力。在多个领域内外的实验结果表明,ZeroSearch 的性能优于基于真实搜索引擎的模型,且 API 成本为零,并能很好地泛化到不同大小的基础和指令微调 LLM,同时支持不同的强化学习算法。 ZeroSearch.png

编辑
2025-05-08
AI News
00

AI Repos

1、smartpdfs
SmartPDFs 是一款利用 Llama 3.3 模型在 Together AI 上进行推理的工具,能够即时总结 PDF 内容并进行分段。该应用采用 Next.js、Tailwind、TypeScript、Prisma ORM、Neon (Postgres)、Helicone (可选)、Plausible 和 S3 等技术栈构建。用户可以通过简单的步骤克隆代码、配置环境变量并运行,即可在本地使用。其未来计划包括增加速率限制、集成 OCR、优化用户界面、改进总结质量、提供演示 PDF 以及增加反馈系统。SmartPDFs 旨在为用户提供便捷高效的 PDF 内容处理体验。 smartpdfs.png

编辑
2025-05-07
AI News
00

AI Repos

1、CFWorkerACME
SSL证书助手是一个免费开源的平台,基于Cloudflare Worker运行,旨在自动化SSL证书的申请和下发,尤其适用于多服务器或内网环境。它通过自动化的CNAME和DNS操作完成域名验证,支持Let's Encrypt、ZeroSSL等多个证书提供商。相较于acme.sh,该平台通过一次CNAME设置即可永久使用,简化了通配符证书申请和多服务器同步。用户可选择使用演示平台或部署私有实例,后者安全性更高。 CFWorkerACME.png