AI Daily 2025.05.22

AI Repos

1、Cloudflare-SQL-to-API
基于 Cloudflare Workers 和 D1 数据库的应用，旨在通过编写 SQL 查询快速创建 REST API 接口。它具有简单易用、高性能、安全可靠和零后端代码等特点，用户只需编写 SQL 语句即可发布 API。该应用支持 128K 上下文长度，并通过独立控制思维链和回复内容长度提高灵活性，简化了从数据库到 API 的开发流程，显著提升了开发效率和数据安全。

2、DeepResearchAgent
DeepResearchAgent 是一个创新的分层多智能体系统，旨在高效处理深度研究和通用任务。它采用两层架构：一个顶层规划智能体负责任务分解与协调，下辖深度分析器、深度研究员和浏览器使用工具等专业智能体。该系统实现了自动化信息分析、研究和网页交互，并在GAIA基准测试中展现出卓越性能，为复杂任务的自动化解决提供了强大的框架。

AI News

1、字节跳动发布多模态模型BAGEL：性能超越Qwen2.5-VL，图像生成媲美SD3
字节跳动Seed团队重磅发布了基于MoE架构的开源多模态基础模型BAGEL，总参数14亿，活跃参数7亿。BAGEL在数万亿token的多模态数据集上预训练，性能超越Qwen2.5-VL和InternVL-2.5，尤其在多模态理解基准GAIA上取得82.42分，图像生成质量媲美SD3，并支持自由图像编辑、未来帧预测等复杂推理任务。其开源特性及高效推理能力，引发了AI社区的广泛关注，预示着多模态AI领域的新突破，并增强了中国AI在全球的竞争力。

2、Mistral 发布全新开源AI编程模型Devstral：单张显卡即可运行
总部位于法国巴黎的 Mistral AI 公司与 All Hands AI 合作发布了开源AI编程模型 Devstral。这款拥有240亿参数的模型，以 Apache2.0开源许可发布，支持商业用途。Devstral 旨在推动“agentic”编码发展，在SWE-Bench Verified 基准测试中表现优异，得分高达46.8%，甚至超越了部分闭源模型。其优化架构使其能在单张 Nvidia RTX4090 显卡或32GB RAM 的 Mac 上流畅运行，大大降低了使用门槛，并特别擅长代码库探索和多文件编辑。

3、Meta发布J1系列模型：最强“AI法官”上线，提升AI判断能力与公平性
Meta公司近日发布了全新J1系列模型，通过结合强化学习和合成数据训练，显著提升了AI的判断准确性和公平性。J1模型旨在解决“LLM-as-a-Judge”模式中判断一致性和推理深度不足的挑战。通过开发22000个合成偏好对数据集和引入GRPO算法，J1模型在PPE基准测试中展现出卓越性能，J1-Llama-70B准确率高达69.6%，远超同行。J1的发布为未来AI在复杂推理和伦理决策方面的应用奠定了坚实基础。

4、微软开源Magentic-UI：以人为中心的AI智能体，专攻复杂网页任务
微软研究院正式开源了Magentic-UI，一款以人为中心的AI智能体研究原型，旨在通过网页浏览器实时协助用户完成复杂的网络任务。Magentic-UI基于Magentic-One和AutoGen框架，强调透明性、可控性和人机协作，支持用户直接修改AI执行计划，并引入行为防护功能确保安全。该系统由Orchestrator、WebSurfer、Coder和FileSurfer四个专业智能体组成，通过内外双循环机制协同工作，高效处理网页表单填写、深度网站导航等复杂任务，已在GitHub上开放。

5、Framer发布全新AI功能套件：AI秒建网站，对话生成交互组件
Framer在I/O2025期间推出了全新的AI功能套件，包括 Wireframer、Workshop、Advanced Analytics 和 Vectors 2.0。Wireframer支持通过自然语言提示快速生成网站布局，Workshop则允许用户通过对话生成复杂的交互组件。Advanced Analytics提供A/B测试和漏斗分析，Vectors 2.0全面升级矢量绘图功能。这些AI驱动的创新显著降低了网站创建成本和复杂度，提升了设计效率和用户体验，面向所有用户开放，引发设计界热烈反响，标志着AI在网站设计领域的深入应用和普惠化。

6、多模态大模型MMaDA：AI“跨次元思考”，实现文本图像通吃
普林斯顿大学、字节跳动、清华大学和北京大学联合推出了多模态大模型 MMaDA，旨在让AI拥有“深度思考”能力，实现文本、图像及复杂推理任务的一体化处理。MMaDA通过统一扩散架构、混合长链式思考（Mixed Long CoT）微调和统一强化学习算法UniGRPO三大创新，在文本推理、多模态理解和文本到图像生成方面全面超越现有模型如GPT-4、Gemini和SDXL。MMaDA的发布为AI领域描绘了一个更宏大、更统一的未来，展示了扩散模型作为下一代多模态智能基础范式的巨大潜力。

7、谷歌DeepMind发布AI音乐生成模型Lyria2：高保真实时创作
谷歌DeepMind最新发布了AI音乐生成模型 Lyria2，作为前代模型的升级版，它能生成48kHz立体声高保真音质，达到专业级水准。Lyria2的核心亮点在于引入了 Lyria RealTime 功能，支持用户实时操控音乐生成过程，调整风格、节奏和情绪。该模型深度整合到 Music AI Sandbox 工具集中，提供“Create”、“Extend”和“Edit”等多样化创作功能，并支持多模态输入。此外，Lyria2采用 SynthID 数字水印技术保障内容可追溯性，确保负责任的AI部署。

8、硅基流动升级推理模型API：支持128K上下文长度，独立控制思维链与回复
硅基流动（SiliconCloud）近日对其DeepSeek-R1等推理模型API进行重要升级，将多个模型的最大上下文长度提升至128K，以满足长上下文和灵活参数配置需求。此次升级允许开发者独立控制“思维链”（thinking_budget）和“回复内容”（max_tokens）的长度，从而更高效地利用模型推理能力。Qwen3等模型已支持128K上下文，DeepSeek-R1支持96K。此举显著提升了模型在复杂任务中的表现，并为开发者提供了更精细的控制，优化了用户体验。

9、xAI推出Live Search API：实时搜索X平台与全球互联网，免费Beta至6月5日
xAI公司发布了Live Search API，一款由Grok模型驱动的实时搜索工具，可检索X平台、互联网、新闻和RSS订阅源的动态信息。该API无需手动管理搜索逻辑，支持Grok模型自主决策，并提供高度定制化的搜索参数，如数据来源、日期范围和结果数量。Live Search API目前处于免费Beta测试阶段至2025年6月5日，旨在为开发者提供前所未有的实时信息检索能力，尤其在实时监控、智能助手和内容创作等领域具有巨大应用潜力。

目录

AI Repos

AI News