AI Daily 2025.06.24

AI Repos

1、claudia
Claudia 是一款基于 Tauri 2 构建的强大桌面应用，旨在彻底改变用户与 Claude Code 的交互方式。它提供直观的图形用户界面，帮助用户管理 Claude Code 项目和会话，创建和定制化 AI 代理，并通过高级沙箱功能确保安全执行。此外，Claudia 还集成了详细的用量分析仪表盘、MCP 服务器管理、会话时间线与检查点功能，以及 CLAUDE.md 文件编辑工具，将命令行工具的强大功能与视觉化体验相结合，显著提升 AI 辅助开发的效率和生产力。

2、ScholAI
ScholAI 是一个基于模型上下文协议（MCP）的服务器，旨在通过自动化和智能化提升学术研究效率。它提供多数据库论文搜索（如 arXiv），并集成 CCF 排名功能，帮助用户快速评估会议和期刊的重要性。ScholAI 还支持 PDF 论文的下载与文本提取，以及通过语义查询分析将自然语言研究兴趣转化为精确的学术查询。该工具通过提供一系列核心功能，简化了学术出版物的发现、分析和管理过程，为研究人员打造了一个高效、智能的工作流程。

3、openai-cs-agents-demo
该存储库展示了一个基于 OpenAI Agents SDK 构建的客户服务代理界面。它包含一个处理代理编排逻辑的 Python 后端和一个用于可视化代理过程和提供聊天界面的 Next.js UI。此演示旨在通过智能路由用户请求至专业代理（如座位预订、航班状态、取消航班和常见问题解答），并集成相关性与越狱防护功能，确保对话保持在航空旅行主题内，从而提升客户服务体验。该应用可轻松定制，适用于不同的客户服务工作流程。

4、deepresearch
DeepResearch 是一个基于 Python 的 AI 智能搜索与深度研究项目，致力于提供高质量、高相关的资料获取。它具备完全本地部署能力，支持可视化的研究过程，并提供兼容 OpenAI 格式的 API 服务。核心功能包括深度研究模式（通过多轮迭代深入探索）、灵活的搜索引擎和网页爬虫集成（如 SearXNG/Tavily、FireCrawl/Crawl4AI），以及大模型协同工作（用于关键词生成、网页评估、内容压缩和结果总结），旨在通过精密的提示工程，有效提升信息获取效率和准确性。

AI News

1、DeepMind 推出 Gemini2.5Flash-Lite：实时 UI 生成革新人机交互
谷歌 DeepMind 近日发布 Gemini2.5Flash-Lite 模型，实现了交互界面的实时动态生成。该模型能根据用户点击和上下文即时生成下一屏幕的 UI 代码与内容，提供“即点即得”的流畅体验，显著提升人机交互的个性化与灵活性。此外，Gemini2.5Flash-Lite 在编码、数学、科学和推理等领域性能显著优于前代，预示着其在教育、医疗等多个领域将带来更多创新应用。

2、豆包推出可视化 AI 编程：拖拽操作，小白也能创建网页应用
字节跳动旗下 AI 助手豆包近日上线“应用创造 1.0”功能，引入可视化 AI 编程体验。用户在生成网页应用后，可直接在预览界面拖拽修改文字、替换图片、调整元素，操作如同编辑 PPT，极大降低了编程门槛。这项创新功能让零基础用户也能**“所见即所得”**地快速搭建功能完整的网页应用，是豆包在普及 AI 编程工具方面迈出的重要一步，将推动更多非技术背景用户享受 AI 辅助开发的便利。

3、火山引擎推出企业AI中台 HiAgent 2.0，引入 Agent DevOps 理念赋能智能体高效交付
火山引擎近日发布企业 AI 中台 HiAgent 2.0，旨在解决 Agent 应用开发与运维痛点。该平台扩展四大功能：提供丰富行业模板与插件，降低智能体搭建门槛；融合多模型管理与后训练工具，实现“模应一体”；新增智能体运营运维与高低代码混合开发能力，覆盖全生命周期管理；并发布 Canvas 统一交互入口，让智能体更好地融入企业业务。HiAgent 2.0 引入 Agent DevOps 理念，支持智能体从开发到品质优化的全生命周期管理，助力企业高效交付智能体应用，实现“越用越聪明”。

4、Salesforce 发布 Agentforce 3：实时监控与 MCP 支持，赋能企业大规模 AI 代理部署
Salesforce 近日推出 AI 代理平台 Agentforce 3 的重大升级，旨在应对企业大规模部署数字化工作者的挑战。新版本引入“指挥中心”，实现 AI 代理实时监控与基于 AI 的优化建议。同时，Agentforce 3 全面支持模型上下文协议（MCP），允许代理与数百种外部业务工具无缝连接，并扩展 AgentExchange 市场。此次更新强化了性能和安全性，并提供 200 多种预配置行业行动，加速企业数字化转型。

5、从文本生成到指令编辑：OmniGen2 重塑开源多模态模型应用场景
VectorSpaceLab 近日开源了全能多模态模型 OmniGen2，以其双组件架构（Qwen-VL-2.5 VLM 与扩散模型组合）为特色。该模型在视觉理解、文本生成图像、指令引导图像编辑和上下文生成四大核心场景中表现出色，能实现高精度图像修改和连贯视觉输出。OmniGen2 已开放模型权重和在线演示，未来将开源训练代码和数据集，为个性化视觉创作和智能设计辅助等领域开辟新路径，预示着开源多模态模型应用场景的巨大潜力。

6、苹果创新 AI 生图模型 TarFlow/STARFlow：采用“归一化流”技术实现高质量图像生成
苹果公司发布新论文，揭示其基于“归一化流”技术的创新 AI 生图模型 TarFlow 和增强版 STARFlow。与传统扩散模型不同，TarFlow 通过逐块生成图像像素值来避免质量损失。STARFlow 则在“潜空间”工作，提高生成效率和图像质量，并能调用现有语言模型（如 Gemma）处理文本提示。此举标志着苹果在 AI 图像生成领域的新探索，为未来技术发展提供了独特思路。

7、微软发布创新小参数模型 Mu：性能比肩 Phi-3.5-mini，赋能 Windows 智能体
微软近日发布仅 3.3 亿参数的创新模型 Mu，其性能媲美 Phi-3.5-mini，而体积仅为其十分之一。Mu 模型在离线 NPU 笔记本上响应速度可达每秒 100 多个 token，并支持在 Windows 中通过自然语言指令实现系统智能体操作。通过双重层归一化、旋转位置嵌入和分组查询注意力等创新架构优化，Mu 实现了卓越的本地部署性能，为 Windows 智能体的低延迟、高精准体验奠定基础。

8、ElevenLabs 发布 AI 语音助理 11ai：语音优先，集成多工具并支持 MCP 定制
ElevenLabs 正式推出语音优先 AI 个人助理 11ai，标志着语音 AI 在生产力工具领域的突破。11ai 支持 5000+ 种声音及自定义语音，通过自然对话提升工作效率，核心功能涵盖日程管理、实时搜索和团队协作。其一大亮点是支持 MCP（多通道协议），允许用户构建专属工作流，与现有工具和私有服务器无缝对接，极大拓展了应用场景。11ai 还具备多语言支持和多模态交互能力，旨在提升全球用户的个性化生产力体验。

目录

AI Repos

AI News