1、graphiti
Graphiti是一个构建和查询时序知识图谱的框架,专为在动态环境中运行的AI智能体设计。与传统的RAG方法不同,Graphiti持续集成用户交互、企业数据和外部信息,形成可查询的连贯图谱。该框架支持增量数据更新、高效检索和精确的历史查询,无需重新计算整个图谱。Graphiti的核心优势在于实时增量更新、双时态数据模型、高效混合检索、自定义实体定义和可扩展性。Zep的AI智能体记忆层的核心就由Graphiti驱动,并在Agent Memory领域展现出领先水平。
1、OpenAI免费开放轻量版Deep Research,o4-mini提供支持
OpenAI宣布向所有免费用户开放轻量版Deep Research,这款AI研究代理基于o4-mini模型,具备浏览网络、分析信息并生成研究报告的核心能力,旨在为更广泛的用户提供便捷的知识获取途径。此前,Deep Research仅供付费用户使用。此次免费开放轻量版,虽然报告篇幅可能较短,但仍保留了原版的核心智能。同时,付费用户的使用限额也将通过轻量版得以扩展。此举被认为是OpenAI应对市场竞争,巩固市场地位并扩大用户基础的战略调整。
2、DeepMind发布Lyria2音乐生成模型:高保真音质革新AI音乐创作
DeepMind发布新一代音乐生成模型Lyria2,以高保真音频和专业级音质为音乐家和制作人提供强大创作工具。Lyria2能根据文本提示生成多种风格和复杂编曲的音乐,并支持用户控制音调和节拍等关键参数。DeepMind还推出了实时音乐生成功能Lyria RealTime,并升级了Music AI Sandbox实验性创作套件。所有生成音乐均嵌入SynthID水印技术以保障透明性。Lyria2的发布预示着AI将深刻改变音乐创作流程,但版权等伦理问题仍需关注。
3、百度文库、网盘联合发布GenFlow超能搭子与AI笔记,提升智能生产力
百度文库和百度网盘在Create2025大会上联合发布了“GenFlow超能搭子”和“AI笔记”两款AI工具。GenFlow能根据简单指令自动规划任务并生成多种格式的高质量内容。AI笔记首创一站式多模态AI笔记功能,在观看视频时自动生成结构化笔记,包括大纲、解析、公式图表等,并支持一键生成思维导图和习题。这两款工具标志着百度文库和网盘通过大模型技术深度融合,覆盖学习、办公和生活娱乐等场景,旨在提升用户的生产力。
4、Gradio ImageSlider 2.0即将发布:AI驱动图像展示与生成全面升级
Gradio团队宣布即将推出ImageSlider 2.0,作为核心产品线,旨在重新定义AI驱动的图像滑动与展示体验。新版本通过增强型滑动体验、多样化布局选项、高分辨率与视频支持、智能变体切换和自定义样式等功能,提升用户体验和创作自由度。ImageSlider 2.0基于Gradio开源框架,结合扩散模型和现代前端技术,支持文本和图像等多模态输入,并兼容主流前端框架。其应用场景广泛,涵盖电商、数字艺术和社交媒体营销等。目前提供预览版,正式版将优化性能并扩展功能。
5、百度发布文心大模型4.5 Turbo与X1 Turbo:降价提速,能力显著增强
百度在Create开发者大会上发布了新一代文心大模型——4.5 Turbo和X1 Turbo。文心4.5 Turbo在速度上显著提升,价格大幅下降80%,输入和输出价格极具竞争力,且多模态处理和逻辑推理能力增强。文心X1 Turbo则在思维深度和工具调用能力上实现提升,价格较前代降低50%。这两款新模型旨在以更优的性价比和更强的性能,为企业和开发者提供更强大的AI工具,推动人工智能的普及与应用。
6、Meta发布WebSSL模型:探索无语言监督的纯视觉学习
Meta推出了参数规模从3亿到70亿的WebSSL系列模型,该模型基于20亿张纯图像数据进行训练,旨在探索无语言监督的视觉自监督学习(SSL)潜力。WebSSL采用了联合嵌入学习(DINOv2)和掩码建模(MAE)两种范式,并在五个容量层级上进行训练。实验结果表明,随着模型参数规模的增加,WebSSL在视觉问答(VQA)任务中表现显著提升,尤其在OCR和图表任务中超越了CLIP,高分辨率微调后在文档任务中也有大幅提升。值得注意的是,WebSSL在无语言监督的情况下仍展现出与预训练语言模型的良好对齐性,为视觉与语言的关系提供了新的视角。
7、百度上线通用超级智能体“心响”,加速“秒哒”全民开放
百度正式推出多智能体协作应用“心响”,定位为通用超级智能体,通过自主规划和多智能体协作一站式解决用户复杂问题,目前已覆盖超200个任务类型。同时,自去年11月推出的无代码应用生成平台“秒哒”已于今年3月向全社会开放,旨在降低应用开发门槛,让全民都能参与。百度创始人李彦宏强调技术的平民化,“心响”和“秒哒”的推出展示了百度在多智能体应用领域的技术实力,并为AI应用的未来发展提供了新思路。
8、百度发布AI开放计划,全面拥抱MCP助力开发者
百度在开发者大会上宣布启动“AI开放计划”,旨在通过搜索开放平台接入各类AI应用,包括智能体、H5、小程序和App,为用户提供全面的AI服务,并为开发者带来流量和收益。百度搜索将全面索引MCP Server,降低开发门槛。现场演示了千帆平台接入MCP实现电商交易等功能。此外,百度还启动第三届“文心杯”创业大赛,加大对AI人才培养的投入,并点亮国内首个全自研三万卡集群,展现其在AI基础设施领域的实力,积极拥抱AI应用井喷时代。
9、Tavus发布SOTA零样本唇形同步模型Hummingbird-0
Tavus发布了最新的零样本唇形同步模型Hummingbird-0,声称其为当前最先进的技术,无需训练或手动调整,仅凭视频和任意语音即可实现高精度唇形同步。Hummingbird-0在视觉质量、同步精度和身份保持方面超越现有方案,尤其在处理稀有方言和复杂语音时表现出色,大幅降低了配音和视频编辑成本。该模型已在Tavus平台、API及FAL上开放研究预览,适用于用户生成内容、多语言配音和个性化视频等广泛场景,并被开发者赞誉为视频编辑和内容创作的革命性技术。
10、Adobe Firefly将发布iOS和安卓版,移动端AI图像生成再添强劲对手
Adobe宣布将推出其AI图像生成工具Firefly的移动版本,支持iOS和安卓平台,旨在与OpenAI展开竞争。此举意在成为创意工作者随时随地的“创意伙伴”,方便用户在移动中捕捉灵感并提升工作效率。此外,Adobe还发布了Firefly Image Model4和Ultra两款更强大的图像生成模型,并正式开放Firefly Video Model视频生成工具,进一步扩展了其在AI创意领域的布局。
11、首个大模型全链路安全综述发布:全面梳理数据、训练、部署与应用风险及防御
南洋理工大学、新加坡国立大学等机构联合发布首个大模型全链路安全综述,系统分析了LLM从数据准备到商业化应用的各个阶段所面临的安全风险,涵盖数据中毒、隐私泄露、越狱攻击、模型窃取、幻觉、偏见等问题。综述还详细阐述了在数据安全、预训练安全、后训练安全、模型遗忘、部署安全和应用安全等方面的防御机制,为学术界和工业界提供了全面、深入且最新的参考框架,旨在构建更安全可靠的人工智能生态系统。
本文作者:junglehxj
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!