1、Dual-AI-Chat
Dual AI Chat 是一个创新的 AI 聊天应用,通过引入逻辑型 AI (Cognito) 和怀疑型 AI (Muse) 之间的内部辩论机制,旨在提供更严谨、准确的答案,减少 AI 幻觉。它支持 Google Gemini 和 OpenAI 兼容的 API 后端(包括本地模型),提供多模态输入、可配置的讨论模式和带撤销/重做的共享记事本。该项目易于部署和定制,为用户提供了一种独特的、经过“压力测试”的 AI 交互体验。
2、MultiAgentPPT
MultiAgentPPT 是一个基于 A2A、MCP 和 ADK 架构的多智能体系统,能流式并发地生成高质量 PPT 内容。它通过大纲生成、主题拆分、并行研究和内容汇总等多个智能体的协作,实现从用户主题到完整演示文稿的自动化。该系统支持实时流式返回,提高了效率和用户体验,并且设计灵活,易于扩展。项目提供详细的后端 Python 环境和前端 Next.js 部署指南,支持本地运行和数据库配置。
3、open-data-scientist
Together Open Data Scientist 是一款由 AI 驱动的数据分析工具,它基于 ReAct (Reasoning + Acting) 框架,能够执行复杂的数据科学任务。该助手支持通过 Docker 在本地或使用 Together Code Interpreter (TCI) 在云端执行 Python 代码,并可生成详细的数据分析报告。作为实验性工具,它强调人类监督的重要性,适用于探索、学习和初步分析。用户可以通过 PyPI 快速安装,并灵活选择不同的执行模式和配置参数。
1、中国首个海洋开源大模型OceanGPT(沧渊)在杭州发布,开启海洋科技新篇章
浙江大学海洋精准感知技术全国重点实验室在杭州发布了中国首个海洋领域的开源大模型OceanGPT(沧渊),标志着中国在海洋科技领域的重要进展。OceanGPT具备海洋专业知识问答和多模态数据解读能力,采用“慢思考”推理机制减少错误信息生成。该模型支持海洋机器人操控和水下具身智能,通过自然语言指令生成控制代码,显著提升工作效率。未来,OceanGPT将推动多机器人协同合作,提升海洋装备的自主作业能力。
2、Suno收购WavTool:AI音乐编辑领域的新篇章
AI音乐公司Suno宣布收购基于浏览器的AI数字音频工作站WavTool,旨在增强其在歌曲创作和制作方面的编辑能力。此次收购发生在Suno面临多起版权诉讼的背景下,同时公司近期获得了1.25亿美元的融资,显示出其持续发展的决心。
3、腾讯开源混元-A13B模型:800亿参数MoE架构,低成本高效能AI解决方案
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型,采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,显著降低推理延迟与计算开销。该模型支持在极端条件下仅需1张中低端GPU卡即可部署,为个人开发者和中小企业提供了更具性价比的AI解决方案。在数学、科学和逻辑推理任务中表现领先,支持调用工具生成复杂指令响应,为智能体应用开发提供支持。腾讯还开源了两个新数据集,进一步推动AI开源生态发展。
4、可灵AI推出革命性“视频音效”功能
可灵AI近日宣布其全系列视频模型已正式上线“视频音效”功能,用户现在可以在生成视频的同时同步生成立体声音效,实现“所见即所听”。此外,平台升级了“音效生成”功能,新增“视频生音效”模块,基于自研的多模态视频生音效模型Kling-Foley,实现音画的帧级对齐。目前,这项创新功能已向所有用户限时免费开放。
5、OpenAI推出Deep Research API模型:o3与o4-mini引领自动化研究新纪元
OpenAI于2025年6月26日宣布推出两款全新的Deep Research API模型:o3-deep-research-2025-06-26和o4-mini-deep-research-2025-06-26,标志着其在自动化研究与复杂任务处理领域的重大突破。这两款模型专为高阶分析和深度信息合成设计,支持开发者通过API实现自动化的网页搜索、数据分析、代码执行等功能。o3模型以其强大的推论能力适合复杂任务,而o4-mini则注重高效和成本效益。OpenAI的这一举措旨在巩固其在企业级市场的领先地位,同时面临来自谷歌、DeepSeek等竞争对手的挑战。
6、ElevenLabs发布Voice Design v3:AI语音技术的个性化与情感表达新突破
ElevenLabs正式推出Voice Design v3,一款革命性的语音设计工具,支持通过文本提示生成高度拟人化的语音,涵盖70多种语言和数百种口音。该工具在个性化和情感表达方面实现重大突破,为内容创作者和开发者提供了前所未有的灵活性和创造力。
7、小米AI眼镜震撼发布:轻量化设计与强大AI功能的完美结合
小米在6月26日的发布会上推出了首款人工智能穿戴产品——小米AI眼镜,以其轻量化设计、强大的AI功能和多场景应用迅速成为市场焦点。产品特点包括第一人称拍摄、语音助手、开放式耳机功能及电致变色技术,定价亲民,目前仅在中国市场销售。小米AI眼镜的发布标志着小米正式进军AI穿戴领域,展现了智能穿戴设备的未来潜力。
8、HeyGen推出革命性AI视频Agent
HeyGen近日发布了一款革命性的AI视频Agent,该工具能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,大幅降低视频创作门槛,为广告、短视频、产品演示等场景提供高效解决方案。
9、Black Forest Labs开源FLUX.1Kontext [dev]:120亿参数AI模型重塑图像编辑未来
Black Forest Labs近日宣布开源其最新图像编辑模型FLUX.1Kontext [dev],该模型拥有120亿参数,专为图像编辑设计,支持高性能与易用性,能在消费级硬件上运行。FLUX.1Kontext [dev]在多场景精准编辑、角色一致性保持方面表现卓越,与主流工具无缝整合,操作便捷。采用FLUX.1非商业许可,支持研究和非商业用途,为开源社区和独立开发者提供了广阔的创新空间。
本文作者:junglehxj
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!