AI Daily 2025.06.19

AI Repos

1、opencode
OpenCode 是一款 Go 语言开发的终端用户界面 (TUI) AI 助手，专为开发者设计。它提供交互式 TUI，支持多种 AI 模型（如 OpenAI、Anthropic Claude、Google Gemini 等），并具备会话管理、工具集成（执行命令、搜索文件、修改代码）、Vim-like 编辑器、LSP 集成以及文件变更追踪等核心功能。用户还可创建自定义命令，通过命名参数实现复杂操作。OpenCode 通过 Model Context Protocol (MCP) 集成外部工具，实现与数据源和服务的无缝连接，并支持自托管模型。这款工具旨在提升开发者效率，实现智能编码协助。

2、workout-cool
Workout.cool 是一个旨在复兴和改进已废弃的 workout.lol 项目的开源健身教练平台。它提供全面的锻炼计划创建、进度跟踪以及包含详细指导和视频演示的运动数据库。该项目因原平台遭遇视频版权和销售后被放弃而诞生，旨在为开源健身社区提供一个可靠、现代化且持续维护的解决方案。Workout.cool 支持 Node.js、Docker/PostgreSQL，采用 Feature-Sliced Design 架构，并计划在未来支持移动应用、可穿戴设备集成和多语言等功能，致力于由社区共建，为社区服务。

AI News

1、Midjourney 视频技术新突破：AI 升频器与 Niji 动漫模型引领创意革命
Midjourney 近日宣布正在开发视频升频器和 Niji 视频模型，旨在彻底改变视频创作领域。视频升频器能将低分辨率视频提升至高清乃至 4K 画质，解决像素化和模糊问题，尤其适用于短视频和影视后期。同时，Niji 视频模型将 Midjourney 卓越的动漫生成能力从图像扩展到动态视频，结合现有 V1 模型，能创作高质量动漫短片和游戏宣传视频。这两项技术依托强大的 AI 架构，形成从文本到图像再到视频的无缝创作链路，有望显著降低内容制作成本，重塑短视频、影视和游戏行业。Midjourney 的创新使其在 AI 视频竞争中占据独特优势，未来更将迈向实时开放世界模拟。

2、OpenAI 推出 ChatGPT Record：实时录音、转录与摘要，提升工作效率
OpenAI 近日在 macOS 桌面应用为 Pro、Team、Enterprise 和 Edu 用户推出了 ChatGPT Record 新功能。该功能支持每次最长 120 分钟的录音，并能实时转录音频内容，结束后自动生成结构化摘要。这极大提升了会议记录、访谈和讲座处理效率。OpenAI 强调，此功能对英语录音效果最佳，所有音频在转录后会自动删除，且不用于模型训练，充分保护用户隐私。企业和教育用户可通过 Compliance API 访问，自推出以来已广受好评。

3、通义 APP 翻译能力重磅升级，打造“最强翻译综合体”
6月19日，通义 APP 全面升级翻译能力，涵盖文字、同传、文档、图片四大核心场景，旨在成为个人与专业用户的“最强翻译综合体”。此次升级覆盖 119 种语言与方言，显著提升了翻译的准确性和专业性，并优化了交互体验。值得一提的是，同传翻译功能免费且不限时，支持 10 种语言。此外，文档翻译能保留原版排版并生成全文总结，图片翻译则能准确理解并保留图片排版结构，实现了真正的“全场景、全模态”翻译解决方案。

4、AI 助力 PowerPoint：Office-PowerPoint-MCP-Server 实现报告自动化，效率翻倍！
近日，基于 Model Context Protocol（MCP）的开源工具 Office-PowerPoint-MCP-Server 成为焦点。该工具利用 AI 自动化创建和编辑 PowerPoint 演示文稿，支持幻灯片管理、内容填充、数据可视化以及批量生成，极大提升了企业报告和数据展示效率。它通过自然语言指令与 AI 助手无缝对接，降低了使用门槛。该工具的开源特性和与 python-pptx 库的深度融合，使其成为企业自动化办公的理想选择，有望重塑演示文稿制作流程，实现效率翻倍。

5、YouTube Shorts 将引入 Veo3 AI 视频生成技术，日均浏览量突破 200 亿
YouTube CEO 尼尔・莫汉近日宣布，YouTube Shorts 将于今年夏天晚些时候整合其最新的 Veo3 AI 视频生成模型。Veo3 模型在视频质量和音频融合方面有显著提升，有望彻底改变短视频创作方式。目前，使用 Veo3 需要订阅 Google 的 AI Pro 或 AI Ultra 计划，具体费用尚未公布。此外，莫汉透露 YouTube Shorts 日均浏览量已超过 200 亿次，显示出短视频日益增长的影响力。这一更新将为创作者提供更强大的工具，进一步提升短视频内容的质量和吸引力。

6、Anthropic Claude Code 全面升级，支持与任意远程 MCP 服务器集成
Anthropic 近日宣布，其强大的编码助手 Claude Code 现已支持与任何远程模型上下文协议 (MCP) 服务器集成。此举意味着开发者能通过 Claude Code 安全高效地访问第三方服务及数据源，如 Sentry 和 Linear，从而在终端或 IDE 内直接查询错误、获取项目状态，显著提升工作效率。自从 Claude Code 用户需求三周内增长 160% 以来，Anthropic 持续拓展其功能，并将其使用权限扩展至 Pro 计划用户，进一步推动了 AI 编码助手在开发者生态系统中的应用和发展。

7、DeepSite V2 重磅升级！支持 DeepSeek-R1-0528 模型，零代码轻松生成 3D 网页动画
DeepSite V2 近日迎来重大更新，集成更强大的 DeepSeek-R1-0528 模型，使其成为 AI 驱动的网页生成利器。用户只需输入自然语言描述，即可秒级生成包含 HTML、CSS 和 JavaScript 的完整前端代码，甚至包括复杂的 3D 动画，并支持实时预览。这款开源工具无需安装，完全基于浏览器运行，极大降低了网页开发门槛。DeepSite V2 的发布预示着无代码开发进入新阶段，将赋能开发者和非专业用户轻松实现创意，从快速原型设计到教育和商业应用，潜力巨大。

8、Google Search Live 模式重磅升级：语音与摄像头实现更智能实时交互
Google 近日宣布将大幅升级 Search Live 模式，作为其 AI Mode 搜索功能的核心组成部分。该模式已于 6 月 18 日在美国面向 Labs 用户推出，允许用户通过语音进行实时双向对话。未来数月，Google 计划引入实时摄像头交互功能（基于 Project Astra 技术），用户可通过摄像头展示场景并获得 AI 基于视觉输入的解答。此外，AI 将能访问用户授权的 Gmail 和搜索历史，提供更个性化搜索结果。此次升级将把 Search Live 转变为全能 AI 助手，尽管面临隐私和内容生态的挑战，但其多模态、情境化的交互体验将显著提升用户便利性。

9、MiniMax Agent 重磅发布，智能代理革新工作流，从“给我代码”到“告诉我需求”
近日，全新通用智能代理 MiniMax Agent 正式推出，旨在高效解决复杂长期任务。这款 AI 代理具备专家级多步骤规划、灵活任务分解和端到端执行能力，已被 MiniMax 团队内部广泛使用。其核心亮点包括编程与工具使用、多模态理解与生成及无缝 MCP 集成。MiniMax Agent 改变了传统工作模式，让用户从繁琐的代码编写中解放出来，专注于高价值创意，预示着智能代理将引领未来工作流的智能化和自动化。

10、Midjourney 首款 AI 视频生成模型 V1 问世，最长 20 秒，每月 10 美元起
Midjourney 正式发布首款 AI 视频生成模型 V1，标志着其从图像迈向多媒体创作。V1 主要提供图像到视频（I2V）功能，用户可通过“Animate”按钮将静态图像转化为动态视频，默认 5 秒，最长可延长至 20 秒，并支持低动态和高动态模式。该模型定价亲民，每月 10 美元起即可体验。尽管分辨率和帧率相对基础，且面临版权诉讼，但 V1 继承了 Midjourney 图像模型的高一致性，是其迈向“实时开放世界模拟”愿景的重要一步，为创作者提供了低门槛、高品质的视频创作工具。

目录

AI Repos

AI News