VOL. 2026.05.3023 STORIESAI HOT DAILY

AI HOT DAILY

Saturday, May 30, 2026DAILY · Every morning 8AM

模型发布/更新

Model Releases & Updates

3 articles

OpenAI推出实时翻译模型，支持70+语言输入

模型X：Greg Brockman (@gdb)

OpenAI 实时翻译功能——使用70多种输入语言说话，翻译成13种输出语言： gpt-realtime-translate 接收任意语言的语音输入，并输出目标语言的语音。大语言模型很棒，但特定用例需要专用模型。我们正在智能眼镜上运行此功能。

小米开源可控视频音效生成模型 ControlFoley，让声音“按你想要的来”

模型IT之家（RSS）

小米大模型应用团队发布开源可控视频音效生成模型 ControlFoley，旨在解决创作中的可控性难题。该模型统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音三类任务。ControlFoley 在 VGGSound-Test 等多个 benchmark 上取得开源 SOTA 表现，其代码、模型权重和在线 Demo 均已开放。

Qwen-VLA：从理解世界到在其中行动

模型Qwen：Blog Retrieval（API）

Qwen Studio提供全面功能，涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网络搜索集成、工具利用及Artifacts。

产品发布/更新

Product Launches & Updates

8 articles

Codex可自主管理对话线程与并行任务

产品X：Greg Brockman (@gdb)

Codex用于管理Codex界面： [引用 @guinnesschen]：如果你厌倦了管理Codex对话线程，就让Codex自己管理自己吧！Codex现在可以创建对话线程、搜索它们、整理它们、固定重要的线程，并为并行任务启动工作树。

Gemini Omni可将草图变为现实

产品X：Gemini (@GeminiApp)

Gemini Omni甚至能将简单的草图变为新的现实。在Gemini应用中亲自尝试。上传一段有人画圆的视频，然后输入这个提示词：当我画完这个圆时，它变成了___。

Codex现已支持Windows端计算机使用功能

产品X：OpenAI (@OpenAI)

Windows用户，这条消息是给你的。计算机使用功能现已在Windows上可用，因此Codex可以在你的Windows电脑上执行操作。通过ChatGPT移动应用中Codex的Windows支持，你可以在工作继续在Windows电脑上进行时，随时随地启动、审查和引导任务。这是一项早期体验，但我们正在努力提供更多方式，让你的工作无论身在何处都能持续进行。

Guardrails：保护你的智能体、数据与成本

产品OpenRouter：Announcements（RSS）

Guardrails 是一套可配置的安全与治理工具，提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能，旨在保护智能体（Agents）、数据与控制成本。

ComfyUI现已支持OpenRouter模型直接调用

产品X：OpenRouter (@OpenRouter)

现在你可以直接在ComfyUI工作流中使用你的OpenRouter模型了！ [引用 @ComfyUI]：ComfyUI刚刚添加了@OpenRouter支持。你不再局限于单一的大语言模型，现在可以直接在Comfy中访问20多个模型。更多灵活性，更少摩擦，同样的工作流。工作流链接在下方👇

Runway API持续扩展模型与端点支持

产品X：Runway (@runwayml)

我们持续为 Runway API 添加新模型和端点，以便您能将最佳生成能力直接集成到应用、产品和平台中。通过 Runway API，您可以在一个地方获得所需的所有模型，包括 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等更多内容。请通过下方链接开始使用。

OpenRouter支持模型生成文件补丁

产品X：OpenRouter (@OpenRouter)

OpenRouter 现已支持 "apply_patch"，这是一个服务器工具，允许任何模型通过 Responses API 使用 V4A diffs 提出文件编辑建议。模型生成一个补丁（创建、更新或删除文件）。OpenRouter 在服务器端验证 diff 语法。

ChatGPT对话目录功能现已上线

产品X：ChatGPT (@ChatGPTapp)

对于每个始于“就问一件事”却演变成完整长篇的ChatGPT对话：目录功能现已推出。适用于包含5条以上回复的对话。

行业动态

Industry News

3 articles

Anthropic估值9650亿美元超越OpenAI

行业Bloomberg：Technology（RSS）

Anthropic在最新融资轮中筹集了650亿美元，融资后公司估值达到9650亿美元，首次超越竞争对手OpenAI的估值水平。

中央网信办等四部门：提升全民人工智能素养，加快人才培育、深化普及应用

行业IT之家（RSS）

中央网信办等四部门联合印发《2026年提升全民数字素养与技能工作要点》，部署了六项重点任务。其中明确要求“提升全民人工智能素养”，具体包括强化人工智能赋能教育、加快人工智能人才培育、深化人工智能普及应用。其他任务涵盖数字资源供给、应用场景建设、普惠包容发展、安全有序网络空间以及协同联动机制。

波士顿儿童医院利用AI解锁新诊断

行业OpenAI：官网动态（RSS · 排除企业/客户案例）

波士顿儿童医院通过部署OpenAI技术，用于改善患者护理并减轻运营负担，成功帮助诊断了超过40种罕见病病例。

论文研究

1 articles

GPIC：大规模视觉生成基准数据集发布

论文X：Fei-Fei Li (@drfeifei, World Labs)

我对这个适用于大规模生成模型新时代的视觉生成基准数据集感到非常兴奋！🤩

技巧与观点

8 articles

AI HOT DAILY

模型发布/更新

OpenAI推出实时翻译模型，支持70+语言输入

小米开源可控视频音效生成模型 ControlFoley，让声音“按你想要的来”

Qwen-VLA：从理解世界到在其中行动

产品发布/更新

Codex可自主管理对话线程与并行任务

Gemini Omni可将草图变为现实

Codex现已支持Windows端计算机使用功能

Guardrails：保护你的智能体、数据与成本

ComfyUI现已支持OpenRouter模型直接调用

Runway API持续扩展模型与端点支持

OpenRouter支持模型生成文件补丁

ChatGPT对话目录功能现已上线

行业动态

Anthropic估值9650亿美元超越OpenAI

中央网信办等四部门：提升全民人工智能素养，加快人才培育、深化普及应用

波士顿儿童医院利用AI解锁新诊断

论文研究

GPIC：大规模视觉生成基准数据集发布

技巧与观点

这个 skill 看着不错，可将文字、URL 或文章直接生成公众号首图、小红书图文卡、教程步骤卡等视觉物料，支持 28 种布局和 10 种主题。

亲测为实：难以置信的推理速度

Adam’s Law：用高频词写Prompt效果更好

Cursor 团队发布《开发者习惯报告》

Claude Code——文档中未提及的所有可配置选项

当公司过于"AI上瘾"时会发生什么？

特斯拉 FSD 安全性宣称遭质疑

Cognition的Scott Wu表示：AI编程智能体不应取代人类

ChatGPTSites

ChatGPT 站点导航

留言区