一、今日最重要的 5 条
1. 2026-05-28|Vibe gets to work.
- 来源:Mistral AI
- 链接:https://mistral.ai/news/vibe-agent
- 类型:product_launch
- 总分:9.00
- 一句话摘要:Mistral AI 将 Le Chat 升级为统一 Agent「Vibe」,提供 Work Mode(多步骤办公任务,支持搜索、数据分析、文档生成、定时任务)和 Code Mode(远程编码代理,集成 VS Code 扩展,可并行运行沙箱化编码会话),并发布新版 CLI 和定价方案。
- 为什么重要:Vibe 是面向企业和个人的通用 Agent,直接覆盖自动化办公、编码、数据分析等高频场景,且开放定制技能,与我关注的 Agent 落地、工具调用、工作流编排高度相关。
- 对我的工作启发:官方产品发布,功能描述详细;Vibe 是典型的通用 Agent,具备多步骤规划、工具调用、沙箱编码、定时任务等能力,与 Agent/Skill/工作流方向完全契合,对产品设计和工程实践有直接参考价值。
- 投资/产业观察:可能包含产业或投资强信号,建议结合公司、供应链和竞品动态继续跟踪。
- 建议动作:值得细看
2. 2026-04-24|DeepSeek V4 Preview Release
- 来源:DeepSeek API Docs
- 链接:https://api-docs.deepseek.com/news/news260424
- 类型:model_update
- 总分:9.00
- 一句话摘要:DeepSeek发布V4 Preview版本,包括1.6T参数的Pro模型和284B参数的Flash模型,均支持1M上下文,开源,Agent能力达开源SOTA,API即日起可用,旧模型将退役。
- 为什么重要:该发布显著提升了开源模型的Agent能力和长上下文能力,同时推出高性价比的Flash模型,对Agent应用落地和模型成本优化有重大推动作用,也影响了AI产业的竞争格局。
- 对我的工作启发:官方源信息充分,新模型发布涉及Agent能力、长上下文、开源及成本效益,与关注方向强相关,评分高。
- 投资/产业观察:可能包含产业或投资强信号,建议结合公司、供应链和竞品动态继续跟踪。
- 建议动作:值得细看
3. 2026-06-05|Remote agents in Vibe. Powered by Mistral Medium 3.5.
- 来源:Mistral AI
- 链接:https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
- 类型:product_launch
- 总分:8.85
- 一句话摘要:Mistral发布Mistral Medium 3.5模型(128B稠密模型,256k上下文,开放权重),并推出Vibe远程异步代码Agent、Le Chat Work模式(支持多步骤任务和工具调用)。
- 为什么重要:新模型具备强大的编码和Agent能力,远程Agent实现了云上异步执行,Work模式代表了多步骤Agent落地,直接覆盖Agent、编码、工作流等关键方向。
- 对我的工作启发:发布内容紧密围绕Agent、编码自动化、多步骤任务,与重点关注方向完全一致;模型开源且定价透明,影响商业化。
- 投资/产业观察:可能包含产业或投资强信号,建议结合公司、供应链和竞品动态继续跟踪。
- 建议动作:值得细看
4. 2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力
- 来源:Moonshot AI Blogs
- 链接:https://platform.kimi.com/blog/posts/k2-think
- 类型:model_update
- 总分:8.85
- 一句话摘要:月之暗面发布并开源Kimi K2 Thinking模型,基于“模型即Agent”理念,原生支持边思考边使用工具,在多个Agent和推理基准上达到SOTA。
- 为什么重要:该模型是专为Agent设计的思考模型,原生集成工具使用能力,直接推动Agent自主规划和执行能力,对Agent落地和大模型应用前景有重要意义,且开源促进社区发展。
- 对我的工作启发:官方发布,信息可靠;模型直接针对Agent能力提升,与重点方向强相关,重要性高。
- 投资/产业观察:可能包含产业或投资强信号,建议结合公司、供应链和竞品动态继续跟踪。
- 建议动作:值得细看
5. 2026-06-05|AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
- 来源:Google DeepMind
- 链接:https://deepmind.google/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
- 类型:research_paper
- 总分:8.80
- 一句话摘要:Google DeepMind发布AlphaEvolve,一个基于Gemini的进化式编码智能体,用于自动发现和优化算法。它通过LLM生成代码、自动评估器验证,并已应用于Google数据中心调度、TPU芯片设计、AI训练加速等场景,如将Gemini训练时间减少1%。
- 为什么重要:这是一个高度相关的Agent和编码方向进展。AlphaEvolve展示了AI agent在算法设计、基础设施优化中的实际落地效果,直接涉及代码生成、工具调用和自动化工作流,对研发提效和成本优化有明确价值。
- 对我的工作启发:官方来源,信息详实,内容直接关联Agent、编码、基础设施优化,且已在Google实际部署,工作参考价值极高。
- 投资/产业观察:可能包含产业或投资强信号,建议结合公司、供应链和竞品动态继续跟踪。
- 建议动作:值得细看
二、今日最值得看的 Agent / Skill
- 名称:Announcing Universal CLI by Composio
- 类型:tool
- 来源:Composio Blog
- 链接:https://composio.dev/blog/announcing-universal-cli-by-composio
- 推荐理由:在多个 agent 框架和工具涌现的背景下,Universal CLI 为 B 端流程自动化提供了统一的入口和基础设施,降低了 agent 与外部工具集成的复杂度,有助于快速验证和部署多步骤自动化任务。
- 对我的工作启发:电商 B 端算法团队经常需要集成各种工具(如商品图片审核 API、OCR 服务、数据库查询等),Universal CLI 可以简化这些工具的接入和管理,提高开发效率,并支持成本优化(如选择最小化 token 消耗的工具路由)。
- 建议动作:尝试使用 Universal CLI 连接常用的电商相关工具(如图床、OCR 服务、质检数据库),测试其在批量商品图审核或结构化信息抽取场景中的执行效率。
- 置信度:0.70
三、模型更新
| 公司 | 更新 | 影响 | 分数 | 链接 |
|---|---|---|---|---|
| DeepSeek | 2026-04-24|DeepSeek V4 Preview Release | 该发布显著提升了开源模型的Agent能力和长上下文能力,同时推出高性价比的Flash模型,对Agent应用落地和模型成本优化有重大推动作用,也影响了AI产业的竞争格局。 | 9.00 | 原文 |
| 月之暗面 | 2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力 | 该模型是专为Agent设计的思考模型,原生集成工具使用能力,直接推动Agent自主规划和执行能力,对Agent落地和大模型应用前景有重要意义,且开源促进社区发展。 | 8.85 | 原文 |
| 智谱AI | 2026-02-12|GLM-5 新一代旗舰模型上线 | GLM-5是智谱的下一代旗舰模型,聚焦Agent和长程任务,直接对标国际领先模型,对Agent落地和模型选型有重要参考价值,同时引入稀疏注意力技术降低推理成本。 | 8.75 | 原文 |
| Mistral AI | 2026-06-05|Mistral Medium 3.5: 新旗舰模型与远程Agent发布 | 该新闻直接涉及关键方向:Agent 产品落地(远程代理、Work mode)、模型能力提升(128B 密集模型、SWE-Bench 高分)以及编码自动化,对 AI 工程化和商业化有重要参考价值。 | 8.65 | 原文 |
| Mistral | 2026-03-16|Mistral Small 4 | 该模型将多个专用模型的能力整合为一个,直接适用于 Agent 工作流、编码助手和复杂推理任务,且开源可自部署,对应用落地和成本优化具有重要参考价值。 | 8.65 | 原文 |
| Moonshot AI | 2025-09-05|Kimi K2 模型更新,带来更强的代码能力、更快的 API | 该更新显著提升了 Kimi K2 在真实编程任务中的性能,特别是 Agentic Coding 和工具调用能力,与 Agent、coding 方向高度相关,且已获得 Cursor 等主流编程工具集成,对开发者生态有重要影响。 | 8.65 | 原文 |
| 智谱AI | 2026-06-05|智谱AI发布GLM-5.1旗舰模型,长程Agent能力显著提升 | 该模型在Agent长程任务(8小时自主闭环)和Coding能力上取得显著突破,直接推动Agent落地与工程智能发展;综合能力对齐国际顶尖水平,对国内大模型竞争格局和开源生态有重要影响,与Agent、工具调用、应用部署等关注方向高度相关。 | 8.05 | 原文 |
| 智谱AI | 2026-03-15|GLM-5-Turbo 龙虾增强基座模型上线 | 该模型明确针对工具调用、多步任务和多智能体协同进行优化,与Agent和自动化工作流方向高度相关,可直接提升相关应用的能力和可靠性。 | 8.05 | 原文 |
四、新应用场景
| 场景 | 产品/公司 | 价值 | 可复制性 | 链接 |
|---|---|---|---|---|
| product_launch | Mistral | Mistral AI 将 Le Chat 升级为统一 Agent「Vibe」,提供 Work Mode(多步骤办公任务,支持搜索、数据分析、文档生成、定时任务)和 Code Mode(远程编码代理,集成 VS Code 扩展,可并行运行沙箱化编码会话),并发布新版 CLI 和定价方案。 | 官方产品发布,功能描述详细;Vibe 是典型的通用 Agent,具备多步骤规划、工具调用、沙箱编码、定时任务等能力,与 Agent/Skill/工作流方向完全契合,对产品设计和工程实践有直接参考价值。 | 原文 |
| product_launch | Mistral AI | Mistral发布Mistral Medium 3.5模型(128B稠密模型,256k上下文,开放权重),并推出Vibe远程异步代码Agent、Le Chat Work模式(支持多步骤任务和工具调用)。 | 发布内容紧密围绕Agent、编码自动化、多步骤任务,与重点关注方向完全一致;模型开源且定价透明,影响商业化。 | 原文 |
| product_launch | Mistral AI | Mistral发布Workflows公共预览版,这是一个基于Temporal的AI工作流编排层,支持持久执行、可观测性、人工审批,并与Studio原生集成。 | 工作流编排是Agent和自动化落地的核心瓶颈,Workflows直接提供企业级解决方案,与重点方向高度匹配。 | 原文 |
| product_launch | Mistral AI | Mistral在Studio中推出Connectors功能,支持内置和自定义MCP连接器,提供直接工具调用、人工审批控制和跨应用复用。 | 内容聚焦MCP、工具调用、人工审批,是Agent和企业AI应用的核心组件,与关注方向高度相关。 | 原文 |
| product_launch | Moonshot AI | Kimi Playground 正式发布,为开发者提供直观的工具调用体验平台,支持内置官方工具和第三方 MCP server 工具,可可视化调用过程、实时调试,并展示了旅游规划和数据分析等应用案例。 | 直接针对工具调用和 MCP,与 Agent、skill 方向强相关,信息完整可靠,评为值得细看。 | 原文 |
| product_launch | Anthropic | Anthropic 推出新产品 Claude Design,基于 Claude Opus 4.7,允许用户通过协作创建设计、原型、幻灯片等视觉作品,并支持设计系统导入、代码交接等功能。 | 官方发布,信息完整。新产品与 Agent 工作流、代码生成、设计自动化高度相关,work_relevance 高。对 Anthropic 产品生态和商业化有推动作用,investment 较高。novelty 高,importance 高。 | 原文 |
| product_launch | Mistral AI | Mistral AI 发布 Vibe 统一 Agent,支持长周期工作和代码模式,并推出 VS Code 扩展;同时发布 Mistral Medium 3.5 模型、Search Toolkit、物理 AI 模型等多项更新。 | 原始页面为新闻列表,信息分散,但以 Vibe 产品发布为核心,与 Agent、编码高度相关,来源为官方,可信度较高。 | 原文 |
| product_launch | Mistral AI | Mistral AI 发布 Forge 系统,帮助企业在专有数据上训练定制化前沿 AI 模型。Forge 支持预训练、后训练、强化学习等完整训练流程,兼容密集型和 MoE 架构,支持多模态输入,并采用 Agent-first 设计,可使代码代理自动进行微调、超参数优化等操作。 | 官方博客信息完整,来源可靠。Forge 直接面向企业定制模型、Agent 自动化训练,与 Agent、skill、企业应用落地重点高度相关,且提供新颖的 Agent-first 训练框架,工作参考价值和投资价值均高。 | 原文 |
五、论文/技术趋势
| 论文/技术 | 方向 | 结论 | 对业务启发 | 链接 |
|---|---|---|---|---|
| 2026-06-05|AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms | agent、coding、infrastructure、application、cost | Google DeepMind发布AlphaEvolve,一个基于Gemini的进化式编码智能体,用于自动发现和优化算法。它通过LLM生成代码、自动评估器验证,并已应用于Google数据中心调度、TPU芯片设计、AI训练加速等场景,如将Gemini训练时间减少1%。 | 官方来源,信息详实,内容直接关联Agent、编码、基础设施优化,且已在Google实际部署,工作参考价值极高。 | 原文 |
| 2025-11-13|SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds | agent、model_capability、research、application | Google DeepMind 发布 SIMA 2,基于 Gemini 模型,使其从指令跟随者进化为具备推理、对话和自我改进能力的 3D 虚拟世界游戏智能体,能够在未见过的游戏中泛化执行复杂任务。 | 来源为 Google DeepMind 官方博客,信息完整可信。SIMA 2 融合 Gemini 推理能力,显著提升 Agent 的泛化、推理和交互能力,与我的 Agent 重点方向高度相关。工作参考价值极高,对产业趋势有重要启示,故各项评分较高,建议深入阅读。 | 原文 |
| 2026-06-04|SaliMory: Orchestrating Cognitive Memory for Conversational Agents | agent、research、model_capability | 提出SALIMORY框架,训练单一语言模型管理对话智能体的认知记忆(用户事实、偏好、工作记忆),采用分层阶段式过程奖励和对比优化,将记忆错误减少三分之一,准确率提升超10%。 | 与Agent记忆方向强相关,信息可靠,效果数据明确,重要性高。 | 原文 |
| 2026-06-04|SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models | agent、research | 该论文提出SMAC-Talk,一个基于星际争霸多智能体挑战的自然语言扩展基准,用于评估LLM Agent在合作多智能体环境中的协调能力,包含自然语言通信通道和欺骗场景,并开源了基准和基线代理。 | 来源可靠(arXiv论文),内容与多Agent协调、LLM Agent评估强相关,属于重点关注的Agent方向,且提供了开源基准,具有直接参考价值。 | 原文 |
| 2026-06-04|Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification | agent、regulation、research | 该论文提出了一种基于本体的企业AI Agent预部署验证框架,包含操作包络、本体到场景生成管线以及信任证书三个组件,并在四个受监管行业进行了试点验证,证明本体驱动场景生成在监管覆盖率和领域特异性上优于基于角色的基线方法。 | 来源可靠(arXiv论文),内容与Agent预部署验证、合规性测试强相关,属于重点关注的Agent方向,具有明确工程价值和产业参考意义。 | 原文 |
| 2026-06-04|Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval | agent、coding、research | 提出SGDR方法,使Web Agent根据页面状态动态检索和重用技能,在WebArena上成功率提升10-10.6%,已开源。 | 高度相关Agent技能重用和Web自动化,新颖且实证有效,importance>=7且confidence>=0.6。 | 原文 |
| 2026-06-04|Cascading Hallucination in Agentic RAG: The CHARM Framework for Detection and Mitigation | agent、application、research | 形式化了Agent RAG管道中的级联幻觉问题,提出CHARM框架(分阶段事实验证、跨阶段一致性跟踪等),在多个数据集上实现89.4%检测率、82.1%错误传播减少,延迟约215ms/阶段。 | 与Agent RAG强相关,提供可落地的检测框架,效果显著,信息完整。 | 原文 |
| 2026-06-05|技术报告:Muon 优化器的首次大规模训练实践 | model_capability、cost、infrastructure、research | Misight 在 Muon 优化器基础上引入权重衰减和更新尺度调整,使其可扩展至大规模训练,计算效率相比 AdamW 提升约2倍,并开源训练模型 Moonlight (3B/16B MoE)。 | 重要技术进展,提升训练效率2倍,开源模型,对基础设施和成本有显著影响。 | 原文 |
六、产业和投资观察
- 算力:2026-05-28|Vibe gets to work.;2026-04-24|DeepSeek V4 Preview Release;2026-06-05|AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
- 模型公司:2026-04-24|DeepSeek V4 Preview Release;2026-06-05|Remote agents in Vibe. Powered by Mistral Medium 3.5.;2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力
- 应用层:2026-05-28|Vibe gets to work.;2026-04-24|DeepSeek V4 Preview Release;2026-06-05|Remote agents in Vibe. Powered by Mistral Medium 3.5.
- 云厂商:2026-05-28|Vibe gets to work.;2026-06-05|最贵的AI,最先赚到了钱;2026-06-05|Mistral Medium 3.5: 新旗舰模型与远程Agent发布
- 开源生态:2026-04-24|DeepSeek V4 Preview Release;2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力;2025-11-13|SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds
- 监管:2026-06-04|Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification;2026-06-05|Edge AI Daily 早报(6月5日);2026-06-05|国家发改委:指导国产大模型加大力度适配国产算力芯片
七、对我工作的启发
- 关注多模态商品理解和图文审核场景中可复用的新模型能力,优先评估是否能降低人工审核和标注成本。
- 跟踪 agent/workflow agent 在 B 端流程中的稳定性进展,适合先从内部运营、质检和数据处理流程试点。
- 价格、推理效率和基础设施变化可能影响小模型/大模型路由策略,需要沉淀成本基准。
- 论文趋势可用于更新 OCR、结构化抽取、弱监督和 synthetic data 的候选技术池。
八、建议动作
值得细看
- 2026-05-28|Vibe gets to work.(9.00)
- 2026-04-24|DeepSeek V4 Preview Release(9.00)
- 2026-06-05|Remote agents in Vibe. Powered by Mistral Medium 3.5.(8.85)
- 2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力(8.85)
- 2026-06-05|AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms(8.80)
- 2026-02-12|GLM-5 新一代旗舰模型上线(8.75)
- 2026-06-05|最贵的AI,最先赚到了钱(8.70)
- 2026-06-05|Mistral Medium 3.5: 新旗舰模型与远程Agent发布(8.65)
- 2026-03-16|Mistral Small 4(8.65)
- 2025-09-05|Kimi K2 模型更新,带来更强的代码能力、更快的 API(8.65)
- 2025-11-13|SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds(8.50)
- 2026-05-28|Anthropic raises $65B in Series H funding at $965B post-money valuation(8.35)
- 2026-06-05|Workflows for work that runs the business(8.30)
- 2026-06-05|Connect the dots: Build with built-in and custom MCPs in Studio(8.15)
- 2025-07-17|Kimi Playground 一站式体验 Kimi K2 的工具调用能力(8.15)
- 2026-06-05|智谱AI发布GLM-5.1旗舰模型,长程Agent能力显著提升(8.05)
- 2026-03-15|GLM-5-Turbo 龙虾增强基座模型上线(8.05)
- 2026-04-17|Introducing Claude Design by Anthropic Labs(7.95)
- 2026-06-04|SaliMory: Orchestrating Cognitive Memory for Conversational Agents(7.90)
- 2026-05-28|AI Now Summit 2026(7.90)
- 2026-06-05|Read all news(7.90)
- 2026-03-17|Introducing Forge: Build frontier-grade AI models on proprietary knowledge(7.90)
- 2026-06-05|introducing DeepSeek-V3(7.90)
- 2026-06-04|SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models(7.85)
- 2026-06-05|36氪独家|2026 年字节 AI 的四个关键命题(7.80)
- 2026-06-04|Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification(7.80)
- 2026-06-04|Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval(7.80)
- 2026-05-28|Introducing Claude Opus 4.8(7.80)
- 2026-05-28|Introducing Claude Opus 4.8(7.75)
- 2025-12-02|Mistral 3(7.75)
- 2026-06-05|实现芯片设计验证自动化,提升开发效率10倍以上,「智维创芯」完成数千万元天使轮融资(7.65)
- 2026-06-05|Introducing Claude Opus 4.8(7.65)
- 2026-06-05|硬氪独家 | 唐文斌「原力灵机」并购物流机器人公司,并获智谱、商汤、阶跃等投资(7.60)
- 2026-06-04|Cascading Hallucination in Agentic RAG: The CHARM Framework for Detection and Mitigation(7.60)
- 2026-06-05|Context Caching is Available 2024/08/02(7.60)
- 2026-06-05|技术报告:Muon 优化器的首次大规模训练实践(7.55)
- 2026-06-05|Edge AI Daily 早报(6月5日)(7.50)
- 2026-06-04|Can Generalist Agents Automate Data Curation?(7.50)
- 2026-06-05|Research Introducing Mistral Small 4(7.50)
- 2026-06-04|全球首个!材科源图发布有机高分子应用智能体(7.35)
- 2026-06-05|Emmi joins Mistral to accelerate the AI-native industry(7.35)
- 2025-11-07|Kimi 开放平台:新功能发布记录(7.35)
- 2026-06-04|AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning(7.25)
- 2026-06-04|Beyond Prompt-Based Planning: MCP-Native Graph Planning-based Biomedical Agent System(7.25)
- 2026-06-04|Dive into the Scene: Breaking the Perceptual Bottleneck in Vision-Language Decision Making via Focus Plan Generation(7.25)
- 2026-03-23|Voxtral TTS: A frontier, open-weights text-to-speech model that’s fast, instantly adaptable, and produces lifelike speech for voice agents.(7.25)
- 2026-06-04|Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs(7.20)
- 2026-06-05|阿里云百炼模型更新:大量新模型上线,聚焦Agent、多模态和编码能力(7.20)
- 2026-06-04|LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection(7.15)
- 2026-06-05|微信回应与华为小米等合作:推出A2A助手能力,支持通过手机语音助理发起微信音视频通话或发送消息(7.15)
- 2025-12-22|GLM-4.7 基座模型上线(7.10)
- 2026-06-05|微信正与手机厂商合作推出Agent-to-Agent助手能力(7.05)
- 2026-06-05|腾讯客服回应与华为、小米等合作推出A2A助手能力(7.05)
- 2026-06-04|Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation(7.05)
- 2026-03-23|Voxtral TTS(7.05)
- 2026-05-28|Introducing Search Toolkit(7.05)
- 2026-05-28|Vibe gets to work.(7.05)
- 2025-12-11|AutoGLM-Phone、GLM-TTS-Clone、GLM-TTS 三大产品上线(7.05)
- 2026-06-05|介绍一下 MoBA:面向长文本大模型的混合块注意力机制(7.05)
- 2025-07-28|GLM-4.5 系列基座模型上线(7.00)
- 2026-06-04|LLM Compression with Jointly Optimizing Architectural and Quantization choices(6.95)
- 2026-06-03|Introducing the Services Track and Partner Hub of the Claude Partner Network(6.95)
- 2026-06-04|Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline(6.85)
- 2024-07-25|New API Features 2024/07/25(6.85)
- 2025-12-08|GLM-4.6V 视觉推理模型上线(6.85)
- 2026-06-04|MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A(6.80)
- 2026-06-04|Spectral Scaling Laws of Muon(6.80)
- 2026-06-05|Kimi 长思考模型 API 正式发布(6.75)
- 2026-06-05|国家发改委:指导国产大模型加大力度适配国产算力芯片(6.70)
- 2026-06-04|Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making(6.65)
- 2025-02-17|为什么要推出 Kimi Latest 模型?(6.60)
- 2026-06-04|Do Transformers Need Three Projections? Systematic Study of QKV Variants(6.55)
值得收藏
- 2026-06-04|全球首个!材科源图发布有机高分子应用智能体(7.35)
- 2026-06-05|Emmi joins Mistral to accelerate the AI-native industry(7.35)
- 2025-11-07|Kimi 开放平台:新功能发布记录(7.35)
- 2026-06-04|AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning(7.25)
- 2026-06-04|Beyond Prompt-Based Planning: MCP-Native Graph Planning-based Biomedical Agent System(7.25)
- 2026-06-04|Dive into the Scene: Breaking the Perceptual Bottleneck in Vision-Language Decision Making via Focus Plan Generation(7.25)
- 2026-03-23|Voxtral TTS: A frontier, open-weights text-to-speech model that’s fast, instantly adaptable, and produces lifelike speech for voice agents.(7.25)
- 2026-06-04|Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs(7.20)
- 2026-06-05|阿里云百炼模型更新:大量新模型上线,聚焦Agent、多模态和编码能力(7.20)
- 2026-06-04|LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection(7.15)
- 2026-06-05|微信回应与华为小米等合作:推出A2A助手能力,支持通过手机语音助理发起微信音视频通话或发送消息(7.15)
- 2025-12-22|GLM-4.7 基座模型上线(7.10)
- 2026-06-05|微信正与手机厂商合作推出Agent-to-Agent助手能力(7.05)
- 2026-06-05|腾讯客服回应与华为、小米等合作推出A2A助手能力(7.05)
- 2026-06-04|Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation(7.05)
- 2026-03-23|Voxtral TTS(7.05)
- 2026-05-28|Introducing Search Toolkit(7.05)
- 2026-05-28|Vibe gets to work.(7.05)
- 2025-12-11|AutoGLM-Phone、GLM-TTS-Clone、GLM-TTS 三大产品上线(7.05)
- 2025-08-01|Kimi K2 高速版发布(7.05)
- 2026-06-05|介绍一下 MoBA:面向长文本大模型的混合块注意力机制(7.05)
- 2025-07-28|GLM-4.5 系列基座模型上线(7.00)
- 2026-06-04|LLM Compression with Jointly Optimizing Architectural and Quantization choices(6.95)
- 2026-06-03|Introducing the Services Track and Partner Hub of the Claude Partner Network(6.95)
- 2026-06-04|Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline(6.85)
- 2024-07-25|New API Features 2024/07/25(6.85)
- 2025-12-08|GLM-4.6V 视觉推理模型上线(6.85)
- 2026-06-04|MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A(6.80)
- 2026-06-04|Spectral Scaling Laws of Muon(6.80)
- 2026-06-05|Kimi 长思考模型 API 正式发布(6.75)
- 2026-06-05|国家发改委:指导国产大模型加大力度适配国产算力芯片(6.70)
- 2026-06-04|Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making(6.65)
- 2025-02-17|为什么要推出 Kimi Latest 模型?(6.60)
- 2026-06-04|DLLG: Dynamic Logit-Level Gating of LLM Experts(6.55)
- 2026-06-04|Do Transformers Need Three Projections? Systematic Study of QKV Variants(6.55)
- 2026-06-04|The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development?(6.35)
- 2026-06-04|Optimal Transport Flow Matching by Design(6.35)
- 2025-09-16|Kimi K2 官方高速版 API 开启 5 折特惠(6.30)
- 2026-06-04|LazyAttention: Efficient Retrieval-Augmented Generation with Deferred Positional Encoding(6.25)
- 2026-03-27|SAM 3.1: Faster and More Accessible Real-Time Video Detection and Tracking With Multiplexing and Global Reasoning(6.25)
- 2026-06-04|UT Austin朱玉可:人形机器人的数据困局怎么破?答案藏在「数据海绵」里 |ICRA 2026(6.15)
- 2025-09-30|GLM-4.6 基座模型上线(6.10)
- 2026-06-05|2026年6月5日钛早·语音播报(6.10)
- 2026-05-27|Anthropic opens Milan office to support Italian enterprise, research, and developers(6.05)
- 2026-05-22|May 22, 2026 Announcements Project Glasswing: An initial update(6.05)
- 2026-06-05|Introducing Gemini Omni(6.05)
- 2026-06-04|When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG(6.00)
值得转给团队
- 2026-05-28|Vibe gets to work.(9.00)
- 2026-04-24|DeepSeek V4 Preview Release(9.00)
- 2026-06-05|Remote agents in Vibe. Powered by Mistral Medium 3.5.(8.85)
- 2025-11-06|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力(8.85)
- 2026-06-05|AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms(8.80)
- 2026-02-12|GLM-5 新一代旗舰模型上线(8.75)
- 2026-06-05|最贵的AI,最先赚到了钱(8.70)
- 2026-06-05|Mistral Medium 3.5: 新旗舰模型与远程Agent发布(8.65)
- 2026-03-16|Mistral Small 4(8.65)
- 2025-09-05|Kimi K2 模型更新,带来更强的代码能力、更快的 API(8.65)
- 2025-11-13|SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds(8.50)
- 2026-06-05|Workflows for work that runs the business(8.30)
- 2026-06-05|Connect the dots: Build with built-in and custom MCPs in Studio(8.15)
- 2025-07-17|Kimi Playground 一站式体验 Kimi K2 的工具调用能力(8.15)
- 2026-06-05|智谱AI发布GLM-5.1旗舰模型,长程Agent能力显著提升(8.05)
- 2026-03-15|GLM-5-Turbo 龙虾增强基座模型上线(8.05)
- 2026-04-17|Introducing Claude Design by Anthropic Labs(7.95)
- 2026-06-04|SaliMory: Orchestrating Cognitive Memory for Conversational Agents(7.90)
- 2026-05-28|AI Now Summit 2026(7.90)
- 2026-06-05|Read all news(7.90)
- 2026-03-17|Introducing Forge: Build frontier-grade AI models on proprietary knowledge(7.90)
- 2026-06-05|introducing DeepSeek-V3(7.90)
- 2026-06-04|SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models(7.85)
- 2026-06-05|36氪独家|2026 年字节 AI 的四个关键命题(7.80)
- 2026-06-04|Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification(7.80)
- 2026-06-04|Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval(7.80)
- 2026-05-28|Introducing Claude Opus 4.8(7.80)
- 2026-05-28|Introducing Claude Opus 4.8(7.75)
- 2025-12-02|Mistral 3(7.75)
- 2026-06-05|实现芯片设计验证自动化,提升开发效率10倍以上,「智维创芯」完成数千万元天使轮融资(7.65)
- 2026-06-05|Introducing Claude Opus 4.8(7.65)
- 2026-06-05|硬氪独家 | 唐文斌「原力灵机」并购物流机器人公司,并获智谱、商汤、阶跃等投资(7.60)
- 2026-06-04|Cascading Hallucination in Agentic RAG: The CHARM Framework for Detection and Mitigation(7.60)
- 2026-06-05|Context Caching is Available 2024/08/02(7.60)
- 2026-06-05|Edge AI Daily 早报(6月5日)(7.50)
- 2026-06-04|Can Generalist Agents Automate Data Curation?(7.50)
- 2026-06-05|Research Introducing Mistral Small 4(7.50)
- 2026-06-04|全球首个!材科源图发布有机高分子应用智能体(7.35)
- 2026-06-05|Emmi joins Mistral to accelerate the AI-native industry(7.35)
- 2025-11-07|Kimi 开放平台:新功能发布记录(7.35)
- 2026-06-04|AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning(7.25)
- 2026-06-04|Beyond Prompt-Based Planning: MCP-Native Graph Planning-based Biomedical Agent System(7.25)
- 2026-06-04|Dive into the Scene: Breaking the Perceptual Bottleneck in Vision-Language Decision Making via Focus Plan Generation(7.25)
- 2026-03-23|Voxtral TTS: A frontier, open-weights text-to-speech model that’s fast, instantly adaptable, and produces lifelike speech for voice agents.(7.25)
- 2026-06-04|Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs(7.20)
- 2026-06-05|阿里云百炼模型更新:大量新模型上线,聚焦Agent、多模态和编码能力(7.20)
- 2026-06-04|LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection(7.15)
- 2026-06-05|微信回应与华为小米等合作:推出A2A助手能力,支持通过手机语音助理发起微信音视频通话或发送消息(7.15)
- 2025-12-22|GLM-4.7 基座模型上线(7.10)
- 2026-06-05|微信正与手机厂商合作推出Agent-to-Agent助手能力(7.05)
- 2026-06-05|腾讯客服回应与华为、小米等合作推出A2A助手能力(7.05)
- 2026-06-04|Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation(7.05)
- 2026-03-23|Voxtral TTS(7.05)
- 2026-05-28|Introducing Search Toolkit(7.05)
- 2026-05-28|Vibe gets to work.(7.05)
- 2025-12-11|AutoGLM-Phone、GLM-TTS-Clone、GLM-TTS 三大产品上线(7.05)
- 2025-08-01|Kimi K2 高速版发布(7.05)
- 2026-06-05|介绍一下 MoBA:面向长文本大模型的混合块注意力机制(7.05)
- 2025-07-28|GLM-4.5 系列基座模型上线(7.00)
- 2026-06-04|LLM Compression with Jointly Optimizing Architectural and Quantization choices(6.95)
- 2026-06-04|Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline(6.85)
- 2024-07-25|New API Features 2024/07/25(6.85)
- 2025-12-08|GLM-4.6V 视觉推理模型上线(6.85)
- 2026-06-04|MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A(6.80)
- 2026-06-04|Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making(6.65)
- 2025-02-17|为什么要推出 Kimi Latest 模型?(6.60)
- 2025-09-16|Kimi K2 官方高速版 API 开启 5 折特惠(6.30)
- 2025-09-30|GLM-4.6 基座模型上线(6.10)
- 2026-06-05|2026年6月5日钛早·语音播报(6.10)
- 2026-06-05|扣子3.0实测:手机就能远程遥控你电脑里的Agent(5.55)
可以忽略
- 2026-06-04|A Systematic Analysis of Linguistic Features in AI-Generated Text Detection Across Domains and Models(4.90)
- 2026-06-04|UniCanvas: A Diffusion-base Unified Model for Text-in-Image Joint Generation(4.45)
- 2026-06-04|Expert-Aware Refusal Steering(4.40)
- 2026-06-05|Physics AI research that’s shaping the industry(4.30)
- 2026-06-04|Cross-Prompt Generalization in Detecting AI-Generated Fake News Using Interpretable Linguistic Features(4.20)
- 2026-06-04|Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection(4.10)
- 2026-06-04|Overview of the EReL@MIR 2025 Multimodal Document Retrieval Challenge (Track 1)(4.10)
- 2026-06-05|SpaceX已启动IPO路演,预计每股价格为135美元(4.10)
- 2026-06-05|OpenAI将AI硬件设备发布时间大幅提前至2026年底(4.00)
- 2026-06-05|Anthropic Research 页面汇总(3.95)
- 2026-06-04|VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark(3.90)
- 2026-06-04|Large Language Models Hack Rewards, and Society(3.90)
- 2026-06-04|Weakly Supervised Incremental Segmentation via Semantic Anchors and Spatial Arbitration(3.85)
- 2026-06-04|End-to-End Text Line Detection and Ordering(3.85)
- 2026-06-04|Pinpoint: Grounded Worldwide Image Geolocation via Cross-Source Retrieval and Reranking(3.80)
- 2026-06-05|股价再创历史新高,72万散户“战胜”机构:工业富联1.6万亿市值的水位与暗涌 | 深度(3.80)
- 2026-06-05|小鹏机器人核心产品一号位施晓鑫6月初主动离职(3.70)
- 2026-06-04|Computational conceptual history of scientific concepts: From early digital methods to LLMs(3.70)
- 2026-06-05|May 25, 2026 Announcements Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas"(3.70)
- 2026-06-05|Explore research(3.70)
- 2026-06-04|GlossAssist -- A Tool to Simplify Corpus Creation and Study the Effect of NLP Models in Low-Resource Documentation Settings(3.65)
- 2026-06-04|XSSR: Cross-Domain Self-Supervised Representative Selection for Efficient Annotation in Medical Image Segmentation(3.65)
- 2026-02-04|Claude is a space to think(3.60)
- 2024-08-02|Kimi 企业级 API 正式发布(3.60)
- 2026-06-04|Can I Take Another Dose? Evaluating LLM Decision-Making Under Temporal Uncertainty in OTC Dosing QA(3.55)
- 2026-06-04|Long Live Fine-Tuning: Task-Specific Transformers Outperform Zero-Shot LLMs for Misinformation Response Classification on Reddit(3.55)
- 2026-06-04|A Goal-Set Characterization of Task Composition in the Boolean Task Algebra(3.55)
- 2026-06-05|李宁需要库里,但库里更需要李宁(3.45)
- 2026-06-04|TPA-AD: A Two-Stage Pseudo Anomaly-Guided Method for Bearing Time-Series Anomaly Detection(3.35)
- 2026-06-04|GroupToM-Bench: Benchmarking Group Theory of Mind and Nonlinear Social Emergence in MLLMs(3.30)
- 2026-06-04|Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research(3.20)
- 2026-06-04|Spatial Artifact Coherence Determines Codec Robustness in Patch-Based rPPG(3.20)
- 2026-06-04|How courts are coping with a flood of AI-generated lawsuits(3.15)
- 2026-06-04|Early Detection of Alzheimer's Disease Using Explainable Machine Learning on Clinical Biomarkers: A Multi-Class Classification Study Using the Alzheimer's Disease Neuroimaging Initiative (ADNI) Dataset(3.15)
- 2026-06-04|Adaptive Patching Is Harder Than It Looks For Time-Series Forecasting(3.15)
- 2026-06-05|背KPI上岗:数字员工成“最优”打工人?(3.10)
- 2026-06-04|Reflection Separation from a Single Image via Joint Latent Diffusion(3.10)
- 2026-06-04|Bayes-Sufficient Representations in Supervised Learning(3.10)
- 2026-06-05|他们想靠AI短剧换个活法(3.05)
- 2026-06-05|李强主持召开国务院常务会议,研究推进全国统一大市场建设有关工作(2.90)
- 2026-06-04|A Cookbook of 3D Vision: Data, Learning Paradigms, and Application(2.85)
- 2026-06-04|Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent(2.85)
- 2026-06-05|外卖大战一年账单:烧掉1500亿,改变了什么?(2.80)
- 2026-06-05|为什么库里没有选择安踏?(2.75)
- 2026-06-04|Noisy memory encoding explains negative polarity illusions(2.75)
- 2026-06-04|Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal(2.65)
- 2026-06-04|Stein Kernelized Molecular Dynamics for Active Learning of Interatomic Potentials(2.65)
- 2026-06-05|粉笔走下坡路的原因找到了(2.65)
- 2026-06-04|Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture(2.55)
- 2026-06-05|毫秒智控完成数千万元天使+轮融资(2.45)
- 2026-06-04|Prospective Dynamic 3D MRI Reconstruction via Latent-Space Motion Tracking from Single Measurement(2.30)
- 2026-06-04|SBP-Net: Learning Thin Structure Reconstruction with Sliding-Box Projections(2.30)
- 2026-06-05|AlphaGo Mastering the game of Go(2.05)
- 2026-06-05|Solutions(2.05)
- 2026-06-05|AI芯片的下一个五年:晶圆还圆吗?(2.00)
- 2026-06-05|人形机器人进场以后,谁来吞下失败成本?(2.00)
- 2026-06-05|Qwen博客页面(包含Qwen3Guard、Qwen-Image-Edit等多篇博文)(1.90)
- 2026-06-05|Products(1.85)
- 2026-06-05|从欧莱雅到联合利华:品牌开始对AI说不(1.80)
- 2026-06-05|Publications(1.75)
- 2024-07-23|Kimi 开放平台 Office Hour Season 1 Recap(1.75)
- 2026-06-04|CCIG 2026 在广州圆满落幕:4200 余位专家学者共绘图像图形发展新图景(1.70)
- 2026-06-04|基金市场概况与资产配置观点(2026.05.25—2026.05.31)(1.60)
- 2026-06-05|泰国寻求6月底前与美国达成贸易协议,目标关税为10%(1.45)
- 2026-06-05|商务部:1-4月我国服务进出口总额24853.2亿元(1.45)
- 2026-06-05|可灵头上缺了一朵遮风挡雨的云(1.30)
- 2026-06-05|南向资金净买入额达20亿港元(1.20)
- 2026-06-05|碳酸锂最近怎么涨不动了?六个反常信号看清当下的市场困局(1.20)
- 2026-06-05|一张电费单正在撕裂美国,更照出了中美AI竞争的底牌(1.15)
- 2026-06-05|对话一线电力交易总监:靠信息差躺着赚钱的日子,已经彻底过去了(1.10)
- 2026-06-05|煤电协同提速,兖矿能源164亿落子新能源(1.10)
- 2026-06-05|酒业大变局:传统酒企集体过冬,散酒铺凭什么成为千亿“避风港”?(1.05)
- 2026-06-05|5月份中国大宗商品价格指数继续上扬(1.00)
- 2026-06-05|央行今日开展2150亿元7天期逆回购操作(1.00)
- 2026-06-05|把OpenAI按在地上摩擦,Anthropic怎么做到的?(1.00)
- 2026-06-05|两个硅谷天才吵起来了:AI 编程引发现实大灾难?(1.00)
- 2026-06-05|市值暴涨逾1300%,一家三期临床失败的药企如何“死里逃生”?(0.90)
- 2026-06-05|光伏巨头们的储能生意,为什么都做得很艰难?(0.90)
- 2026-06-05|【6月4日新闻联播速览22条】(0.85)
- 2026-06-05|A股三大指数集体低开,唯特偶跌超9%(0.80)
- 2026-06-05|套路失灵,品牌下一步要以“真”感人(0.75)
- 2026-06-05|618家电变局:价格战退潮,“速度战”加码(0.75)
- 2026-06-05|News — Google DeepMind(0.45)
- 2026-06-05|创投家CLUB投资机构库(0.20)
- 2026-06-05|小房量酒店能否借“内容”暴富?(0.10)
- 2026-06-05|News Discover our latest AI breakthroughs, projects, and updates(0.10)
- 2026-06-05|Google Research Explore our research(0.10)
- 2026-06-05|Latest news(0.10)
- 2026-06-05|Kimi K2: Open Agentic Intelligence(0.10)
- 2026-06-05|机器之心(0.10)
- 2026-06-05|钛媒体App-商业财经信息及专业人士汇聚交流平台(0.10)
- 2026-06-05|这届北京车展,我看到了行业洗牌的信号(0.10)
- 2026-06-05|最话FunTa...(0.10)