关注AI智能体工具和资讯，跟踪大模型和AI智能体产品发展。 🪐温馨提示：看AI新闻，并不等于学习AI哦，一定要实操。

Figma收购AI新贵 | Kimi架构颠覆性革新 | Sora开启角色客串 – 10.31

聚焦AI Agent、多模态生成与大模型架构的最新突破。

🔥 Big News

智源发布Emu3.5，多模态世界模型迎来新时代 北京智源人工智能研究院发布了Emu3.5，这是一个强大的多模态世界模型。它的出现标志着AI从纯粹的感知理解，开始迈向能够与物理世界交互的“工程学”时代。
Windsurf发布自研编码模型SWE-1.5，速度惊人 Windsurf公司推出了自己的编码大模型SWE-1.5。它拥有数百亿参数，性能接近顶尖水平，并且通过与Cerebras合作，实现了每秒处理950个token的超高速度。

🤖 智能体 (Agent)

OpenAI推出安全智能体Aardvark，自动修复代码漏洞 OpenAI发布了一款名为Aardvark的智能安全助理。它基于GPT-5，能够自动分析代码库、发现安全漏洞，并调用Codex模型生成修复补丁，大大提升软件安全性。链接：https://openai.com/index/introducing-aardvark/
阿里通义新作UI-Ins，解锁GUI智能体推理新范式 阿里通义与中国人民大学合作发布了UI-Ins。这是一个下一代图形界面（GUI）基础模型，能让指令学会推理，为GUI智能体的应用开辟了新道路。
微软Copilot新增电脑操作能力，可自动收集信息生成报告 微软365 Copilot中的Researcher功能现已具备电脑操作能力。它可以模仿人类访问网页、收集信息，并自动生成最终的报告，让智能体更实用。链接：https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-researcher-with-computer-use-in-microsoft-365-copilot/4464766
首个离线电脑操作Agent基准测评结果发布业界首批针对“Computer Use Agent”（离线电脑使用智能体）的基准测评结果已经公布，为评估这类智能体的性能提供了标准。
Solana联合创始人力挺智能体编码 Solana的联合创始人Anatoly Yakovenko公开表示，他是“智能体编码”的忠实拥护者，看好其在软件开发领域的巨大潜力。

🎨 AI绘画视频音乐

Figma收购AI生成公司Weavy，打造节点式AI设计工作流** 设计软件巨头Figma收购了AI初创公司Weavy。此举旨在打造一个全新的“节点式”AI设计工作流，让设计师可以混合使用多种AI模型，更自由地创作。
Sora推出角色客串功能，保持角色一致性 OpenAI的视频生成应用Sora上线了“角色客串”新功能。现在，用户可以在不同视频中让同一个虚拟角色登场，保持形象的连贯性。
Sora免费额度缩水，视频生成进入商业化阶段 由于算力成本压力，OpenAI调整了Sora的免费策略，减少了免费生成次数并推出付费包。这标志着AI视频生成开始进入商业化深水区。
MiniMax发布Music 2.0，AI帮你作曲唱歌 MiniMax公司推出了AI音乐模型Music 2.0。它就像一个全能的AI音乐人，可以帮你完成作曲、演唱和制作的全过程。链接：https://www.minimax.io/audio/music
Chrome浏览器新增Nano Banana，随时随地搞创作 谷歌在其Chrome Canary浏览器中加入了由Gemini驱动的Nano Banana功能，用户现在可以直接在浏览器里通过文字描述生成图片。
全球首款AI字体生成器Dr Fonts©上线 一款名为Dr Fonts©的AI字体生成器正式上线，号称全球首款。用户可以通过上传图像来创建自己的专属字体，目前可以免费试用。链接：https://drfonts.com/
英伟达开源图片编辑模型ChronoEdit-14B 英伟达开源了一款名为ChronoEdit-14B的图片编辑模型。该模型可以实现有物理感知的图像编辑和动作模拟，并且支持商业用途。链接：https://huggingface.co/nvidia/ChronoEdit-14B-Diffusers

🚀 大模型动态

月之暗面发布Kimi Linear架构，推理速度提升6倍 月之暗面公司在Attention机制上取得重大突破，发布了Kimi Linear架构。该技术能让KV缓存减少75%，解码速度提升6倍，极大地提升了模型的运行效率。链接：https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf
中国MiniMax M2模型登顶开源榜 在最新的开源大模型排行榜上，来自中国的MiniMax M2模型刷新了SOTA（当前最佳技术）纪录，位列全球第五，开源榜单第一。
谷歌确认：下一代模型Gemini 3将于2025年发布 谷歌CEO桑达尔·皮查伊在财报电话会议上确认，公司正在准备其下一代旗舰AI模型Gemini 3，并计划于2025年正式发布。
DeepSeek或已找到提升AI记忆力的新方法 据报道，国内AI公司DeepSeek可能已经找到了一种新方法。这种方法有望显著提高人工智能模型的记忆能力。

🌐 行业资讯

比尔·盖茨：AI是我一生中最重要的技术，但要警惕泡沫 微软联合创始人比尔·盖茨称，人工智能是他一生中遇到的最重要的技术成就。但他同时警告，AI领域可能存在的泡沫不容忽视。
著名数学家陶哲轩警告：AI正向世纪数学难题宣战 数学家陶哲轩发出提醒，谷歌DeepMind正与世界顶尖机构合作，利用AI向“黎曼猜想”等世纪数学难题发起挑战。
英伟达据报将向AI编码公司Poolside投资10亿美元 据报道，芯片巨头英伟达计划向专注于软件编码的AI公司Poolside进行高达10亿美元的巨额投资。
MIT报告揭示AI在商业领域的应用现状 麻省理工学院最新发布的《人工智能在商业领域的应用现状》报告引发热议，报告深入分析了AI技术在企业中的实际落地情况。

🛠️ 技术与工具

HuggingFace分享超详细LLM训练手册 AI社区HuggingFace公开了一份200多页的文档。该文档详细记录了他们训练SmolLM3-3B模型的每一步操作，为开发者提供了宝贵的实践指南。链接：https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#introduction
用TRAE开发审批系统：一套可复制的AI工作流** 有技术文章介绍了如何使用TRAE框架来开发一个审批系统，展示了一套可复制、高效的AI辅助开发工作流。
快手用AI模型重构短视频推荐排序 快手推出了EMER框架，用一种“会比较、自进化”的AI模型代替了传统的人工公式。此举旨在更智能地进行短视频的推荐排序。
Perplexity推出全球首个人工智能专利检索代理平台 AI搜索公司Perplexity正式上线了Perplexity Patents。这是全球首个AI专利检索代理平台，旨在让复杂的知识产权信息变得人人可用。

🤖 智能硬件

Figure CEO：我们的机器人不会被远程操控 人形机器人公司Figure的首席执行官Brett Adcock表示，公司坚持机器人自主决策的路线，不会采用远程操控的策略，这与竞争对手1X形成了鲜明对比。
Humanoid公司机器人在工厂完成拣货试验 另一家人形机器人公司Humanoid宣布，其Pre-Alpha型号的机器人在德国舍弗勒的工厂中，已经成功完成了首次拣选和包装任务的试验。

文章版权归作者所有，未经允许请勿转载。

THE END