关注AI智能体工具和资讯,跟踪大模型和AI智能体产品发展。
🪐温馨提示:看AI新闻,并不等于学习AI哦,一定要实操。
Figma收购AI新贵 | Kimi架构颠覆性革新 | Sora开启角色客串 – 10.31
聚焦AI Agent、多模态生成与大模型架构的最新突破。
🔥 Big News
- 智源发布Emu3.5,多模态世界模型迎来新时代 北京智源人工智能研究院发布了Emu3.5,这是一个强大的多模态世界模型。它的出现标志着AI从纯粹的感知理解,开始迈向能够与物理世界交互的“工程学”时代。
- Windsurf发布自研编码模型SWE-1.5,速度惊人 Windsurf公司推出了自己的编码大模型SWE-1.5。它拥有数百亿参数,性能接近顶尖水平,并且通过与Cerebras合作,实现了每秒处理950个token的超高速度。
🤖 智能体 (Agent)
- OpenAI推出安全智能体Aardvark,自动修复代码漏洞 OpenAI发布了一款名为
Aardvark的智能安全助理。它基于GPT-5,能够自动分析代码库、发现安全漏洞,并调用Codex模型生成修复补丁,大大提升软件安全性。 链接:https://openai.com/index/introducing-aardvark/ - 阿里通义新作UI-Ins,解锁GUI智能体推理新范式 阿里通义与中国人民大学合作发布了UI-Ins。这是一个下一代图形界面(GUI)基础模型,能让指令学会推理,为GUI智能体的应用开辟了新道路。
- 微软Copilot新增电脑操作能力,可自动收集信息生成报告 微软365 Copilot中的Researcher功能现已具备电脑操作能力。它可以模仿人类访问网页、收集信息,并自动生成最终的报告,让智能体更实用。 链接:https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-researcher-with-computer-use-in-microsoft-365-copilot/4464766
- 首个离线电脑操作Agent基准测评结果发布 业界首批针对“Computer Use Agent”(离线电脑使用智能体)的基准测评结果已经公布,为评估这类智能体的性能提供了标准。
- Solana联合创始人力挺智能体编码 Solana的联合创始人Anatoly Yakovenko公开表示,他是“智能体编码”的忠实拥护者,看好其在软件开发领域的巨大潜力。
🎨 AI绘画视频音乐
- Figma收购AI生成公司Weavy,打造节点式AI设计工作流** 设计软件巨头Figma收购了AI初创公司Weavy。此举旨在打造一个全新的“节点式”AI设计工作流,让设计师可以混合使用多种AI模型,更自由地创作。

- Sora推出角色客串功能,保持角色一致性 OpenAI的视频生成应用Sora上线了“角色客串”新功能。现在,用户可以在不同视频中让同一个虚拟角色登场,保持形象的连贯性。
- Sora免费额度缩水,视频生成进入商业化阶段 由于算力成本压力,OpenAI调整了Sora的免费策略,减少了免费生成次数并推出付费包。这标志着AI视频生成开始进入商业化深水区。
- MiniMax发布Music 2.0,AI帮你作曲唱歌 MiniMax公司推出了AI音乐模型Music 2.0。它就像一个全能的AI音乐人,可以帮你完成作曲、演唱和制作的全过程。 链接:https://www.minimax.io/audio/music
- Chrome浏览器新增Nano Banana,随时随地搞创作 谷歌在其Chrome Canary浏览器中加入了由Gemini驱动的Nano Banana功能,用户现在可以直接在浏览器里通过文字描述生成图片。
- 全球首款AI字体生成器Dr Fonts©上线 一款名为Dr Fonts©的AI字体生成器正式上线,号称全球首款。用户可以通过上传图像来创建自己的专属字体,目前可以免费试用。 链接:https://drfonts.com/
- 英伟达开源图片编辑模型ChronoEdit-14B 英伟达开源了一款名为ChronoEdit-14B的图片编辑模型。该模型可以实现有物理感知的图像编辑和动作模拟,并且支持商业用途。 链接:https://huggingface.co/nvidia/ChronoEdit-14B-Diffusers
🚀 大模型动态
- 月之暗面发布Kimi Linear架构,推理速度提升6倍 月之暗面公司在Attention机制上取得重大突破,发布了Kimi Linear架构。该技术能让KV缓存减少75%,解码速度提升6倍,极大地提升了模型的运行效率。 链接:https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf
- 中国MiniMax M2模型登顶开源榜 在最新的开源大模型排行榜上,来自中国的MiniMax M2模型刷新了SOTA(当前最佳技术)纪录,位列全球第五,开源榜单第一。
- 谷歌确认:下一代模型Gemini 3将于2025年发布 谷歌CEO桑达尔·皮查伊在财报电话会议上确认,公司正在准备其下一代旗舰AI模型Gemini 3,并计划于2025年正式发布。
- DeepSeek或已找到提升AI记忆力的新方法 据报道,国内AI公司DeepSeek可能已经找到了一种新方法。这种方法有望显著提高人工智能模型的记忆能力。
🌐 行业资讯
- 比尔·盖茨:AI是我一生中最重要的技术,但要警惕泡沫 微软联合创始人比尔·盖茨称,人工智能是他一生中遇到的最重要的技术成就。但他同时警告,AI领域可能存在的泡沫不容忽视。
- 著名数学家陶哲轩警告:AI正向世纪数学难题宣战 数学家陶哲轩发出提醒,谷歌DeepMind正与世界顶尖机构合作,利用AI向“黎曼猜想”等世纪数学难题发起挑战。
- 英伟达据报将向AI编码公司Poolside投资10亿美元 据报道,芯片巨头英伟达计划向专注于软件编码的AI公司Poolside进行高达10亿美元的巨额投资。
- MIT报告揭示AI在商业领域的应用现状 麻省理工学院最新发布的《人工智能在商业领域的应用现状》报告引发热议,报告深入分析了AI技术在企业中的实际落地情况。
🛠️ 技术与工具
- HuggingFace分享超详细LLM训练手册 AI社区HuggingFace公开了一份200多页的文档。该文档详细记录了他们训练SmolLM3-3B模型的每一步操作,为开发者提供了宝贵的实践指南。 链接:https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#introduction
- 用TRAE开发审批系统:一套可复制的AI工作流** 有技术文章介绍了如何使用TRAE框架来开发一个审批系统,展示了一套可复制、高效的AI辅助开发工作流。
- 快手用AI模型重构短视频推荐排序 快手推出了EMER框架,用一种“会比较、自进化”的AI模型代替了传统的人工公式。此举旨在更智能地进行短视频的推荐排序。
- Perplexity推出全球首个人工智能专利检索代理平台 AI搜索公司Perplexity正式上线了Perplexity Patents。这是全球首个AI专利检索代理平台,旨在让复杂的知识产权信息变得人人可用。
🤖 智能硬件
- Figure CEO:我们的机器人不会被远程操控 人形机器人公司Figure的首席执行官Brett Adcock表示,公司坚持机器人自主决策的路线,不会采用远程操控的策略,这与竞争对手1X形成了鲜明对比。
- Humanoid公司机器人在工厂完成拣货试验 另一家人形机器人公司Humanoid宣布,其Pre-Alpha型号的机器人在德国舍弗勒的工厂中,已经成功完成了首次拣选和包装任务的试验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END






















暂无评论内容