1031-AI日报|Figma收购AI新贵 | Kimi架构颠覆性革新 | Sora开启角色客串

关注AI智能体工具和资讯,跟踪大模型和AI智能体产品发展。 🪐温馨提示:看AI新闻,并不等于学习AI哦,一定要实操。

Figma收购AI新贵 | Kimi架构颠覆性革新 | Sora开启角色客串 – 10.31

聚焦AI Agent、多模态生成与大模型架构的最新突破。


🔥 Big News

  1. 智源发布Emu3.5,多模态世界模型迎来新时代 北京智源人工智能研究院发布了Emu3.5,这是一个强大的多模态世界模型。它的出现标志着AI从纯粹的感知理解,开始迈向能够与物理世界交互的“工程学”时代。
  2. Windsurf发布自研编码模型SWE-1.5,速度惊人 Windsurf公司推出了自己的编码大模型SWE-1.5。它拥有数百亿参数,性能接近顶尖水平,并且通过与Cerebras合作,实现了每秒处理950个token的超高速度。

🤖 智能体 (Agent)

  1. OpenAI推出安全智能体Aardvark,自动修复代码漏洞 OpenAI发布了一款名为Aardvark智能安全助理。它基于GPT-5,能够自动分析代码库、发现安全漏洞,并调用Codex模型生成修复补丁,大大提升软件安全性。 链接:https://openai.com/index/introducing-aardvark/
  2. 阿里通义新作UI-Ins,解锁GUI智能体推理新范式 阿里通义与中国人民大学合作发布了UI-Ins。这是一个下一代图形界面(GUI)基础模型,能让指令学会推理,为GUI智能体的应用开辟了新道路。
  3. 微软Copilot新增电脑操作能力,可自动收集信息生成报告 微软365 Copilot中的Researcher功能现已具备电脑操作能力。它可以模仿人类访问网页、收集信息,并自动生成最终的报告,让智能体更实用。 链接:https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-researcher-with-computer-use-in-microsoft-365-copilot/4464766
  4. 首个离线电脑操作Agent基准测评结果发布 业界首批针对“Computer Use Agent”(离线电脑使用智能体)的基准测评结果已经公布,为评估这类智能体的性能提供了标准。
  5. Solana联合创始人力挺智能体编码 Solana的联合创始人Anatoly Yakovenko公开表示,他是“智能体编码”的忠实拥护者,看好其在软件开发领域的巨大潜力。

🎨 AI绘画视频音乐

  1. Figma收购AI生成公司Weavy,打造节点式AI设计工作流** 设计软件巨头Figma收购了AI初创公司Weavy。此举旨在打造一个全新的“节点式”AI设计工作流,让设计师可以混合使用多种AI模型,更自由地创作。640-3
  2. Sora推出角色客串功能,保持角色一致性 OpenAI的视频生成应用Sora上线了“角色客串”新功能。现在,用户可以在不同视频中让同一个虚拟角色登场,保持形象的连贯性。
  3. Sora免费额度缩水,视频生成进入商业化阶段 由于算力成本压力,OpenAI调整了Sora的免费策略,减少了免费生成次数并推出付费包。这标志着AI视频生成开始进入商业化深水区。
  4. MiniMax发布Music 2.0,AI帮你作曲唱歌 MiniMax公司推出了AI音乐模型Music 2.0。它就像一个全能的AI音乐人,可以帮你完成作曲、演唱和制作的全过程。 链接:https://www.minimax.io/audio/music
  5. Chrome浏览器新增Nano Banana,随时随地搞创作 谷歌在其Chrome Canary浏览器中加入了由Gemini驱动的Nano Banana功能,用户现在可以直接在浏览器里通过文字描述生成图片。
  6. 全球首款AI字体生成器Dr Fonts©上线 一款名为Dr Fonts©的AI字体生成器正式上线,号称全球首款。用户可以通过上传图像来创建自己的专属字体,目前可以免费试用。 链接:https://drfonts.com/
  7. 英伟达开源图片编辑模型ChronoEdit-14B 英伟达开源了一款名为ChronoEdit-14B的图片编辑模型。该模型可以实现有物理感知的图像编辑和动作模拟,并且支持商业用途。 链接:https://huggingface.co/nvidia/ChronoEdit-14B-Diffusers

🚀 大模型动态

  1. 月之暗面发布Kimi Linear架构,推理速度提升6倍 月之暗面公司在Attention机制上取得重大突破,发布了Kimi Linear架构。该技术能让KV缓存减少75%,解码速度提升6倍,极大地提升了模型的运行效率。 链接:https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf
  2. 中国MiniMax M2模型登顶开源榜 在最新的开源大模型排行榜上,来自中国的MiniMax M2模型刷新了SOTA(当前最佳技术)纪录,位列全球第五,开源榜单第一。
  3. 谷歌确认:下一代模型Gemini 3将于2025年发布 谷歌CEO桑达尔·皮查伊在财报电话会议上确认,公司正在准备其下一代旗舰AI模型Gemini 3,并计划于2025年正式发布。
  4. DeepSeek或已找到提升AI记忆力的新方法 据报道,国内AI公司DeepSeek可能已经找到了一种新方法。这种方法有望显著提高人工智能模型的记忆能力。

🌐 行业资讯

  1. 比尔·盖茨:AI是我一生中最重要的技术,但要警惕泡沫 微软联合创始人比尔·盖茨称,人工智能是他一生中遇到的最重要的技术成就。但他同时警告,AI领域可能存在的泡沫不容忽视。
  2. 著名数学家陶哲轩警告:AI正向世纪数学难题宣战 数学家陶哲轩发出提醒,谷歌DeepMind正与世界顶尖机构合作,利用AI向“黎曼猜想”等世纪数学难题发起挑战。
  3. 英伟达据报将向AI编码公司Poolside投资10亿美元 据报道,芯片巨头英伟达计划向专注于软件编码的AI公司Poolside进行高达10亿美元的巨额投资。
  4. MIT报告揭示AI在商业领域的应用现状 麻省理工学院最新发布的《人工智能在商业领域的应用现状》报告引发热议,报告深入分析了AI技术在企业中的实际落地情况。

🛠️ 技术与工具

  1. HuggingFace分享超详细LLM训练手册 AI社区HuggingFace公开了一份200多页的文档。该文档详细记录了他们训练SmolLM3-3B模型的每一步操作,为开发者提供了宝贵的实践指南。 链接:https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#introduction
  2. 用TRAE开发审批系统:一套可复制的AI工作流** 有技术文章介绍了如何使用TRAE框架来开发一个审批系统,展示了一套可复制、高效的AI辅助开发工作流
  3. 快手用AI模型重构短视频推荐排序 快手推出了EMER框架,用一种“会比较、自进化”的AI模型代替了传统的人工公式。此举旨在更智能地进行短视频的推荐排序。
  4. Perplexity推出全球首个人工智能专利检索代理平台 AI搜索公司Perplexity正式上线了Perplexity Patents。这是全球首个AI专利检索代理平台,旨在让复杂的知识产权信息变得人人可用。

🤖 智能硬件

  1. Figure CEO:我们的机器人不会被远程操控 人形机器人公司Figure的首席执行官Brett Adcock表示,公司坚持机器人自主决策的路线,不会采用远程操控的策略,这与竞争对手1X形成了鲜明对比。
  2. Humanoid公司机器人在工厂完成拣货试验 另一家人形机器人公司Humanoid宣布,其Pre-Alpha型号的机器人在德国舍弗勒的工厂中,已经成功完成了首次拣选和包装任务的试验。
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
相关推荐
评论 抢沙发

请登录后发表评论

    暂无评论内容