关注AI智能体工具和资讯,跟踪大模型和AI产品发展。
🪐温馨提示:不是所有的都要看 ,挑感兴趣用得上的看,每个人的口味和需求不一样。
AI大模型动态
- Transformer之父:是时候放弃Transformer了!Transformer架构的创造者之一Llion Jones公开呼吁,AI领域应停止对Transformer的过度依赖。他认为,当前的研究环境被资本和论文KPI束缚,导致创新停滞,现在是时候探索全新的AI架构了。
- 清华与快手提出SVG方案,或将取代VAE清华大学与快手可灵团队提出的SVG视觉生成方案,证明了在AI生图领域,可以不依赖传统的VAE架构。该方案通过自监督特征构建潜藏空间,性能优越,预示着统一视觉模型的新时代可能到来。
- 北大提出RiskPO,打破大模型均值优化陷阱针对大模型后训练中存在的缺陷,北京大学团队提出了RiskPO算法。该算法将风险规避理念融入训练目标,在数学、代码等多项推理任务上表现出色,有效提升了模型的推理能力。
- 上海交大提出“规范对齐”,助力大模型安全实用上海交通大学等团队提出了“规范对齐”的新概念,要求大模型在追求能力的同时,必须兼顾安全与社会行为规范。他们构建了评测基准SpecBench,发现多数模型在此方面仍有差距,并开源了项目以推动行业发展。
AI产品与应用
- OpenAI Atlas浏览器发布,或成谷歌致命威胁OpenAI正式发布了Atlas浏览器,直接挑战谷歌的搜索入口地位。它采用“回答和执行”模式取代传统搜索,可能颠覆谷歌赖以生存的广告业务,此举已引发谷歌股价下跌。
- 阿里夸克上线“对话助手”,融合搜索与AI阿里夸克正式上线“对话助手”,集成了最新的Qwen闭源模型。这款产品深度融合了搜索与对话功能,旨在打造一个人人可用的“中国版ChatGPT”,被视为阿里抢占C端AI入口的重要布局。
- Adobe发布新神器EditVerse,P视频像P图一样简单Adobe等机构联合推出了视频编辑工具EditVerse,它极大地降低了视频编辑的门槛。该工具通过海量数据训练,实现了像P图一样轻松编辑视频的效果,性能甚至超越了Runway。
- 微软Copilot迎来秋季大更新,新角色Mico亮相微软在10月23日发布了Copilot的秋季更新版,其中最引人注目的是新增了能反映情绪的AI角色Mico。此次更新共包含12项功能,旨在将Copilot升级为更懂用户情境的AI基础设施。
- 池建强解读DeepSeek-OCR:小而精模型的胜利针对DeepSeek-OCR,知名技术专家池建强指出,它并非通用模型,而是为特定场景深度优化的视觉语言模型。它的成功证明了小而精的模型在特定赛道上具有强大的竞争力,为行业带来了新思路。
智能体 (Agent)
- 斯坦福提出AgentFlow框架,让智能体“边做边学”斯坦福大学等团队提出了AgentFlow框架和Flow-GRPO算法,核心思想是让AI智能体能够在执行任务的过程中“边做边学”。实验证明,该框架能有效提升智能体系统的稳定性和效率,甚至能让小模型胜过大模型。
- 从ReasoningBank看智能体自进化新路径行业内正在探索智能体自进化的新路径。除了传统的强化学习,更多研究转向改进记忆机制,如ReasoningBank机制。它能让智能体在不进行大量模型微调的情况下,实现适应性进化,降低了应用成本。
- VAGEN框架发布,让视觉智能体“三思而后行”美国多所高校联合推出了VAGEN强化学习框架。该框架通过奖励视觉语言模型(VLM)智能体正确的“思考过程”,而非仅仅是最终结果,使其在处理视觉任务时能够“三思而后行”,3B小模型的综合得分甚至超过了GPT-5。
- AceSearcher模型发布,实现推理与检索的完美结合埃默里大学等团队发布了AceSearcher模型,通过创新的两阶段训练方法,将模型的推理能力与信息检索能力紧密结合。它证明了推理与检索协同工作可以大幅提升性能,让小模型也能有出色表现。
AI开源项目
- LangChain完成1.25亿美元融资,发布1.0重构版知名的AI智能体开发框架LangChain完成新一轮1.25亿美元融资,估值达到12.5亿美元,并发布了重构的1.0版本。新版以LangGraph为底座,旨在为开发者提供更强大的生产级智能体工作流(agent workflow)构建能力。
- SGLang Model Gateway 0.2发布,提供企业级AI编排方案Oracle和SGLang团队联合推出了SGLang Model Gateway 0.2。它是一个企业级的AI编排和推理网关,用于解决多模型统一管理和调度的难题,支持多模型推理和灵活部署,是构建AI原生应用的利器。
- 谷歌开源Gemini CLI扩展框架谷歌开源了其Gemini CLI扩展框架。该框架通过被称为“剧本”的机制,让AI能夠方便地与外部工具和服务进行交互,旨在构建一个更加开放的AI开发生态系统。
- 开源神器解决Claude Code配置难题针对Claude Code强大的功能但配置复杂的问题,一个名为Claude Code Templates的开源项目应运而生。它提供超过100个模板,通过简单的命令和可视化操作,几分钟就能完成复杂的编程环境配置。
行业资讯
- Meta AI部门裁员,田渊栋被裁引发“抢人大战”Meta在其AI部门裁员约600人,知名华人AI科学家田渊栋的团队也在其中。此事暴露了Meta内部可能的混乱,但被裁人才迅速成为姚顺雨、xAI等多个团队争抢的对象,凸显了顶尖AI人才的稀缺性。
- 提示工程大神Riley Goodside加入谷歌DeepMind曾因与ChatGPT聊天而年入百万的提示工程(Prompt Engineering)大牛Riley Goodside,已正式入职谷歌DeepMind。他认为,提示工程是站在技术前沿的关键技能,值得被认真对待。
- 00后闵宇恒带领具身智能团队完成亿元级融资00后创业者闵宇恒在本科毕业仅一年后,便带领其具身智能创业公司“零次方”完成了亿元级融资。他认为具身智能是历史性的浪潮,其团队专注于具身空间清洁领域,目标是实现商业闭环。
- IDC报告:亚太区AI应用全球化势不可挡根据IDC的最新报告,亚太地区的AI应用增长迅速,产业已进入规模化落地阶段。推理需求的激增正在重塑市场格局,为中国企业出海带来了巨大的机遇。
- 5个大疆前员工创业,拓竹科技引爆3D打印热潮由5位大疆前员工创办的拓竹科技,凭借其出色的X1产品和MakerWorld平台,成为3D打印领域的新黑马。本轮3D打印热潮得益于性价比提升、新消费需求以及AI降低建模门槛等多重因素。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END





















暂无评论内容