1023-AI速览|万元人形机器人Bumi问世 | 谷歌实现量子优势 | Claude桌面版更新 | LangChain融资打造智能体平台

关注AI智能体工具和资讯，跟踪大模型和AI产品发展。

🪐温馨提示：不是所有的都要看，挑感兴趣用得上的看，每个人的口味和需求不一样。

AI大模型动态

百川推出循证增强大模型，医学幻觉率降低3倍百川智能发布了专为医疗领域设计的循证增强大模型。据称，该模型在处理医学问题时产生“幻觉”（即瞎说）的概率比同类模型低3倍，并在全球多项医学考试中取得了优异成绩。
Qwen推出Qwen3-VL系列新模型，提升GPU内存性能阿里通义千问发布了Qwen3-VL-2B和Qwen3-VL-32B两款新的多模态模型。它们通过高密度处理器技术，极大地提升了GPU内存使用效率，让小显存也能跑大模型。
字节跳动用LLaVA+SAM-2实现SAM-3，无需位置标注字节跳动团队通过结合LLaVA和SAM-2模型，抢先实现了SAM-3（分割一切模型3）的效果。这项技术利用概念分割，不再需要精确的位置标注，简化了图像分割的流程。
Anthropic发布专为生命科学打造的Claude模型Anthropic为生命科学领域推出了专用版Claude。这款模型基于Claude 3.5 Sonnet，在相关测试中得分甚至超过了人类专家，并且连接了专业的生物学数据库和工具，旨在加速科学研究。
官方介绍：https://www.anthropic.com/news/claude-for-life-sciences

AI产品

Claude Desktop正式版及网页版上线，多端协作更方便Anthropic正式推出了Claude的桌面应用程序和网页版。现在，你可以在电脑和手机上随时给AI分配任务，最新更新还增加了截图、共享应用窗口作为上下文以及快捷语音输入等实用功能。
官方介绍：https://www.anthropic.com/news/claude-code-on-the-web
阿里“C计划”首秀，夸克对话助手上线阿里巴巴启动“C计划”，推出了首款产品“夸克对话助手”。它使用了最新的Qwen模型，整合了搜索和问答，目标是抢占消费级AI入口，为年轻用户提供新一代的搜索对话体验。
谷歌AI Studio更新，零基础也能搭网页应用谷歌更新了其AI Studio的Build体验。现在，使用Gemini模型搭建一个网页APP变得异常便捷，你甚至可以直接让AI随机生成一个产品需求，然后帮你实现它。

智能体 (Agent)

LangChain获新一轮融资，1.0正式版上线广受欢迎的AI开发框架LangChain不仅获得了新一轮融资（估值达12.5亿美元），其LangChain和LangGraph 1.0正式版也已上线，计划打造一个更强大的智能体工程平台。
DeepAnalyze：能自主完成数据分析的AI智能体中国人民大学的研究团队开源了一个名为DeepAnalyze的数据分析智能体。它能像一位AI数据分析师一样，自主完成从数据准备、分析、建模到生成报告的全套流程。
Github：https://github.com/ruc-datalab/DeepAnalyze
MrlX框架发布，可同时训练多个Agent一个新的多智能体强化学习框架MrlX发布，它能让你同时训练多个Agent模型，大大提升了多智能体系统开发的效率。

AI绘画视频音乐

松延动力推出全球首款消费级人形机器人Bumi，售价不到1万元松延动力发布了全球首款消费级人形机器人Bumi（小布米），并在京东首发，价格仅为9998元。这首次将人形机器人的价格拉入万元以内，可能将正式开启家用机器人的新时代。
字节跳动推出3D生成大模型Seed 3D 1.0字节跳动Seed团队推出了3D生成大模型Seed 3D 1.0。它可以仅根据一张图片，就快速生成包含精细几何、真实纹理的高质量3D模型，并且能无缝导入仿真引擎，用于机器人训练。
详情入口：https://seed.bytedance.com/seed3d
豆包视频生成模型Seedance 1.0 pro上线首尾帧功能豆包视频模型Seedance 1.0 pro上线了“首尾帧”功能。用户可以指定视频的开头和结尾画面，让AI生成的视频故事性更强，主角更连贯，实现精准的叙事引导。
Runway开放模型微调，可定制专属视频模型著名的AI视频工具Runway开放了模型微调功能。现在它允许特定的合作伙伴（如机器人、教育等领域）上传自己的数据，来训练和定制一个更符合行业需求的专属模型。
昆仑万维AI视频产品SkyReels将于11月初上线新版昆仑万维宣布其AI视频产品SkyReels将在11月初发布全新版本。该产品旨在推动AI视频创作的平民化，让专业级的视频创作变得更简单、更普及。
详情入口：https://www.skyreels.ai/home
Sora更新路线图，将推“角色客串”功能和安卓版OpenAI的视频模型Sora更新了其发展路线图，将推出“角色客串”功能（可以让你的宠物出现在视频里），并且安卓版本也即将上线，进一步拓宽用户基础。
Vidu Q2平台全面开放API，支持生成5分钟长视频国产AI视频模型Vidu Q2全面开放了其API接口。新功能支持将视频延长至5分钟，并增加了音效选项，让AI视频从“能用”变得“好用”。
详情入口：https://platform.vidu.cn
MiniMax将推Hailuo 2.3视频模型，逼真度再升级MiniMax公司即将推出新一代AI视频模型Hailuo 2.3。据称，其在视频的逼真度、动作捕捉和面部微表情方面都有显著提升，效果甚至超越了谷歌的Veo。

AI开源项目

腾讯混元开源WorldMirror 1.1三维重建模型腾讯混元团队开源了“混元世界1.1”（WorldMirror），这是一个通用的前馈三维重建模型，可以快速、高效地将普通图像转换成3D模型。
快手推出AI编程生态，免费开放KAT-Coder-Air模型快手推出了自己的AI编程生态系统，并宣布将轻量级的KAT-Coder-Air模型免费向所有用户开放，以降低AI编程的门槛，推动AI编程产业化。

行业资讯

LiblibAI完成1.3亿美元融资，创国内AI应用单笔融资纪录国内AI创作社区LiblibAI成功完成了1.3亿美元的B轮融资，这是目前国内AI应用领域最大的一笔单项投资。公司计划利用这笔资金加速其全球化布局。
百度Apollo Go与PostBus合作，在瑞士部署自动驾驶汽车百度旗下自动驾驶出行平台Apollo Go宣布与瑞士邮政巴士公司PostBus达成合作，双方将共同在瑞士部署自动驾驶汽车服务，标志着中国自动驾驶技术出海再下一城。
“生成式引擎优化”（GEO）崛起，或将取代传统SEO随着消费者越来越多地使用AI聊天机器人获取信息，传统的SEO（搜索引擎优化）可能要过时了。“生成式引擎优化”（GEO）正在崛起，品牌巨头已开始调整策略以适应这一变化。
OpenAI在用户自杀诉讼中要求提供追悼会名单引争议在一起用户自杀与ChatGPT相关的诉讼中，OpenAI要求原告提供追悼会的出席者名单，此举在法律界和公众中引发了巨大的伦理争议。
Anthropic CEO支持特朗普AI政策，反驳批评Anthropic公司的首席执行官Dario Amodei公开表态，支持前总统特朗普的人工智能政策，并对相关批评进行了反驳，引发了科技界的关注。

技术重点研究

谷歌量子计算获双重突破，计算速度提速13000倍谷歌在量子计算上取得新突破，其Willow芯片首次实现了可验证的“量子优势”。同时，另一项“量子回声”算法发表在《自然》杂志封面，可将特定计算速度提升13000倍。
ICCV 2025奖项揭晓，3D生成与图像编辑成焦点在顶级的计算机视觉会议ICCV 2025上，多项关于3D生成和图像编辑的突破性研究获奖，显示了这两个方向已成为当前AI视觉领域最前沿、最热门的研究焦点。
UltraGen视频生成框架突破分辨率限制一个新的视频生成框架UltraGen，通过创新的双分支注意力架构，成功突破了低分辨率的限制，能够高效生成1080P至4K的高分辨率视频，效果优于现有方案。
兰州大学学者突破斯托克斯方程“光滑性”限制中国数学家、兰州大学的学者在世界顶尖数学期刊发表论文，成功突破了流体力学中经典的斯托克斯方程的“光滑性”限制，这是一项重大的基础理论突破。
谷歌推出免费“Google Skills”平台，开放内部AI知识谷歌推出了一个名为“Google Skills”的免费学习平台，将内部来自DeepMind、谷歌云等团队的AI知识和课程向公众开放，还提供真实环境的编程练习和就业推荐。
详情入口：https://www.skills.google/

智能硬件

Dexbotic开源其统一具身智能底座，机器人性能大幅提升机器人公司Dexbotic宣布开源其统一的具身智能底座。应用该技术后，机器人在叠盘子等精细操作上的成功率达到100%，整体性能提升了46%。
智元机器人亮相IROS 2025，全系产品实战演示在国际机器人顶会IROS 2025上，智元机器人展示了其全系列产品，并通过实战演示吸引了大量关注，展现了其在具身智能领域的技术实力。
亚马逊为送货司机推出AI眼镜为了提升物流效率和安全性，亚马逊开始为其送货司机配备专门设计的人工智能眼镜，用以辅助导航、包裹识别等任务。

文章版权归作者所有，未经允许请勿转载。

THE END