1023-AI速览|万元人形机器人Bumi问世 | 谷歌实现量子优势 | Claude桌面版更新 | LangChain融资打造智能体平台 | 3D生成与图像编辑成AI新焦点

关注AI智能体工具和资讯,跟踪大模型和AI产品发展。

🪐温馨提示:不是所有的都要看 ,挑感兴趣用得上的看,每个人的口味和需求不一样。


AI大模型动态

  1. 百川推出循证增强大模型,医学幻觉率降低3倍百川智能发布了专为医疗领域设计的循证增强大模型。据称,该模型在处理医学问题时产生“幻觉”(即瞎说)的概率比同类模型低3倍,并在全球多项医学考试中取得了优异成绩。
  2. Qwen推出Qwen3-VL系列新模型,提升GPU内存性能阿里通义千问发布了Qwen3-VL-2B和Qwen3-VL-32B两款新的多模态模型。它们通过高密度处理器技术,极大地提升了GPU内存使用效率,让小显存也能跑大模型。
  3. 字节跳动用LLaVA+SAM-2实现SAM-3,无需位置标注字节跳动团队通过结合LLaVA和SAM-2模型,抢先实现了SAM-3(分割一切模型3)的效果。这项技术利用概念分割,不再需要精确的位置标注,简化了图像分割的流程。
  4. Anthropic发布专为生命科学打造的Claude模型Anthropic为生命科学领域推出了专用版Claude。这款模型基于Claude 3.5 Sonnet,在相关测试中得分甚至超过了人类专家,并且连接了专业的生物学数据库和工具,旨在加速科学研究。

    官方介绍:https://www.anthropic.com/news/claude-for-life-sciences


AI产品

  1. Claude Desktop正式版及网页版上线,多端协作更方便Anthropic正式推出了Claude的桌面应用程序和网页版。现在,你可以在电脑和手机上随时给AI分配任务,最新更新还增加了截图、共享应用窗口作为上下文以及快捷语音输入等实用功能。

    官方介绍:https://www.anthropic.com/news/claude-code-on-the-web

  2. 阿里“C计划”首秀,夸克对话助手上线阿里巴巴启动“C计划”,推出了首款产品“夸克对话助手”。它使用了最新的Qwen模型,整合了搜索和问答,目标是抢占消费级AI入口,为年轻用户提供新一代的搜索对话体验。
  3. 谷歌AI Studio更新,零基础也能搭网页应用谷歌更新了其AI Studio的Build体验。现在,使用Gemini模型搭建一个网页APP变得异常便捷,你甚至可以直接让AI随机生成一个产品需求,然后帮你实现它。

智能体 (Agent)

  1. LangChain获新一轮融资,1.0正式版上线广受欢迎的AI开发框架LangChain不仅获得了新一轮融资(估值达12.5亿美元),其LangChain和LangGraph 1.0正式版也已上线,计划打造一个更强大的智能体工程平台。
  2. DeepAnalyze:能自主完成数据分析的AI智能体中国人民大学的研究团队开源了一个名为DeepAnalyze的数据分析智能体。它能像一位AI数据分析师一样,自主完成从数据准备、分析、建模到生成报告的全套流程。

    Github:https://github.com/ruc-datalab/DeepAnalyze

  3. MrlX框架发布,可同时训练多个Agent一个新的多智能体强化学习框架MrlX发布,它能让你同时训练多个Agent模型,大大提升了多智能体系统开发的效率。

AI绘画视频音乐

  1. 松延动力推出全球首款消费级人形机器人Bumi,售价不到1万元松延动力发布了全球首款消费级人形机器人Bumi(小布米),并在京东首发,价格仅为9998元。这首次将人形机器人的价格拉入万元以内,可能将正式开启家用机器人的新时代。
  2. 字节跳动推出3D生成大模型Seed 3D 1.0字节跳动Seed团队推出了3D生成大模型Seed 3D 1.0。它可以仅根据一张图片,就快速生成包含精细几何、真实纹理的高质量3D模型,并且能无缝导入仿真引擎,用于机器人训练。

    详情入口:https://seed.bytedance.com/seed3d

  3. 豆包视频生成模型Seedance 1.0 pro上线首尾帧功能豆包视频模型Seedance 1.0 pro上线了“首尾帧”功能。用户可以指定视频的开头和结尾画面,让AI生成的视频故事性更强,主角更连贯,实现精准的叙事引导。
  4. Runway开放模型微调,可定制专属视频模型著名的AI视频工具Runway开放了模型微调功能。现在它允许特定的合作伙伴(如机器人、教育等领域)上传自己的数据,来训练和定制一个更符合行业需求的专属模型。
  5. 昆仑万维AI视频产品SkyReels将于11月初上线新版昆仑万维宣布其AI视频产品SkyReels将在11月初发布全新版本。该产品旨在推动AI视频创作的平民化,让专业级的视频创作变得更简单、更普及。

    详情入口:https://www.skyreels.ai/home

  6. Sora更新路线图,将推“角色客串”功能和安卓版OpenAI的视频模型Sora更新了其发展路线图,将推出“角色客串”功能(可以让你的宠物出现在视频里),并且安卓版本也即将上线,进一步拓宽用户基础。
  7. Vidu Q2平台全面开放API,支持生成5分钟长视频国产AI视频模型Vidu Q2全面开放了其API接口。新功能支持将视频延长至5分钟,并增加了音效选项,让AI视频从“能用”变得“好用”。

    详情入口:https://platform.vidu.cn

    图片[1]-1023-AI速览|万元人形机器人Bumi问世 | 谷歌实现量子优势 | Claude桌面版更新 | LangChain融资打造智能体平台 | 3D生成与图像编辑成AI新焦点 - 六耳AI智能体-六耳AI智能体

  8. MiniMax将推Hailuo 2.3视频模型,逼真度再升级MiniMax公司即将推出新一代AI视频模型Hailuo 2.3。据称,其在视频的逼真度、动作捕捉和面部微表情方面都有显著提升,效果甚至超越了谷歌的Veo。

AI开源项目

  1. 腾讯混元开源WorldMirror 1.1三维重建模型腾讯混元团队开源了“混元世界1.1”(WorldMirror),这是一个通用的前馈三维重建模型,可以快速、高效地将普通图像转换成3D模型。
  2. 快手推出AI编程生态,免费开放KAT-Coder-Air模型快手推出了自己的AI编程生态系统,并宣布将轻量级的KAT-Coder-Air模型免费向所有用户开放,以降低AI编程的门槛,推动AI编程产业化。

行业资讯

  1. LiblibAI完成1.3亿美元融资,创国内AI应用单笔融资纪录国内AI创作社区LiblibAI成功完成了1.3亿美元的B轮融资,这是目前国内AI应用领域最大的一笔单项投资。公司计划利用这笔资金加速其全球化布局。
  2. 百度Apollo Go与PostBus合作,在瑞士部署自动驾驶汽车百度旗下自动驾驶出行平台Apollo Go宣布与瑞士邮政巴士公司PostBus达成合作,双方将共同在瑞士部署自动驾驶汽车服务,标志着中国自动驾驶技术出海再下一城。
  3. “生成式引擎优化”(GEO)崛起,或将取代传统SEO随着消费者越来越多地使用AI聊天机器人获取信息,传统的SEO(搜索引擎优化)可能要过时了。“生成式引擎优化”(GEO)正在崛起,品牌巨头已开始调整策略以适应这一变化。
  4. OpenAI在用户自杀诉讼中要求提供追悼会名单引争议在一起用户自杀与ChatGPT相关的诉讼中,OpenAI要求原告提供追悼会的出席者名单,此举在法律界和公众中引发了巨大的伦理争议。
  5. Anthropic CEO支持特朗普AI政策,反驳批评Anthropic公司的首席执行官Dario Amodei公开表态,支持前总统特朗普的人工智能政策,并对相关批评进行了反驳,引发了科技界的关注。

技术重点研究

  1. 谷歌量子计算获双重突破,计算速度提速13000倍谷歌在量子计算上取得新突破,其Willow芯片首次实现了可验证的“量子优势”。同时,另一项“量子回声”算法发表在《自然》杂志封面,可将特定计算速度提升13000倍。
  2. ICCV 2025奖项揭晓,3D生成与图像编辑成焦点在顶级的计算机视觉会议ICCV 2025上,多项关于3D生成和图像编辑的突破性研究获奖,显示了这两个方向已成为当前AI视觉领域最前沿、最热门的研究焦点。
  3. UltraGen视频生成框架突破分辨率限制一个新的视频生成框架UltraGen,通过创新的双分支注意力架构,成功突破了低分辨率的限制,能够高效生成1080P至4K的高分辨率视频,效果优于现有方案。
  4. 兰州大学学者突破斯托克斯方程“光滑性”限制中国数学家、兰州大学的学者在世界顶尖数学期刊发表论文,成功突破了流体力学中经典的斯托克斯方程的“光滑性”限制,这是一项重大的基础理论突破。
  5. 谷歌推出免费“Google Skills”平台,开放内部AI知识谷歌推出了一个名为“Google Skills”的免费学习平台,将内部来自DeepMind、谷歌云等团队的AI知识和课程向公众开放,还提供真实环境的编程练习和就业推荐。

    详情入口:https://www.skills.google/


智能硬件

  1. Dexbotic开源其统一具身智能底座,机器人性能大幅提升机器人公司Dexbotic宣布开源其统一的具身智能底座。应用该技术后,机器人在叠盘子等精细操作上的成功率达到100%,整体性能提升了46%。
  2. 智元机器人亮相IROS 2025,全系产品实战演示在国际机器人顶会IROS 2025上,智元机器人展示了其全系列产品,并通过实战演示吸引了大量关注,展现了其在具身智能领域的技术实力。
  3. 亚马逊为送货司机推出AI眼镜为了提升物流效率和安全性,亚马逊开始为其送货司机配备专门设计的人工智能眼镜,用以辅助导航、包裹识别等任务。
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容