1022-AI速览 | OpenAI浏览器叫板谷歌 | Claude桌面版发布 | LangChain估值12.5亿 | Runway推出模型微调

关注AI工具和资讯，跟踪大模型和AI智能体产品发展。

🪐温馨提示：不是所有的都要看，挑感兴趣用得上的看，每个人的口味和需求不一样。

AI大模型动态

Qwen推出Qwen3-VL系列新模型，提升GPU内存性能阿里通义千问发布了Qwen3-VL-2B和Qwen3-VL-32B两款新的多模态模型。它们通过高密度处理器技术，极大地提升了GPU内存使用效率，让小显存也能跑大模型。
字节跳动用LLaVA+SAM-2实现SAM-3，无需位置标注字节跳动团队通过结合LLaVA和SAM-2模型，抢先实现了SAM-3（分割一切模型3）的效果。这项技术利用概念分割，不再需要精确的位置标注，简化了图像分割的流程。
智谱推出GLM Coding Plan企业版，赋能编程开发智谱AI发布了专为企业设计的GLM Coding Plan。该工具利用强大的智能体（Agentic Coding）能力，旨在为各行各业提供更高效、更智能的编程解决方案。
Anthropic发布专为生命科学打造的Claude模型Anthropic为生命科学领域推出了专用版Claude。这款模型基于Claude 3.5 Sonnet，在相关测试中得分甚至超过了人类专家，并且连接了专业的生物学数据库和工具，旨在加速科学研究。
链接：https://www.anthropic.com/news/claude-for-life-sciences
Anthropic创始人就AI领导地位发表声明Anthropic公司的CEO Dario Amodei发表公开声明，重申了公司致力于维护美国在人工智能领域领导地位的承诺，强调了安全和负责任地发展AI的重要性。
AI之争的终局可能是新型核电之争？行业内出现一种观点，认为未来人工智能竞赛的胜负手，将取决于谁能掌握更强大、更稳定的能源供应。这使得新型核电技术成为科技巨头们关注的焦点。

AI产品

OpenAI开发“ChatGPT Atlas”浏览器，直接叫板谷歌据报道，OpenAI正在秘密开发一款名为“ChatGPT Atlas”的浏览器。此举被认为是OpenAI跳出纯粹的模型服务，直接进入应用层，向谷歌的浏览器和搜索霸主地位发起挑战。
Claude Code网页版上线，手机也能写代码了Anthropic公司发布了Claude Code的网页版和手机APP。现在你可以通过浏览器或手机给AI分配编程任务，它还能同时处理多个任务。该功能需付费使用。
链接：https://www.anthropic.com/news/claude-code-on-the-web
Claude Desktop正式发布，截图就能当上下文Anthropic正式推出了Claude的桌面应用程序。用户可以方便地截图、分享当前窗口作为对话的上下文，甚至可以设置按下大写锁定键（Caps Lock）来快速和Claude对话。
Qwen Deep Research重大升级，能帮你创建网页和播客通义千问的深度研究功能迎来升级。现在它不仅能做深度信息研究，还可以根据研究结果直接生成网页内容和播客音频，让信息产出更方便。
Oculus创始人旗下AI公司Sesame融资2.5亿美元虚拟现实设备Oculus的创始人创办的对话式AI初创公司Sesame，宣布完成2.5亿美元的巨额融资，并同步推出了其产品的Beta测试版，正式入局AI对话市场。

AI绘画视频音乐

Runway推出模型微调功能，可定制专属模型著名的AI视频生成工具Runway ML上线了模型微调功能。这意味着用户可以上传自己的特定数据（如特定风格的图片），来训练和定制一个更符合自己创作需求的专属模型。
Vidu发布Q2参考视频模型，可延长视频至5分钟国产AI视频模型Vidu发布了其Q2参考模型。该模型的一个亮点是可以将任意视频片段进行自然延长，最长可以生成长达5分钟的视频内容。
ElevenLabs语音隔离器支持视频，随时随地录音棚音质知名的AI语音公司ElevenLabs对其语音隔离工具进行了升级。现在该工具可以直接处理视频文件，分离并优化其中的人声，让你的视频无论在哪录制，都能拥有录音棚级别的清晰音频。
OpenAI因Sora 2生成名人肖像而加强安全措施在AI视频模型Sora 2生成的视频中，出现了未经授权的著名演员布莱恩·克兰斯顿的肖像后，引发了巨大争议。为此，OpenAI紧急加强了其安全措施，以防止类似滥用事件再次发生。

AI开源项目

DeepAnalyze：能自主完成数据分析的AI智能体中国人民大学的研究团队开源了一个名为DeepAnalyze的数据分析智能体。它能像一位AI数据分析师一样，自主完成从数据准备、分析、建模到生成报告的全套流程。
链接：https://github.com/ruc-datalab/DeepAnalyze
BLIP3o-NEXT开源，统一图文生成与编辑一个新的开源模型BLIP3o-NEXT发布，它巧妙地融合了自回归和扩散两种技术架构。这个模型可以统一处理图像生成和图像编辑任务，实现更高质量的图像创作。
Hugging Face官方推出免费机器人课程著名的AI社区Hugging Face发布了一套完全免费的机器人技术课程。课程内容覆盖从入门基础到动手实践，为想学习机器人技术的开发者提供了一个完整的学习体系。

行业资讯

LangChain获新一轮融资，估值达12.5亿美元广受欢迎的AI开发框架LangChain宣布获得新一轮融资，公司估值达到了12.5亿美元。他们计划利用这笔资金，将LangChain打造成一个更强大的智能体（Agent）工程平台。
欧洲AI新星Nexos.ai融资3000万欧元一家名为Nexos.ai的欧洲人工智能初创公司，成功完成了3000万欧元的融资。他们的目标是提供解决方案，帮助更多欧洲企业顺利地应用和部署人工智能技术。
中文精确指令遵循测评SuperCLUE-CPIF结果发布最新的SuperCLUE-CPIF中文大模型评测榜单发布。该榜单专注于评估大模型对中文精确、复杂指令的理解和执行能力，为我们选择和使用中文AI模型提供了重要参考。
YouTube正式推出相似度检测技术YouTube官方宣布，其内容相似度检测技术已全面上线。这项技术用于识别和标记平台上的相似内容，旨在帮助创作者保护原创，并为观众提供更多样化的内容。

技术重点研究

TokenFlow：让大模型高并发下延迟暴降80%一项名为TokenFlow的技术研究，提出了一种新的大模型推理系统方案。通过“抢占式调度+写通缓存”的策略，它可以在高并发请求下，将模型的P99延迟（99%请求的响应时间）降低80%之多。
VISTA：能自动优化提示词提升视频质量的智能体系统研究人员开发了一个名为VISTA的多智能体系统。该系统可以通过迭代的方式，自动优化和改进用于视频生成的提示词（prompt），从而让AI生成的视频更精准地匹配用户的真实意图。
Nano3D：无需训练即可实现精准3D编辑一项名为Nano3D的新技术，实现了在不进行额外模型训练的情况下，对3D模型进行精准编辑。该技术能很好地保持模型原有的结构一致性，同时研究团队还发布了首个包含10万个样本的3D编辑数据集。

AI硬件动态

“最美产品经理”宋紫薇创业，首款AI硬件产品曝光前手机行业知名产品经理宋紫薇，在离职后投身AI硬件创业。近期，她创办的公司以及其首款AI硬件产品的设计图被媒体曝光，引发了科技圈的广泛关注。
IROS 2024：宇树、禾赛等机器人公司展示最新成果在全球顶级的机器人会议IROS上，中国的宇树科技（Unitree）、禾赛科技（Hesai）等公司与国际巨头同台竞技。美团公司也在会上展示了其在机器人领域的布局和研究成果，展现了中国在具身智能领域的实力。
具身智能学界业界思想惊人统一在IROS会议上，来自学术界和工业界的专家们，对具身智能的未来发展方向表现出了高度一致的看法。这预示着理论研究和产业应用将更紧密地结合，加速推动实体机器人的发展。

文章版权归作者所有，未经允许请勿转载。

THE END