1107-AI日报-Kimi K2思考模型发布 | AI提示词首案宣判 | 宇树科技分身机器人

关注AI智能体工具和资讯,跟踪大模型和AI智能体产品发展。

聚焦Kimi新模型、AI法律前沿、AIGC应用及智能硬件等最新动态。


🔥 Big News

  1. 月之暗面发布Kimi K2 Thinking模型,智能体能力再突破 月之暗面发布了其最新的思考模型Kimi K2 Thinking。该模型在智能体(Agent)和推理能力上实现重大提升,能自主进行多轮工具调用和深度思考,无需用户干预,标志着AI向更高级的自主适应能力迈进。 模型:https://huggingface.co/moonshotai/Kimi-K2-Thinking

640-1

 

 

  1. 上海首例涉AI提示词著作权案宣判:提示词不具独创性 国内首例涉及AI提示词(Prompt)的著作权案在上海黄浦区法院一审宣判。法院认为,涉案的提示词在表达上较为有限,缺乏独创性,因此原告不享有著作权。此判决对AI生成内容的版权界定具有重要参考意义。
  2. 谷歌发布Gemini API文件搜索工具,简化私有RAG集成 谷歌为Gemini API推出了一个名为“文件搜索”的工具。这是一个完全托管的RAG(检索增强生成)系统,能自动处理文件上传、索引和检索,开发者无需自建向量数据库即可轻松构建基于私有知识库的应用。 链接:https://blog.google/technology/developers/file-search-gemini-api/

🚀 大模型与技术

  1. 中文图像编辑新王!UniWorld-V2发布,性能碾压GPT-Image 兔展联合北大发布了UniWorld-V2图像编辑模型。该模型能精准理解中文指令,实现“框选即改”,并能精准渲染复杂的中文字体和光影效果,在多个测试基准上得分远超GPT-Image和Gemini等模型。 论文:https://arxiv.org/abs/2510.16888
  2. 全球首个AI海洋大模型“瞰海”发布,预测精准到600米深 我国自主研发的全球首个端到端AI海洋大模型“瞰海”正式发布。该模型能实时重构海况,并精准预演未来10天内深至600米的海洋环境变化,为海洋科研和防灾减灾提供了强大工具。
  3. 谷歌发布AI文件检测工具Magika 1.0,全面采用Rust重构 谷歌发布了AI文件类型检测工具Magika的1.0稳定版。新版本核心引擎使用Rust语言重构,性能和安全性大幅提升,并能识别超过200种文件格式,开发者集成也更加简便。

🤖 智能体与机器人

  1. 现实版“铁甲钢拳”!宇树科技推出“Embodied Avatar”分身机器人 宇树科技(Unitree)推出了“Embodied Avatar”系统。该系统通过高精度动作捕捉和5G技术,让用户能以极低的延迟远程操控人形机器人,仿佛拥有了“机器人分身”,在工业、医疗等领域有广阔应用前景。

🎨 AIGC应用

  1. Sora安卓版首日下载量达47万次,表现强劲 OpenAI的视频生成应用Sora在安卓平台上线后表现火爆,首日下载量就达到了47万次。相比之下,其在iOS平台因地区和邀请制限制,下载量相对较少。
  2. 阶跃星辰开源Step-Audio-EditX音频编辑模型 阶跃星辰开源了一款名为Step-Audio-EditX的音频编辑模型。该模型支持迭代式生成和编辑,用户可以先生成音频,然后再精细修改其情感和语气。 模型:https://huggingface.co/stepfun-ai/Step-Audio-EditX 在线体验:https://huggingface.co/spaces/stepfun-ai/Step-Audio-EditX
  3. Hume AI上线人声转换功能,保留节奏音调 情感智能AI公司Hume AI上线了新的人声转换功能。它可以将一段话的声音换成其他人的音色,同时完整保留原始说话的节奏和音调。
  4. Grok上线文字直接生成视频功能 xAI旗下的大模型Grok上线了文生视频功能。用户可以直接通过文字描述生成视频,无需先生成图片再转视频,简化了创作工作流

🌐 行业资讯

  1. NotebookLM手机端上线闪卡和测验功能 谷歌的AI笔记工具NotebookLM在手机端增加了“闪卡”和“测验”功能。这两个实用的功能可以将你的笔记内容自动生成问答卡片和测试题,帮助用户更好地学习和记忆。
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容