ai快报
-
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
计算机视觉领域的大部分下游任务都是从二维图像理解(特征提取)开始的。 在特征提取、语义理解、图像分割等 CV 基本任务中的模型三幻神分别是 SAM、CLIP 和 DINO,分别代表…
-
会记住你说的每句话:谷歌 AI Gemini App 上线记忆功能
8 月 14 日消息,据科技媒体 9To5Google 今天报道,谷歌 Gemini AI 助手 App 版现已支持“记忆”与“临时聊天”功能。 两个功能的具体介绍如下: 一、“记…
-
消费级显卡就能跑的世界模型来了,腾讯混元3D世界模型推出Lite版本
官网地址:https://3d.hunyuan.tencent.com/sceneTo3D Github 项目地址:https://github.com/Tencent-Hunyu…
-
Day5/5:Mureka V7.5模型上线,AI音乐创作水平再迎新高度
8月11日,昆仑万维SkyWork AI技术发布周正式启动。8月11日至8月15日,我们每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。 截至目前,我们已经发布Sk…
-
Day4/5:Skywork Deep Research Agent重磅升级!带来更多模态、更高质量和更高效的体验
8月14日,昆仑万维正式发布Skywork Deep Research Agent v2,它是天工超级智能体(Skywork Super Agents)的核心引擎。 Skywork…
-
混元最新开源:一张图,秒变游戏大片
有没有想过,随手拍的一张风景照,下一秒就能变成可操控的游戏开放世界? 或者把脑海里的奇思妙想或世界名画,直接变成电影级游戏动画? 现在,腾讯混元开源的新工具Hunyuan-Game…
-
OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归
8 月 13 日消息,OpenAI CEO 萨姆・奥尔特曼(Sam Altman)宣布对 ChatGPT 进行重大更新。此次更新为 GPT-5 引入了用户可以选择的不同模式,包括…
-
Claude 4 – Anthropic推出的最新AI编程系列模型
Claude 4是什么 Claude 4 是 Anthropic 公司推出的新一代 AI 模型,包括 Claude Opus 4 和 Claude Sonnet 4。Opus 4 …
-
Day3/5:「Skywork UniPic 2.0」开源,统一多模态模型再迎新突破
8月11日,昆仑万维SkyWork AI技术发布周正式启动。8月11日至8月15日,我们每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。截至目前,我们已经发布Sky…
-
全球多模态推理新标杆,GLM-4.5V正式上线并开源
多模态推理被视为通向通用人工智能(AGI)的关键能力之一,让 AI 能够像人类一样综合感知、理解与决策。其中,视觉-语言模型(Vision-Language Model, VLM)…