炸！刚刚小红书开源了首个多模态大模型dots.vlm1，性能直追SOTA！

feiniu • 2025年8月7日下午9:16 • ai快报 • 阅读 267

小红书的人文智能实验室（hi lab）近日宣布开源了其最新的多模态大模型dots.vlm1。这款模型建立在DeepSeek V3的基础上，并配备了小红书自研的12亿参数视觉编码器NaViT，展现出强大的多模态理解与推理能力。

据hi lab介绍，dots.vlm1在多个视觉评测集上的表现已经接近当前领先的模型，如Gemini 2.5 Pro和Seed-VL1.5 thinking。特别是在MMMU、MathVision、OCR Reasoning等基准测试中，dots.vlm1显示出卓越的图文理解与推理能力。它能理解复杂的图文交错图表，解析表情包背后的含义，分析产品配料表差异，并能准确判断博物馆中文物和画作的名称及背景信息。

dots.vlm1由三个核心组件构成：一个12亿参数的NaViT视觉编码器、一个轻量级的MLP适配器，以及DeepSeek V3 MoE大语言模型。其训练过程经历了三个阶段，包括视觉编码器预训练、VLM预训练和VLM后训练。在视觉编码器预训练阶段，NaViT编码器通过大量图文对和纯图像数据进行训练，以增强对多样视觉数据的感知能力。在VLM预训练阶段，视觉编码器与DeepSeek V3联合训练，使用大规模、多样化的多模态数据集。最后，在VLM后训练阶段，通过有监督微调增强模型的泛化能力。

这个由3.5亿月活平台孵化的模型，实测表现直逼谷歌Gemini 2.5 Pro（当前最强闭源模型），总的来说可以：

✅ 看穿色盲测试图（人类都容易翻车！）

✅ 10秒解高考数学题（带完整推理过程）

✅ 破解地狱级数独（强行修正错误还喊“Yes！”）

✅ 一句话写李白诗风（输出惊艳古诗震撼全网）

原创文章，作者：feiniu，如若转载，请注明出处：https://www.lrblog.cn/312.html

赞 (0)

关于作者

feiniu

OpenAI证实ChatGPT周活跃用户数7亿，同比增4倍

上一篇 2025年8月6日上午8:55

代码画布上线！「动嘴开发」的时代到了

下一篇 2025年8月7日下午9:17

碰一碰nfc扫码发视频是什么如何代理加盟费用多少讲解

【广告】成都飞牛互动科技有限公司专注为商家提供团购、小店类目入驻、报白、挂靠服务，提供小程序制作，软件销售，需关注公众号：飞牛互动科技，咨询电话：19108022821（微信同号…

ai快报 2025年12月19日
7800
Gemini 2.5 Deep Think – 谷歌推出的AI推理模型

Gemini 2.5 Deep Think是什么 Gemini 2.5 Deep Think 是谷歌推出的 AI 模型，专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞…

ai快报 2025年8月4日
27100
开源SOTA：阶跃发布端到端语音大模型Step-Audio 2 mini！

大家好，今天阶跃星辰正式发布最强开源端到端语音大模型 Step-Audio 2 mini，该模型在多个国际基准测试集上取得 SOTA 成绩。它将语音理解、音频推理与生成统一建模，…

ai快报 2025年9月2日
36400
快如闪电，「甜品级」Qwen3-Coder-Flash来咯

Qwen3-Coder拥有很多尺寸，今天，我们很高兴推出开发者呼唤颇久的「甜品级」编程模型Qwen3-Coder-Flash ！快如闪电的新编程模型全称为 Qwen3-Coder…

ai快报 2025年8月1日
15100
苹果微多美(官网下载更新地址激活授权码卡密独角兽同款)

苹果微多美一码双开，稳定流畅 TF24H全天稳定下载主程序最新8.0.29版本完美兼容最新16系统好友相册转发按钮支持iPad扫码登录百款功能诚邀品鉴微多美官网： h…

ai快报 2025年8月21日
21100
抖音来客上架团购流程是什么？上架团购看不到商品怎么回事？

【广告】成都飞牛互动科技有限公司专注为商家提供团购、小店类目入驻、报白、挂靠服务，提供小程序制作，软件销售，需关注公众号：飞牛互动科技，咨询电话：19108022821（微信同号…

ai快报 2025年12月23日
7000
Qwen3-Coder – 阿里通义千问推出的代码生成模型

Qwen3-Coder是什么 Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型，拥有 480B 参数和 35B 激活参数，支持原生 256K token 上下文，支…

ai快报 2025年7月28日
24100
微信小店虚拟商品上传类目怎么选需要哪些资料icp和产品说明书填写

【广告】成都飞牛互动科技有限公司专注为商家提供团购、小店类目入驻、报白、挂靠服务，提供小程序制作，软件销售。需关注公众号：飞牛互动科技，咨询电话：19108022821（微信同号…

ai快报 2026年3月4日
1500
通义千问推出Qwen-Flash，全员拥抱1 M上下文！

API大更新✨！Qwen-Flash 也来了，全员拥抱1 M上下文！今天，Qwen 的 API 上新了！快如闪电的 Qwen-Flash 、Qwen3-Coder-Flash首次…

ai快报 2025年8月8日
22200
AI绘画是一种新型艺术形式

人工智能（AI）绘画在当下发展得如火如荼，也成为学术圈的热议话题。AI绘画给艺术带来了怎样的机遇和挑战，它又能否被称作艺术品呢？在往期的《学术争鸣》中，专家学者们对此进行了探讨。本…

ai快报 2025年6月10日
63200