GPT-5 – OpenAI推出的最新最强AI模型

GPT-5是什么

GPT-5 是 OpenAI 最新推出的人工智能模型,是目前最强模型,面向所有用户开放。GPT-5是一个统一系统,包括一个基础模型用在解答常见问题,一个深度推理模型(GPT-5 思维模块)用在处理复杂难题,一个实时路由模块根据对话类型、问题复杂度、工具需求和用户指令(如“仔细思考”)智能调度模型。GPT-5 在编程、写作、数学、健康等多个领域表现出色,大幅减少幻觉和错误,回答更贴近真实情况。GPT-5 支持多模态输入,能处理图像和文本。GPT-5 提供免费、Plus 和 Pro 三种模式,满足不同用户的需求。

GPT-5

GPT-5的主要功能

  • 高效回答与推理:支持根据问题复杂度自动切换基础模型和深度推理模型,快速回答常见问题或深入思考复杂问题。
  • 编程能力:GPT-5 是 OpenAI 最强的编程模型,能生成高质量代码、调试大型代码库,在生产级任务中表现出色。
  • 写作与创意表达:能将粗糙想法转化为有文学深度和节奏感的精彩写作,支持多种文体并提供创意灵感。
  • 健康咨询:在健康相关问题上表现更好,能够提供精准建议,主动提示潜在问题,并确保回答安全可靠。
  • 多模态理解:支持图像和视频输入,能进行视觉推理和空间分析,处理多模态任务。
  • 减少幻觉与提高准确性:显著降低幻觉率,减少事实性错误,回答更准确且更诚实。
  • 安全与可靠性:引入“安全完成”训练方法,减少欺骗行为,确保在生物和化学等高风险领域的安全性。
  • 定制化与个性化:提供四种预设性格(愤世嫉俗者、机器人、倾听者和书呆子),用户根据需求选择互动风格。
  • 多语言支持:支持多种语言对话,能够理解和生成多种语言内容,帮助用户进行语言转换。
  • API 支持:GPT-5 通过 API 提供多种模型选择(如 GPT-5、GPT-5 mini、GPT-5 nano),灵活定价,方便开发者使用。

GPT-5的版本信息

  • GPT-5:默认版本,适用大多数通用任务,能根据问题复杂度自动切换基础模型和深度推理模式。
  • GPT-5 Mini:一个更小、更快的版本,适用轻量级任务或在达到使用限制后继续使用。
  • GPT-5 Nano:最小版本,专为开发者设计,适合快速原型设计和高效处理轻量级任务。
  • GPT-5 Pro:高级版本,专为 Pro 订阅者提供,使用更强大的计算资源,适用复杂任务和深度推理。

GPT-5的性能表现

  • 编程与工具链能力
    • SWE-bench Verified:74.9%(GPT-4:52%,o3:69.1%)
    • Aider Polyglot:88%,错误率比 o3 低 33%
    • 前端开发:内部测试胜率 70%
    • τ²-bench 工具链任务:96.7%
  • 数学与多模态能力
    • AIME 2025 数学测评:Pro+Python 模式 100%
    • MMMU 多模态理解:84.2%
  • 专业领域
    • HealthBench Hard(医疗):46.2%
  • 知识准确性与可靠性
    • 错误率比 GPT-4o 低约 45%
    • thinking 模式比 o3 低约 80%
    • 幻觉率仅为 o3 的 1/6
    • 欺骗率 2.1%(o3 为 4.8%)
  • 人机交互与风格
    • 谄媚倾向(sycophancy)降至 6%(GPT-4 为 14.5%)

GPT-5

GPT-5的官网地址

如何使用GPT-5

  • 访问官网:访问GPT-5的官网ChatGPT。
  • 免费用户
    • 访问方式:GPT-5 已全局上线,免费用户能直接在 ChatGPT 中使用。
    • 限制:免费用户的 GPT-5 用量会明显受限。当用量耗尽后,模型会被切换成 GPT-5 mini。
  • Plus 用户:Plus 用户有更高的 GPT-5 使用额度。
    • 额外功能:Plus 用户能在 Codex CLI 中使用 GPT-5,开启“思考模式”。
  • Pro 用户:Pro 用户能无限制访问 GPT-5,可使用 GPT-5 Pro。
    • 功能:Pro 用户能访问所有 GPT-5 的功能,包括高级的编程和创作工具。
  • 企业版和教育版用户:企业版和教育版用户将在一周内获得访问权限。
  • 在 API 中使用 GPT-5
    • API 调用方法
      • 支持的模型:API 中支持的 GPT-5 模型包括 gpt-5、gpt-5-mini、gpt-5-nano 和 gpt-5-chat。
      • 输入输出:支持用图文输入,并用文字输出。
      • Endpoint:支持 /chat/completions、/responses 和 /assistants 等 endpoint。
    • 功能支持
      • Streaming:支持流式输出。
      • Function calling:支持函数调用。
      • Structured outputs:支持结构化输出。
      • 微调:支持模型微调。
      • Responses API:支持 Web search、File search、Code interpreter 和 MCP 等功能。

GPT-5 的产品定价

  • 免费用户:所有用户都能免费使用 GPT-5,但有使用次数限制。
  • Plus 用户:$20 美元/月,获得更高的使用额度,适合日常频繁使用。
  • Pro 用户:$200 美元/月,获得无限访问权限,能使用 GPT-5 Pro 版本。
  • API 定价
    • GPT-5:每百万输入 token 1.25 美元,输出 10 美元。
    • GPT-5 Mini:每百万输入 token 0.25 美元,输出 2 美元。
    • GPT-5 Nano:每百万输入 token 0.05 美元,输出 0.40 美元。

GPT-5

GPT-5的应用场景

  • 编程开发:生成高质量代码、调试大型代码库,并在生产级任务中表现出色,适合软件开发、前端设计和复杂系统开发。
  • 写作创作:GPT-5 能将粗糙想法转化为有文学深度和节奏感的精彩写作,支持多种文体,适合撰写文章、报告、诗歌和创意写作。
  • 健康咨询:提供精准建议,主动提示潜在问题,并确保回答安全可靠,适合健康咨询和医学科普。
  • 多模态任务:进行视觉推理和空间分析,适合处理图表解读、照片总结和多模态任务。
  • 复杂问题解决:处理复杂的科学问题、数学难题和多步骤任务,适合科学研究、高级教育和专业咨询。

GPT-5的官方示例

滚动球小游戏

Prompt:Create a single-page app in a single HTML file with the following requirements:

  • Name: Jumping Ball Runner
  • Goal: Jump over obstacles to survive as long as possible.
  • Features: Increasing speed, high score tracking, retry button, and funny sounds for actions and events.
  • The UI should be colorful, with parallax scrolling backgrounds.
  • The characters should look cartoonish and be fun to watch.
  • The game should be enjoyable for everyone.

(中文)提示词:创建一个单页面应用,仅使用一个 HTML 文件,满足以下要求:

  • 游戏名称:跳跃球跑酷
  • 游戏目标:跳跃躲避障碍物,尽可能存活更长时间。
  • 游戏功能:速度逐渐增加、记录最高分、重试按钮、为操作和事件添加有趣的音效。
  • 用户界面:色彩丰富,带有视差滚动背景。
  • 角色设计:角色应具有卡通风格,看起来有趣。
  • 游戏体验:适合所有人游玩。

GPT-5

像素艺术

Prompt:Create a single-page app, in a single HTML file, that provides a retro pixel painting experience.

  • Canvas: fixed pixel grid with zoom; tools for pencil, eraser, fill, line, rectangle, circle; grid toggle.
  • Palette: 16-color swatches with two custom slots; eyedropper; foreground/background swap.
  • Editing: undo/redo, copy/paste selection, flip/rotate selection, clear canvas; status bar with cursor coords.
  • UI shell: faux OS window (’90s style) with draggable title bar, toolbar icons, tooltip hints.
  • Import/Export: import PNG (quantize to palette) and export PNG/SpriteSheet + JSON; save/load from localStorage.
  • Shortcuts: number keys for tools, +/- for zoom; accessible labels and focus order.
  • Responsive layout; no uploads to servers.

(中文)提示词:创建一个单页面应用,仅使用一个 HTML 文件,提供复古像素画体验:

  • 画布:固定像素网格,可缩放;提供铅笔、橡皮擦、填充、直线、矩形、圆形工具;可切换网格显示。
  • 调色板:16种颜色样本,带有两个自定义颜色槽;取色器;前景/背景颜色切换。
  • 编辑功能:撤销/重做,复制/粘贴选择区域,翻转/旋转选择区域,清除画布;状态栏显示光标坐标。
  • 用户界面:模拟 90 年代操作系统窗口风格,带有可拖动标题栏、工具栏图标、提示信息。
  • 导入/导出:导入 PNG(量化到调色板)并导出 PNG/精灵表 + JSON;从 localStorage 保存/加载。
  • 快捷键:数字键切换工具,加减键调整缩放;提供可访问的标签和焦点顺序。
  • 响应式布局;不上传至服务器。

GPT-5

gpt-oss – OpenAI开源的推理模型系列

gpt-oss是什么

gpt-oss 是 OpenAI 推出的开源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 两个版本。gpt-oss-120b 拥有1170亿参数,激活参数约51亿,能在单张 80GB GPU 上运行;gpt-oss-20b 拥有210亿参数,激活参数约36亿,能在 16GB 内存的消费级设备(如笔记本或手机)上运行。两者均基于 MoE 架构,支持 128k上下文长度,性能接近闭源的 o4-mini 和 o3-mini,在工具调用、少样本函数调用、链式思考推理及健康问答等方面表现出色。模型基于 Apache 2.0 许可证开源,支持免费商用,为开发者提供强大的本地推理能力。

gpt-oss

gpt-oss的主要功能

  • 工具调用:支持调用外部工具(如网页搜索、Python代码解释器)解决复杂问题,增强问题解决能力。
  • 链式思考:逐步分解复杂问题并逐步解决,适合多步骤推理任务。
  • 低资源需求:gpt-oss-20b 能在 16GB 内存设备上运行,适合消费级设备;gpt-oss-120b 能在 80GB GPU 上运行,适合高性能需求。
  • 快速推理:推理速度可达 40-50 tokens/s,适合需要快速响应的场景。
  • 开源权重:提供完整的模型权重和代码,支持本地微调和定制,满足特定任务需求。
  • 推理强度调节:支持低、中、高三种推理强度,能根据需求调整,平衡延迟与性能。

gpt-oss的技术原理

  • 模型架构:基于 Transformer 架构,用专家混合(MoE)技术减少处理输入所需的活跃参数数量,提高推理效率。基于交替的密集和局部带状稀疏注意力模式,类似于 GPT-3,进一步优化内存和计算效率。用分组多查询注意力机制,分组大小为 8,进一步提升推理效率。用 RoPE 进行位置编码,支持最长 128k 的上下文长度。
  • 预训练与后训练:预训练用高质量的纯文本数据集进行预训练,重点关注 STEM、编程和通用知识领域。后训练用与 o4-mini 类似的训练流程,包括监督式微调和高计算量的强化学习阶段。训练目标是让模型符合 OpenAI 模型规范,具备链式推理和工具调用能力。
  • 量化与优化:用 MXFP4 格式进行量化,模型在训练阶段就适应低精度环境,确保在减少模型体积的同时保持高性能。gpt-oss-20b量化后模型大小约为 12.8GB,能在 16GB 内存设备上运行。gpt-oss-120b量化后可在 80GB 内存中运行。与 NVIDIA、AMD 等硬件厂商合作,确保模型在各类系统上实现性能优化。
  • 安全机制:在预训练阶段过滤与化学、生物、放射性和核(CBRN)相关的有害数据。通过审慎对齐和指令优先级评估,训练模型拒绝不安全提示并抵御注入攻击。在特定领域(如生物学和网络安全)进行对抗性微调,评估并优化模型的安全性。

gpt-oss的性能表现

  • 基准测试表现
    • 竞赛编程:在 Codeforces 竞赛编程测试中,gpt-oss-120b 获得 2622 分,gpt-oss-20b 获得 2516 分,表现优于部分开源模型,略逊于闭源的 o3 和 o4-mini。
    • 通用问题解决:在 MMLU 和 HLE 测试中,gpt-oss-120b 表现优于 OpenAI 的 o3-mini,并接近 o4-mini 的水平。
    • 工具调用:在 TauBench 智能体评估套件中,gpt-oss-120b 和 gpt-oss-20b 的表现均优于 OpenAI 的 o3-mini,达到或超过了 o4-mini 的水平。
    • 健康问答:在 HealthBench 测试中,gpt-oss-120b 的表现超越 o4-mini, gpt-oss-20b 达到与 o3-mini 相当的水平。

Qwen3-4B超顶小模型更新登场!手机也能轻松跑!

Qwen3-4B超顶小模型更新登场!手机也能轻松跑!

新模型性能有了大幅提升。在非推理领域,Qwen3-4B-Instruct-2507 全面超越了闭源的 GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507 甚至可以媲美中等规模的 Qwen3-30B-A3B(thinking)。

我们相信, SLM(Small Language Models)对 Agentic AI 的发展极具价值。「2507」版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好,我们期待更多的 AI 硬件采用 Qwen3-4B-2507 新模型系列。目前新模型已在魔搭社区、Hugging Face正式开源,欢迎大家前往体验👏

以下为模型核心亮点——
1、Qwen3-4B-Instruct-2507
🌟通用能力显著提升,更全能的端侧利器
Qwen3-4B-Instruct-2507 的通用能力均大幅提升,超越了商业闭源的小尺寸模型 GPT-4.1-nano,与中等规模的 Qwen3-30B-A3B(non-thinking)性能接近。

🌟掌握更多语言和长尾知识,回答更合你意
新模型覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。

🌟上下文理解扩展至 256K,小模型也能处理长文本

Jules – Google Labs推出的AI编程智能体

Jules是什么

Jules 是 Google Labs 推出的AI编程智能体,通过自动化技术提升开发效率。能根据任务描述自动生成代码,能复杂任务分解为多个步骤,逐步推进解决方案。Jules 能理解并导航代码库,定位关键模块,自动运行单元测试以确保代码更新的正确性。可以根据开发者的反馈自适应调整方案,提供更符合预期的代码。Jules 支持与 GitHub 无缝集成,方便开发者跟踪代码变更和实时更新。适用于多种场景,包括软件开发与维护、敏捷团队协作、开源项目贡献以及企业级应用开发等。目前,Jules 开放内测体验。

Jules

Jules的主要功能

  • 自动修复代码错误:Jules 能分析代码库,识别并自动修复代码中的错误,减少开发者手动修复的时间。
  • 多步骤计划生成:可以将复杂的编码任务拆解为多个步骤,逐步推进解决方案。
  • 理解和导航代码库:Jules 可以深入分析现有代码库,理解代码结构并定位关键模块。
  • 运行和验证单元测试:能自动运行单元测试,验证代码更新的正确性,确保功能稳定。
  • 自适应反馈:根据开发者的反馈,Jules 不断调整方案,提供更符合预期的代码实现。
  • 集成开发环境:与 GitHub 无缝集成,支持代码变更跟踪并显示实时更新。
  • 生成拉取请求(PR):Jules 可以在修复代码后自动生成详细的拉取请求,方便开发者合并代码。
  • 异步操作:开发者可以通过 GitHub 的标签分配任务,Jules 在云端独立完成任务,并在完成后通知开发者。
  • 安全性保障:在执行代码更改前,Jules 会提供详细的修复计划,开发者可以实时监控其代码编写进展,在合并任何更改之前必须明确批准。

Jules的官网地址

  • 官网地址:labs.google.com/jules

Jules的应用场景

  • 软件开发与维护:Jules 能够自动识别并修复代码中的错误,在处理 Python 和 JavaScript 编程语言时表现出色,显著减少开发者在调试上的时间。可以优化代码结构,提升程序的性能。
  • 敏捷团队协作:在敏捷开发环境中,Jules 可以帮助团队快速响应变化,通过自动化修复任务支持快速迭代和持续集成。能生成详细的拉取请求(PR),方便团队成员合并代码。
  • 开源项目贡献:Jules 能帮助开发者快速定位并修复开源项目中的问题,提高贡献效率和质量。通过自动化修复功能,降低开源项目的维护成本。
  • 企业级应用开发:Jules 可以确保企业级应用的代码质量,通过自动化测试和修复降低维护成本。能处理复杂的多文件修改任务,生成可用于合并的代码。
  • 个人开发者与自由职业者:对于个人开发者,Jules 能帮助他们在有限的时间内完成更多工作。提供智能化的代码生成和错误修复功能,提升编程效率。

通义千问推出Qwen-Flash,全员拥抱1 M上下文!

API大更新✨!Qwen-Flash 也来了,全员拥抱1 M上下文!

灵心巧手完成数亿元天使轮融资,全球唯一实现高自由度灵巧手千台量产

今日,全球高自由度灵巧手领军企业灵心巧手正式完成数亿元天使轮融资,本轮融资由蚂蚁集团领投,中金资本、首发展创投、上海半导体装备基金、澄凯基金、德同资本、可可普丰跟投,老股东红杉中国种子基金继续加注,本轮融资将用于公司的技术储备提升和具身智能数据采集场建设,加速灵巧手的落地应用实际进程。

近年来,具身智能投融资逐步进入产业链深水区,产业发展呈现出深化趋势。根据产业链各人形机器人企业产量预测,具身智能行业将迎来人形机器人量产元年,当大量成熟人形机器人产品进入市场,任务执行能力将成为影响人形机器人能否广泛应用的决定性因素。作为决定灵巧操作能力的末端执行器,灵巧手也将迎来验证落地实际应用性的关键元年。在众多实际场景中,工业灵巧手率先迈入实际战场,其半开放场景的标准化、高精度、半封闭特性正成为灵巧手落地的前沿阵地。

针对半开放场景的应用新机遇,全球高自由度灵巧手领军企业灵心巧手创新性地推出了推出两款「工业大师」版灵巧手——Linker Hand L6与L20工业版。全新「工业大师」版灵巧手针对工业场景下高灵活性、高负载能力等实际需求开发,采用电缸驱动模式和全新动力模块。其中,Linker Hand L6工业版已在2025 WAIC与大众见面,是一款具备6个主动自由度、12个总自由度的高性能灵巧手。Linker Hand L20工业版则即将正式亮相,是一款具备17个主动自由度、21个总自由度的高自由度高性能灵巧手。「工业大师」版灵巧手兼具强负载能力和高运动速度,是灵心巧手推动全产业落地应用进入新元年的新力作。
「工业大师」版灵巧手配备灵心巧手全新设计研发的“超强电缸”驱动模块,在一般人类手掌大小的尺度空间内实现高度集成的驱控一体化设计,提供高推重比动力输出的同时节约大量结构空间。超强电缸使用“无刷电机+滚珠丝杠”组合方案,驱动效率高达90%,达传统产品的2倍以上。丝杠末端推力达200N,指尖末端力达20N,满足大力矩、高负载需求。面对生产实际中的高频反复运动情况,超强电缸实测寿命超百万次,达行业水平的2-3倍。无刷电机有效降低运行声音,减少噪音溢出,契合新时代智能工厂”静音生产”的未来趋势。「工业大师」版灵巧手无疑代表了未来工业灵巧手的领先设计方向和超前产品水平。
在此前的发展历程中,灵心巧手面对6自由度、7自由度产品充斥市场的内卷格局,创新性地以Linker Hand系列产品率先开辟了中国高自由度灵巧手的市场,以Linker Hand L10、L20两款20+自由度的强势产品将末端执行器产业链带入全新的快速发展时期,并迅速在全球占据领先位置。随着Linker Hand系列灵巧手以优良性能在各行各业完成灵巧操作任务,灵心巧手收获市场的广泛认可,目前月订单已过千。相较之下,海外大厂仍面临负载、寿命、续航等关键工程问题,难以让高自由度灵巧手进入实际量产进程。灵心巧手也已成为目前全球唯一一家有能力实现量产千台高自由度灵巧手的公司,出货量占全球高自由度灵巧手市场的80%以上。随着Linker Hand L6工业版的推出,灵心巧手也成为全球唯一一家量产全部驱动方式灵巧手的公司,实现了灵巧手技术路线的全覆盖。
图片
未来,灵巧手将突破“仿人五指”的传统理念,率先在工业半开放场景迎来“柔性制造决策执行终端”的新定义,并快速进入全场景应用的新纪元。灵心巧手将不断创新,不断推出高性能、高自由度的灵巧手产品,加速场景落地和灵巧操作数据累积,引领具身智能和灵巧操作进入全新的历史发展阶段。

代码画布上线!「动嘴开发」的时代到了

暑期到了,当隔壁的小伙伴都在休年假时,产品经理小马却天天抱怨工作堆到天花板。没想到,转眼就带来一个超强实习生:

“画原型,我随手画两笔,他立刻能变成demo,UI也挑不出毛病;

做作品集,以前得用PPT改半天,他直接炫成一个美观大气的网页”

同事打趣:“你不怕哪天被他取代吗?”小马摇头一笑:“他根本不是人——而是我最近爱上的搭档:星火代码画布

只要一句话、一张草图、一个链接、一段Prompt,就能直接生成交互网页。以前要拉UI、等前端,现在自己就能跑出demo。有了这个代码外挂,工作效率提高了几倍,也不用担心它会取代我。”

自打这个功能上线后,小马很快就把这“外挂工具”安利给了整个团队。没过几天,HR、设计、前端、运营……纷纷加入体验行列,亲身感受了AI编程的强大魅力。

01

一句话描述,极速产出详情页

小马最早“拐上道”的,是HR小斌。那天她临时接到任务,要在公司招聘官网上线一批岗位详情页,但设计、前端都在加急项目。

她打开星火,试着输入一句:

👉 “用html形式,为公司招聘官网创建一个‘高级产品经理’的职位详情页。”

没想到几秒后真的生成了一个清爽专业的页面,只需替换岗位内容即可安排上线。

用HTML为我生成

{ 岗位详情页 }

🌟 解决痛点:不会写代码,也能立刻有个能用的页面。适合运营、策划、新人练手、赶deadline的场景。

02

上传草图,瞬间还原产品原型

公司组织去参加一个黑客松比赛,小马带着团队刚定方案,需要一个AI论文评审助手的界面demo,但来不及画原型、写代码。

小马立刻让设计师阿夏手绘了一个草图,上传到星火:

👉 “根据这张草图生成可演示的 HTML+CSS 页面,完美还原布局,页面美观大方。

很快,结构清晰的页面跑了出来,稍微调整就能现场演示。

炸!刚刚小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!

小红书的人文智能实验室(hi lab)近日宣布开源了其最新的多模态大模型dots.vlm1。这款模型建立在DeepSeek V3的基础上,并配备了小红书自研的12亿参数视觉编码器NaViT,展现出强大的多模态理解与推理能力。

据hi lab介绍,dots.vlm1在多个视觉评测集上的表现已经接近当前领先的模型,如Gemini 2.5 Pro和Seed-VL1.5 thinking。特别是在MMMU、MathVision、OCR Reasoning等基准测试中,dots.vlm1显示出卓越的图文理解与推理能力。它能理解复杂的图文交错图表,解析表情包背后的含义,分析产品配料表差异,并能准确判断博物馆中文物和画作的名称及背景信息。

dots.vlm1由三个核心组件构成:一个12亿参数的NaViT视觉编码器、一个轻量级的MLP适配器,以及DeepSeek V3 MoE大语言模型。其训练过程经历了三个阶段,包括视觉编码器预训练、VLM预训练和VLM后训练。在视觉编码器预训练阶段,NaViT编码器通过大量图文对和纯图像数据进行训练,以增强对多样视觉数据的感知能力。在VLM预训练阶段,视觉编码器与DeepSeek V3联合训练,使用大规模、多样化的多模态数据集。最后,在VLM后训练阶段,通过有监督微调增强模型的泛化能力。

这个由3.5亿月活平台孵化的模型,实测表现直逼谷歌Gemini 2.5 Pro(当前最强闭源模型),总的来说可以:

✅ 看穿色盲测试图(人类都容易翻车!)

✅ 10秒解高考数学题(带完整推理过程)

✅ 破解地狱级数独(强行修正错误还喊“Yes!”)

✅ 一句话写李白诗风(输出惊艳古诗震撼全网)

OpenAI证实ChatGPT周活跃用户数7亿,同比增4倍

OpenAI周一表示,本周ChatGPT的每周活跃用户数将达到 7 亿,高于 3 月份的 5 亿,同比增长逾四倍。

据该公司称,这一数据涵盖了 ChatGPT 所有人工智能产品——免费版、Plus Pro、企业版、团队版和教育版——与此同时,每日用户消息已超过 30 亿条。与去年同期的 2.5 倍同比增长相比,这一增长率也在加快。

ChatGPT 产品副总裁 Nick Turley 在宣布该基准时表示:每天,人们和团队都在学习、创造和解决更棘手的问题。

今年3月,OpenAI推出了基于GPT-4模型的升级版图像生成功能,此后这款应用的人气大增。

4月初,该公司首席运营官布拉德·莱特卡普(Brad Lightcap)表示,该功能上线后短短几天内,已有超过1.3亿用户创建了超过7亿张图片。

该公司的用户数量也有所增加。上周,Lightcap 表示,ChatGPT 拥有500 万付费商业用户,高于 6 月份的 300 万。

市场情报公司 Sensor Tower 在最近的一份报告中指出,用户平均每月使用 ChatGPT 超过 12 天,仅次于 Google 和 X。报告还称,到 2025 年上半年,用户平均每天在该应用上花费 16 分钟。

但OpenAI距离谷歌活跃用户还有很长的路要走。

Alphabet 首席执行官 Sundar Pichai 在公司季度财报电话会议上表示,该产品可汇总搜索结果,目前每月在 200 多个国家/地区拥有约 20 亿用户。

据皮查伊称,该公司的人工智能聊天机器人 Gemini App 目前每月拥有超过 4.5 亿活跃用户。

OpenAI 取得这一里程碑之前,上周有消息称,该公司从 Dragoneer Investment Group、Andreessen Horowitz、红杉资本、Coatue Management 和 Altimeter Capital 等顶级投资者财团获得了 83 亿美元融资。

据一位知情人士透露,软银领投了400亿美元的一轮融资。由于涉及财务信息,该人士要求匿名。此次融资提前完成,并获得五倍超额认购。

OpenAI 的年度经常性收入目前为 130 亿美元,高于 6 月份的 100 亿美元,预计到年底将超过 200 亿美元。

即使估值达到 3000 亿美元、营收达到 200 亿美元,OpenAI 仍需要大量资金来支持其全球扩张。

OpenAI 已经与 Oracle 签署了一份每年 300 亿美元的租赁协议,租用美国 4.5 千兆瓦的数据中心容量,并与CoreWeave达成了一份为期五年、价值 119 亿美元的协议,并通过《星际之门》向欧洲扩张。

OpenAI 还与阿联酋公司 G42 合作在阿布扎比建立一个大型数据中心。

该公司的竞争对手也在采取类似举措。

一份泄露 给《连线》杂志的备忘录 显示,Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 改变了对中东资金的政策,他写道,如果不利用海湾地区的主权财富,“保持人工智能发展的前沿地位将变得极其困难”。这标志着 Anthropic 立场的转变。

CNBC 去年报道称,Anthropic在寻找新投资者时拒绝接受沙特阿拉伯的资金。

随着竞争日趋激烈,新增资本和使用量的增长凸显了投资者对人工智能平台的兴趣日益高涨。Anthropic 还在洽谈融资至多 50 亿美元,估值达到 1700 亿美元。今年早些时候,Anthropic 完成了一轮 35 亿美元的融资,估值达到 615 亿美元。(转载自:AI普瑞斯)

消息称苹果计划首度进入 AI 搜索引擎领域

IT之家 8 月 3 日消息,彭博社的马克・古尔曼(Mark Gurman)在最新一期 Power On 时事通讯中透露,苹果计划首度进入 AI 搜索引擎领域,试图与行业竞争对手一较高下,这一动向标志着苹果在生成式 AI 方向上发生重大转变。

目前,苹果推出的 Apple 智能功能表现平平,旗下 Genmoji、通知摘要等功能并未获得海外用户的广泛好评,同时苹果原计划推出的全新 Siri 也不断延期,直至今天仍未有准确的上线日期。

古尔曼称,苹果已于今年初成立了一个名为“Answers, Knowledge and Information”(简称 AKI)的内部团队,该团队由前 Siri 项目负责人 Robby Walker 领导,目标是打造“类 ChatGPT 的 AI 搜索体验”,尽管苹果高层内部对该方向曾存在“保留态度”,但从目前的举动来看,苹果已正式朝此迈进。

值得一提的是,苹果此前曾表达过对 AI 搜索初创公司 Perplexity 的兴趣,这也为苹果推进相关 AI 搜索业务埋下伏笔。

目前来看,苹果的 AI 搜索引擎计划仍处于早期阶段,距离面向消费者产品的落地还有较长时间。不过这仍是苹果在生成式 AI 战略布局中的重要一步,若苹果最终推出 AI 搜索产品,将对谷歌、OpenAI、Perplexity 等现有市场玩家产生有力挑战。