阿里本周将发布首款自研AI眼镜,加入“百镜大战”丨智能涌现独家

《智能涌现》独家获悉,阿里巴巴将于本周发布首款自研AI眼镜。加入“百镜大战”。

一位知情人士向《智能涌现》透露,阿里即将发布的这款AI眼镜,会拥有市面上多数产品拥有的的基础功能,如语音助手、音乐播放、电话通话、实时翻译、会议纪要等功能。

这款产品还会实现对阿里巴巴生态内的整合,包括地图、支付、购物类的功能。“高德、支付宝、淘宝等技术团队等都参与了进来。”上述人士称。

而在产品的AI能力上,基础模型将调用通义千问,夸克则会训练学习、健康等方向的垂类模型。

据我们了解,这款AI眼镜在硬件规格上将超越Ray-Ban Meta智能眼镜,将分为两个版本——不带显示的AI智能眼镜,以及带显示的AI+AR智能眼镜,后者优先级更高。产品硬件层面,这款眼镜将采用双芯片架构,为高通骁龙AR1+恒玄BES2800。

这也是阿里自去年底整合AI To C业务之后,推出的首款AI产品,“是阿里AI to C战略的延展。”内部人士告诉我们。

我们曾系统报道过这一战略的演变。从2024年年底开始,阿里开始了一系列业务整合——先是通义应用团队调整至阿里智能信息事业群;而后,拥有To C硬件品牌“天猫精灵”的智能互联事业群,与夸克团队相融合,上述团队均由阿里巴巴集团副总裁吴嘉统管。

而在团队完成融合后,阿里首款自研AI眼镜也正由天猫精灵硬件团队和夸克AI研发团队协同完成,主要负责人为阿里巴巴智能信息事业群智能终端业务负责人宋刚,他曾担任多款华为旗舰手机主架构师,主导研发了智能手机、游戏设备、机器人、XR设备及家庭移动终端等全系列智能硬件产品。

此前,市面上的多数AI眼镜在应用场景上非常有限。这一方面是因为技术发展仍在早期,续航时间短、佩戴不适、配镜等问题,诸多AI眼镜产品仍停留在爱好者群体中,部分厂商的AI眼镜也遭遇了难产问题。

另一方面,在软件层,市面上普遍的AI眼镜,会具备拍照识别、翻译、导游、会议记录等功能,但功能都还处于比较粗糙的阶段,比如拍照、录像的分辨率也还并不如人意。

销量也印证了这点。目前,全球AI眼镜市场上,除了Meta的Ray-ban三个季度破百万台销量之外,其他品牌都还在发展早期。洛图科技(RUNTO)线上监测数据显示,一季度国内智能眼镜(含AR眼镜)销量大约11.6万台,其中AI拍摄眼镜仅1.6万台。

业务场景更为多元化的互联网巨头入场,将有助于改变这一局面。

上述消息人士对《智能涌现》表示,如果阿里能在满足美观的前提下,再结合夸克在AI、学习、存储等方面的优势,以及通过业务生态中的地图导航、扫码支付、淘宝比价、飞猪商旅提醒等更多生活高频场景的触达,则有可能打破当前AI眼镜生态碎片化、应用场景单一的发展瓶颈,让AI眼镜进入更多大众消费视野。

在软件层面,这款眼镜也会加入夸克AI助手的不少能力——这半年里,阿里在大模型应用侧有多项进展,包括夸克从一款浏览器、搜索工具升级为“超级框”,如今已经是带有Agent(智能体)能力的智能助手。在更底层的模型上,推理速度加快、成本进一步降低,让端侧的发展迎来可能。

这些能力加载在眼镜上,才有可能让AI眼镜成为真正意义上的“随身助手”。
AI眼镜行业虽然未到爆发期,但涌入赛道的消费电子巨头、互联网大厂还是创业公司,都在尝试着杀入大众消费市场。

小米AI眼镜则是近期最受关注的行业节点。6月26日晚,小米发布首款AI眼镜,共有3个版本,价格1999元起,产品形态上基本对标Ray-Ban Meta,一定程度也是走向更多普通消费者的尝试。

纵观其他玩家,不论是Meta等巨头,还是Rokid等明星初创公司,近期都在争相推新品,覆盖日常支付、运动等更多生活场景。

除了阿里,包括百度、字节等其他大厂们也都在入局,他们也都拥有技术、资金以及生态优势。其中,百度的AI眼镜已经发布,但还未正式发售,字节的AI眼镜也已经规划已久。随着2025年下半年不少新AI眼镜的出货和正式发售,这将会成为AI眼镜行业的重要节点。

讯飞星火X1将于7月25日全新升级!

今天,分享一个好消息:

讯飞星火X1升级版将于7月25日正式上线!

基于全国产算力训练的深度推理大模型讯飞星火X1,这次升级会有哪些惊喜?

核心升级亮点抢先看图片!

图片
综合能力大幅提升

在数学、翻译、推理、文本生成等方面保持领先。

图片
幻觉治理显著进步

慢思考模式的幻觉治理准确率大幅领先,大模型回复更加可靠。
图片
多语言能力全面扩展

底座多语言能力扩展支持130+语种,处于业界一流水平。

👉🏻得益于底座能力的提升,讯飞星火X1在各个应用领域都将带来更好的表现:

1️⃣星火语音同传大模型的同传体验大幅提升,中英同传持续领先,专业领域覆盖度也取得了显著进步。作为2025世界人工智能大会“翻译合作伙伴”,科大讯飞将为全球用户带来更强大的AI能力体验。

2️⃣教育、医疗、企业级应用、科学智能等行业大模型取得新的进步,在关键产品的复杂任务上继续扩大领先优势。

届时,全新API将同步上线【讯飞开放平台】,大家也可以在【讯飞星火网页版】和【讯飞星火APP】第一时间体验升级版大模型带来的变化。

Mureka V7 – 昆仑万维推出的最新AI音乐生成模型

Mureka V7是昆仑万维推出的先进的AI音乐模型,具备强大的音乐创作能力。模型基于MusiCoT(音乐思维链)技术,先规划整体音乐结构再填充细节,生成的音乐更具连贯性和艺术性。Mureka V7支持10种语言,能创作流行、摇滚、电子等多种风格的歌曲和纯音乐,支持用文字描述生成专属音色。用户能在简单模式快速创作,或在高级模式下上传参考歌曲实现风格定制。Mureka V7适合普通用户创作个人原创音乐,能为内容创作者和音乐人提供高效的创作工具。

Mureka V7

Mureka V7的主要功能

  • 高质量音乐生成:支持多种风格(如流行、摇滚、电子、古典、嘻哈等)和10种语言(英语、西班牙语、中文、日语、韩语、葡萄牙语、德语、意大利语、法语、俄语),提供逼真的人声和乐器音色。
  • 多种创作模式:简单模式快速生成音乐,高级模式支持自定义歌词、音色和风格。
  • 纯音乐生成功能:用文字提示或参考音乐生成免版权纯音乐,适合多种创作场景。
  • 音频编辑功能:支持局部编辑、延长、分轨和裁剪,方便二次创作。
  • 自定义音色:基于文字描述创建全新音色,摆脱现有音色库限制。
  • 创作证明:生成音乐具有创作证明,可合法使用和销售。

如何使用Mureka V7

  • 访问官网:访问Mureka的官网。
  • 选择模型:在模型选择下拉框中选择 Mureka V7模型
  • 选择创作模式
    • 简单模式:输入文字提示(如“一首流行歌曲”),点击“生成”。
    • 高级模式:输入歌曲标题和歌词,上传参考歌曲(可选),选择音色,调整描述,点击“生成”。
    • 纯音乐创作:选择“纯音乐”模式,输入文字提示,上传参考音乐(可选),点击“生成”。
  • 音频编辑:生成音乐后点击“编辑”,进行局部修改、延长、裁剪或分轨操作。
  • 自定义音色:选择“语音合成”,输入文字描述(如“温暖的奶奶音”),点击“生成”。
  • 下载与分享:下载生成的音乐(MP3、伴奏、分轨音频),或分享动态视频。

Mureka V7的应用场景

  • 个人音乐创作:用户能快速生成原创歌曲,学习创作技巧,轻松实现音乐梦想。
  • 内容创作:为 vlog、短视频、广告、影视等生成背景音乐,满足多样化配乐需求。
  • 音乐制作:为音乐人提供灵感,探索新风格,助力突破创作瓶颈。
  • 教育领域:教师生成示例音乐辅助教学,学生通过练习提升创作能力。
  • 商业用途:为品牌广告、产品推广、活动等生成符合需求的音乐,增强商业表现力。

通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文

IT之家 7 月 23 日消息,阿里云通义团队今日发布公告,宣布 Qwen3-Coder 正式开源,号称是“面向世界的智能编程引擎”。

这也是该团队迄今为止最具 Agent 能力的代码模型,在 Agentic Coding、Agentic Browser-Use 和 Foundational Coding Tasks 上均取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。

据介绍,Qwen3-Coder 拥有多个尺寸,今天率先开源当前最强大版本:Qwen3-Coder-480B-A35B-Instruct 模型。

它是一个 MoE 模型,拥有 480B 参数,激活 35B 参数,原生支持 256K 上下文,并可通过 YaRN 扩展到 1M 长度,拥有卓越的代码和 Agent 能力。

为方便开发者更好地使用 Qwen3-Coder,阿里云通义团队还开源了一款命令行工具 Qwen Code,可充分发挥 Qwen3-Coder 在代理式编程上的潜力。此外,Qwen3-Coder 的 API 也可以和 Claude Code、Cline 等工具协同使用。

目前 Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,后续很快将接入阿里的 AI 编程产品通义灵码,API 也已上线阿里云百炼。IT之家附官方地址如下:

  • 魔搭社区:https://modelscope.cn/ models / Qwen / Qwen3-Coder-480B-A35B-Instruct
  • Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
  • Qwen Code GitHub:https://github.com/QwenLM/qwen-code

世界杯碾压夺冠的北京机器人,又完成超亿元融资,清华系团队造

器人前瞻7月24日报道,今天,加速进化宣布完成超亿元A+轮融资,北京市机器人产业发展投资基金领投,北京市人工智能产业投资基金、博华资本跟投,义柏资本长期担任独家财务顾问。

加速进化成立于2023年6月,在今年6月的时候完成了A 轮融资,由深创投集团领投。

在产品方面,加速进化已推出双足人形机器人Booster T1,该产品身高仅1.1米,体重29公斤,搭载了端到端全身运动大模型,不仅能够完成踢球、俯卧撑、叶问蹲等复杂动作,还可以提适应多种复杂地形,在多项机器人赛事中作为技术验证平台。

世界杯碾压夺冠的北京机器人,又完成超亿元融资,清华系团队造

加速进化将机器人赛事作为早期突破场景,在赛事中检验机器人在本体硬件、运动控制、自主感知、多智能体协作、智能决策等综合性能,并积累海量高质量真机运行数据,为持续的技术创新与产品迭代提供支撑。

在刚刚落幕2025 RoboCup机器人世界杯上,加速进化支持的清华火神队使用T1机器人获得成人组冠军。这是该项赛事举办28年来,中国战队首次在技术含金量最高的人形组别摘得金牌。在小型组决赛中,冠军队伍德国Boosted HTWK所使用的机器人则是来自加速进化的K1机器人。

世界杯碾压夺冠的北京机器人,又完成超亿元融资,清华系团队造

据了解,加速进化即将推出机器人另一款世界杯冠军机型K1机器人,面向开发者及广大应用市场。

在商业化方面,加速进化打造了“机超”赛事IP,在赛事场景中构建起 “商业 – 技术 – 生态” 多维度闭环,不仅为全球赛事队伍提供软硬件服务实现批量出货,还开展机器人足球教育课程与培训等教育场景的合作项目,通过赛事IP的协同效应,开辟商业化的新通路。

加速进化创始人兼CEO程昊,毕业于清华大学自动化系,在校期间担任“清华火神足球队”队长,主导人形机器人运动控制算法研发。2013 年创立智能日程管理 APP“朝夕日历”,被字节跳动收购后任飞书产品副总裁,负责数万人团队的产品研发与商业化,积累了大规模团队管理和复杂业务落地经验。

首席科学家赵明国,为清华大学自动化系研究员,机器人控制实验室及无人系统中心类脑机器人中心主任,深耕人形机器人领域 20 余年,主导多项国家级机器人科研项目。

世界杯碾压夺冠的北京机器人,又完成超亿元融资,清华系团队造

▲加速进化创始人程昊(左)、加速进化首席科学家赵明国(右)

未来,加速进化称,计划凭借技术、市场与资本的多重优势,加速技术创新与市场拓展进程,持续深化在赛事场景的优势,加快家庭消费与商用市场布局,携手全球开发者,让人形机器人像个人计算机一样简单、可靠、实用。

像素绽放PixelBloom完成B3轮融资,以AI Venture Studio模式重绘全球AI办公版图

像素绽放PixelBloom是一家AIGC内容中台解决方案提供商,致力于帮助企业实现内容全链路(生产、管理、分发、数据)的数字化升级。目前像素绽放PixelBloom旗下产品包括AiPPT.cn(国内)/AiPPT.com(海外)、爱设计AIGC内容中台、365编辑器、爱设计在线设计工具、AiH5、叮当好记Readlecture.cn、Visdoc.Ai等超过10余款应用AI能力的内容创作工具。近日,像素绽放PixelBloom近日宣布完成B+轮融资。本轮融资由北京市人工智能产业投资基金(由顺禧基金和启明创投管理)领投,知名机构和明星企业家跟投。融资将用于产品研发,AI能力提升和国内外市场拓展等方面。(IT桔子)

Seed 端到端同声传译大模型发布:准确率接近真人,3s 延迟,实时声音复刻

同声传译,被视为“翻译界的巅峰技能”。它需要译者在数秒的极短时间内转换语言,边“听”边“说”,要求极高。因此,对翻译技术研究者来说,同传一直是最具挑战的方向。

今天,字节跳动 Seed 团队正式发布端到端同声传译模型 Seed LiveInterpret 2.0。

Seed LiveInterpret 2.0 是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界 SOTA 的同时,实现了极低的语音延迟水平。

它基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟 “边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0 还支持 0 样本声音复刻,让沟通更加流畅自然。

在测试中,可以观察到,Seed LiveInterpret 2.0 面对 40 秒的大段中文表达,能够低延迟地丝滑输出同款音色的英语翻译。

商汤小浣熊牵手蚂蚁百宝箱,共建AI+数据分析方案

商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作,双方联合打造“AI数据分析助手”,为百宝箱广大用户提供大模型服务,后续还将直接登陆到支付宝平台。

在数据要素价值加速释放与大模型深度赋能的背景下,新应用场景加速落地,市场需求涌现。数字生活平台上的商家及生态方,需要更加轻量化、智能化的分析工具,实现 AI数智化服务能力升级。

“办公小浣熊”将以AI Agent形态为蚂蚁百宝箱用户免费提供数据分析能力,构建更自然的人机协作场景。

▍如何开始?

应用 Agent 化,对应着新一轮人机交互范式的变革,商汤小浣熊与蚂蚁百宝箱共同携手提升用户体验。

办公这类由多样化需求构成的复合场景,正是AI Agent的最佳应用场景之一。

商汤小浣熊家族与蚂蚁百宝箱携手打造“AI数据分析助手”,旨在为用户提供全方位的数据处理与分析支持。

原来数据分析如此简单~

融入商汤小浣熊AI能力的数据分析智能体,不仅能进行准确实用的数据分析,还能精准解析用户的无序表达意图(多模态理解可支持文本、表格、图像输入),并辅以针对性引导,能够主动适应不同用户的表达习惯。

后续双方会共同打造「AI + 数据分析」场景使用教程,让更多用户掌握 AI+数据分析的能力,让科技服务更具包容性和普惠性。

目前,商汤小浣熊已推出网页版、小程序版,并登陆蚂蚁百宝箱平台和联想生态全平台,未来将持续扩展服务渠道,为用户提供更便捷的差异化体验。

+++蚂蚁百宝箱+++

蚂蚁百宝箱智能体开发平台整合多款主流大模型,提供丰富的行业应用模板与服务插件,支持零代码快速构建智能体。基于支付宝的生活场景面向政务、高校、餐饮等多领域,通过 API无缝对接业务系统,实现智能决策与全渠道发布。

+++商汤小浣熊家族+++

“商汤小浣熊家族”用户数突破150 万,日调用量达上百万次,每日处理 Token 数超过35亿,触达千万级用户。“办公小浣熊”被称为国内增速最快的AI 办公工具;“代码小浣熊”获沙利文评选为国内第一AI 代码助手。

依托强大的代码解析能力,小浣熊系列已形成完整的AI 生产力工具矩阵,为B 端客户提供具备强数据安全、可私有化部署的产品,目前已在中国移动、上海电信、金山办公、联想、360、零跑科技等领军企业中实现落地。

AI绘画是一种新型艺术形式

人工智能(AI)绘画在当下发展得如火如荼,也成为学术圈的热议话题。AI绘画给艺术带来了怎样的机遇和挑战,它又能否被称作艺术品呢?在往期的《学术争鸣》中,专家学者们对此进行了探讨。本期我们继续聚焦AI绘画作品的艺术性问题。
马立新认为,AI绘画属于一种崭新的数字艺术形式,既然AI绘画整个创作环节都必须有赖于人类主体全面、积极、主动参与,AI绘画作品也显现出无可置疑的审美价值,那么AI绘画就有充分理由被视为艺术。刘昌奇提出,艺术创作是人类以语言、图像、行为等为媒介,有意识、有创造性地进行思想与情感交流的社会交往活动,而AI绘画作品只是对已有绘画风格进行模仿的产物,并不诞生于特定的历史情境中,也不具备自我意识,因此并非艺术。
作者:马立新(山东师范大学数字艺术哲学研究中心主任、教授)
近年来,随着深度神经网络技术、特别是GAN(生成对抗网络)、CAN(创造对抗网络)、GPT(生成式预训练Transformer模型)等算法模型的快速进展,AI(人工智能)绘画如雨后春笋般出现,开始进入大众的视野。在我看来,这是数字技术催生的又一种新型艺术形式。
判定AI绘画是不是艺术,这要从艺术的本质谈起。
在人类艺术史上,理论家们对于艺术本质的认识集中在三个不同的尺度上:首先是功能尺度,认为审美价值是构成艺术的一个根本尺度;其次是语境尺度,认为艺术的认定需要特定的艺术机构或艺术语境;第三是历史尺度,认为人们对于艺术的认识是一个历史的过程,从艺术发展历史中可以找到认定艺术的重要经验尺度。
此外,当代著名艺术哲学家布洛克还提出了一个更具包容性的艺术阐释框架,他认为艺术乃是铭刻着强烈人类精神印记的审美客体。在这里,他特别强调了人类的主体意识对于某一客体艺术身份认定的重要性。这一概念受到学术界和艺术界的普遍重视和采纳。
从上述标准出发,我们可以对AI绘画的身份属性加以考察和分析。

日本首部全AI电影年内上映 人工智能电影要来了

1905电影网讯 近日,日本首部用全ai生成的电影《生成式AI实施领域》(generAIdoscope,暂译)释出一支预告。预告中展现了多种AI生成的奇幻场景,三位故事主角也纷纷亮相。据悉,本片采用原创故事,画面、声音、配乐全部由ai生成,计划2024年年内在日本院线上映。

本片由三部分组成,由乙一、兽根刚、山田洋辉三人各执导其中一部分。乙一执导部分名为《猴子奥德赛》(モンキーズ・オデッセイ,暂译),讲述了大航海时代的水手漂流到了只有猴子的无人岛的故事;曾根刚执导部分名为《AZUSA》,讲述了有幻想癖的古怪女孩为实现梦想穿梭于两个世界;山田洋辉执导部分名为《格拉玛莱维特》(グランマレビト,暂译),讲述了在遥远的未来,魔术师老婆婆为了某个目的来到了架空国家的故事。

随着生成式AI技术的爆发式发展,越来越多的产业开始使用AI技术。在此前上映的《流浪地球2》和刚上映不久的电影《传说》都不同程度的使用了AI技术,还原出了“青春版吴京”、“青春版成龙”,展现出强大的实力。但目前来看,生成式AI还只是一种锦上添花的技术,全面使用AI进行电影创作仍处于起步阶段,这次将于日本上映的“全AI电影”将会是一个有意义的尝试。