Qwen3.6 与 Qwen3.7 生态调研

信息来源说明：本调研基于 Qwen 官方博客 / Alibaba Cloud Community、Hugging Face 官方 Qwen 模型卡、Hugging Face Collection、vLLM recipes、ModelScope / 第三方模型平台索引、TechNode / CnTechPost 等公开资料整理。Qwen3.7 仍处于刚发布阶段，部分信息仅有服务化模型与媒体报道，未公开权重、参数规模和完整模型卡；下文出现此类数据时统一标注"未公开"或"估算"。

一、核心结论

Qwen3.6 官方开源家族数量：4 个 Hugging Face 官方条目，分别为 Qwen3.6-35B-A3B、Qwen3.6-35B-A3B-FP8、Qwen3.6-27B、Qwen3.6-27B-FP8。
Qwen3.6 核心定位：面向 agentic coding、仓库级推理、多模态理解、长上下文与本地 / 私有化部署的开源权重模型线。
Qwen3.7 当前官方公开形态：Qwen3.7-Max，服务化 / 闭源旗舰 Agent 模型；公开权重数量为 0。
Qwen3.7 Preview 形态：公开报道和社区测试中出现 Qwen3.7-Max-Preview、Qwen3.7-Plus-Preview；是否作为正式模型计数，需等 Qwen 官方模型卡 / API 文档确认。
CoPaw-Flash / QwenPaw-Flash 口径：这是一条重要的官方 AgentScope 衍生线，旧名 CoPaw-Flash、现名 QwenPaw-Flash；它不是 Qwen3.6 主家族成员，但代表“官方专项微调 + Flash 小模型 + Agent 数据蒸馏”的路线。
生态规模：Qwen3.6 两个主底座在 HF Model Tree 下已有 约 1,100+ 衍生条目，其中量化模型占大头；去重后有效社区模型估算 500-800 个。
代际方向：Qwen3.6 解决“开源可用、开发者能跑、工具能接”；Qwen3.7 重点冲“长周期自主 Agent、复杂工具链、35 小时级连续任务”。

二、基础背景

2.1 系列名称与团队

项目	内容
模型系列	Qwen3.6 / Qwen3.7
开发团队	Alibaba Cloud / Qwen Team / 通义千问团队
所属公司	阿里巴巴集团 / 阿里云
前身	Qwen3、Qwen3.5、Qwen3-Next、Qwen3-Coder 等
开源平台	Hugging Face、ModelScope
服务入口	Qwen Chat、DashScope / Alibaba Cloud Model Studio、第三方 API 平台

2.2 首次发布时间

时间	事件	说明
2026-02	Qwen3.5 系列发布	Qwen3.6 的直接前身
2026-04	Qwen3.6-35B-A3B 发布	官方称为 Qwen3.6 第一个 open-weight 版本
2026-04	Qwen3.6-27B 发布	27B dense 多模态模型，主打旗舰级 coding 能力
2026-05-20 / 05-21	Qwen3.7-Max 发布	面向 Agent 工作负载的闭源服务化旗舰

2.3 开源协议

系列	权重状态	协议
Qwen3.6-35B-A3B	开源权重	Apache-2.0
Qwen3.6-27B	开源权重	Apache-2.0
Qwen3.6 FP8 版本	官方量化权重	Apache-2.0
Qwen3.7-Max	未开放权重	服务化 / 闭源，协议未按开源模型披露

2.4 基座架构与原生能力

模型	架构	参数	上下文	原生能力
Qwen3.6-27B	Dense + Vision Encoder + Gated DeltaNet / Gated Attention 混合结构	27B	262,144 tokens，YaRN 可扩展到约 1,010,000	文本、图像、视频输入，代码、工具调用、长上下文
Qwen3.6-35B-A3B	MoE + Vision Encoder + Gated DeltaNet / Gated Attention 混合结构	35B total / 3B active	262,144 tokens，YaRN 可扩展到约 1,010,000	多模态、代码、Agent、工具调用、长视频 / 长文档
Qwen3.7-Max	未公开	未公开	未公开；官方评测覆盖 128K MRCR-v2 等长上下文任务	复杂 Agent、代码调试、办公自动化、长周期工具调用

关键判断：Qwen3.6 的技术核心在于组合 Gated DeltaNet、Gated Attention、MTP、多模态 Encoder、262K 长上下文，已经超出传统 Transformer Dense/MoE 二分；Qwen3.7-Max 则进一步把能力目标从“模型能力”推向“Agent 稳定执行能力”。

三、官方完整家族

3.1 Qwen3.6 官方开源家族

Hugging Face 官方 Qwen3.6 Collection 当前显示 4 个条目：

模型	类型	参数	架构	上下文	发布时间	备注
Qwen3.6-35B-A3B	主模型	35B / 3B active	MoE，多模态	262K，可扩展约 1.01M	2026-04	首个 Qwen3.6 open-weight 版本
Qwen3.6-35B-A3B-FP8	官方量化	35B / 3B active	MoE，多模态	262K	2026-04	官方 FP8 权重
Qwen3.6-27B	主模型	27B	Dense，多模态	262K，可扩展约 1.01M	2026-04	旗舰级 coding dense 模型
Qwen3.6-27B-FP8	官方量化	27B	Dense，多模态	262K	2026-04	官方 FP8 权重

官方开源版本总数：4。

3.2 Qwen3.7 官方服务化家族

模型	类型	权重	参数	上下文	发布时间	状态
Qwen3.7-Max	服务化旗舰	未开放	未公开	未公开	2026-05-20 / 05-21	已发布 / API 即将或逐步开放
Qwen3.7-Max-Preview	预览版	未开放	未公开	未公开	2026-05	社区和媒体报道出现
Qwen3.7-Plus-Preview	预览版	未开放	未公开	未公开	2026-05	社区和媒体报道出现

Qwen3.7 已确认正式模型数量：1（Qwen3.7-Max）。
Qwen3.7 公开权重数量：0。
若把 Preview 名称也计入服务化变体：约 3 个。

3.3 Flash / Plus / Max

层级	Qwen3.6	Qwen3.7	说明
Flash	未见 Qwen3.6 官方开源权重同名模型	未确认	通常为服务化轻量 / 低价路线，需等 DashScope 文档
Plus	Qwen3.6-Plus 在社区和 API 语境出现，但缺少公开权重模型卡	Qwen3.7-Plus-Preview 出现在公开测试语境	服务化中档模型
Max	Qwen3.6-Max-Preview 在社区语境出现	Qwen3.7-Max 正式发布	闭源旗舰，面向复杂 Agent

口径说明：开源权重统计以 Hugging Face Qwen 官方 Collection 为准；Plus / Max 这类服务化版本应与开源权重分开统计。

四、官方衍生 / 子模型 / 专用模型

4.1 Qwen3.6 官方专项方向

Qwen3.6 本身没有拆成 Qwen3.6-Coder、Qwen3.6-Agent、Qwen3.6-LongContext 等独立命名专用模型；它把专项能力整合进主模型：

方向	代表	数量
Agentic Coding	Qwen3.6-27B、Qwen3.6-35B-A3B	2 个主模型
多模态	两个主模型均带 Vision Encoder	2 个主模型
长上下文	两个主模型均 262K 原生上下文，可扩展约 1.01M	2 个主模型
官方 FP8 量化	Qwen3.6-27B-FP8、Qwen3.6-35B-A3B-FP8	2 个量化版本
MTP / 推理加速	模型卡明确支持 multi-step MTP	2 个主模型

4.2 Qwen3 生态同期专项模型

这些不是 Qwen3.6 / Qwen3.7 命名，但属于同一 Qwen3 代际生态：

方向	官方系列	数量级
代码	Qwen3-Coder、Qwen3-Coder-Next	数个模型 / Collection
多模态	Qwen3-VL、Qwen3-Omni	多尺寸、多变体
Embedding / Reranking	Qwen3-Embedding、Qwen3-Reranker、Qwen3-VL-Embedding / Reranker	0.6B / 4B / 8B 等尺寸
语音	Qwen3-ASR、Qwen3-TTS	专项模型线
安全	Qwen3Guard	安全分类 / 守护模型线
机制解释	Qwen-Scope	14 组 SAE，覆盖 7 个 Qwen3 / Qwen3.5 变体

4.3 CoPaw-Flash / QwenPaw-Flash：官方 Agent 衍生线

CoPaw-Flash-9B 需要单独看。它不是 Qwen3.6 官方主家族，也不是普通社区微调；它属于 AgentScope 团队基于 Qwen3.5 系列推出的官方 Agent 衍生线，后续官方仓库命名从 CoPaw-Flash 调整为 QwenPaw-Flash。

模型	当前官方命名	底座 / 关系	参数	定位
CoPaw-Flash-9B	QwenPaw-Flash-9B	基于 Qwen3.5-9B 的 Agent / tool-use 微调	9B	轻量 Agent、工具调用、快速任务执行
CoPaw-Flash-9B-Preview	QwenPaw-Flash-9B-Preview	早期预览	9B	预览版能力验证
CoPaw-Flash-9B-FP8	QwenPaw-Flash-9B-FP8	官方 FP8 量化	9B	低显存部署
CoPaw-Flash-9B-GGUF	QwenPaw-Flash-9B-GGUF	官方 / 准官方 GGUF 分发	9B	llama.cpp / Ollama / LM Studio 本地生态
CoPaw-Flash-9B-GPTQ-Int4	QwenPaw-Flash-9B-GPTQ-Int4	官方 / 准官方 GPTQ 量化	9B	INT4 GPU 推理
CoPaw-Flash-9B-AWQ	QwenPaw-Flash-9B-AWQ	官方 / 准官方 AWQ 量化	9B	INT4 GPU 推理
CoPaw-Flash-9B-GPTQ-Int8	QwenPaw-Flash-9B-GPTQ-Int8	官方 / 准官方 GPTQ 量化	9B	INT8 GPU 推理

该衍生线官方 Collection 数量：约 7 个条目。

它的重要性在于：

不是主模型家族：不能把它算进 Qwen3.6 官方 4 个主条目。
是官方专项微调：它代表 Qwen 官方生态在 Agent / tool-use 方向做轻量专项模型。
底座更小：9B 级别比 Qwen3.6-27B / 35B-A3B 更适合低成本本地 Agent。
量化更完整：FP8、GGUF、GPTQ、AWQ 等格式齐全，说明官方希望它直接进入本地部署生态。
与 Qwen3.7 路线呼应：Qwen3.7-Max 做闭源旗舰 Agent，QwenPaw-Flash-9B 做开源轻量 Agent，两者构成“服务化旗舰 + 本地小模型”的双线布局。

关键判断：CoPaw-Flash-9B / QwenPaw-Flash-9B 是 Qwen 生态里非常值得重点关注的“官方衍生模型”：它主攻 Agent、工具调用、轻量部署和可量化分发，不追求通用最强。

4.4 官方量化 / 蒸馏 / 轻量

类型	官方代表	数量
FP8	Qwen3.6-27B-FP8、Qwen3.6-35B-A3B-FP8	2
QwenPaw-Flash 官方量化	QwenPaw-Flash-9B-FP8 / GGUF / GPTQ / AWQ / GPTQ-Int8	约 5 个量化条目
INT4 / GGUF	Qwen3.6 官方主仓未直接发布 GGUF / INT4；QwenPaw-Flash 已有对应分发	Qwen3.6：0；QwenPaw：多格式
蒸馏 / Agent 数据微调	QwenPaw-Flash-9B 属于 Agent 专项衍生；公开细节有限	1 条主线
服务化闭源	Qwen3.7-Max	1 正式

五、社区微调生态

5.1 最活跃底座

底座	活跃原因	HF 可见量级
Qwen3.6-27B	Dense、能力强、部署相对直接，社区更易量化	Model Tree：Adapters 52、Finetunes 182、Merges 4、Quantizations 369
Qwen3.6-35B-A3B	MoE 仅 3B active，适合低成本推理和实验	Model Tree：Adapters 21、Finetunes 129、Merges 1、Quantizations 377
Qwen3.6-27B-FP8	官方轻量权重，利于服务部署	主要作为部署版本
Qwen3.6-35B-A3B-FP8	官方轻量权重，利于服务部署	主要作为部署版本

按 HF Model Tree 简单相加，Qwen3.6 两个主底座已有 1,135 个衍生条目；考虑同一模型多格式重复、GGUF 多量化档位重复、镜像仓重复，去重后的有效社区模型估算 500-800 个。

5.2 社区主要微调方向

方向	占比判断	典型内容
量化	最高	GGUF、AWQ、GPTQ、AutoRound、NVFP4、FP8、IQ4_XS、Q4_K_M
代码 / Agent	高	Claude / Opus / Sonnet reasoning distill、repo-level coding、tool-call 优化
Uncensored / Abliterated	高	HauhauCS、Heretic、Huihui、AEON 等
长上下文	中	MTP 保留、KV cache 优化、YaRN 长上下文实践
中文 / 通用聊天	中	中文对话、角色、医疗 / 法律 / 教育类微调
多模态	中	保留 image-text-to-text 能力的量化与微调
行业应用	中低	安全、金融、医疗、科研、办公自动化
CoPaw / QwenPaw 二次衍生	中	围绕 QwenPaw-Flash-9B 的 GGUF、角色、tool-use、低显存部署再包装

5.3 CoPaw-Flash / QwenPaw 社区衍生

CoPaw-Flash-9B / QwenPaw-Flash-9B 因为尺寸小、Agent 定位明确、官方量化格式齐全，很容易形成二次衍生：

方向	社区玩法	数量级判断
GGUF 再分发	Q2_K、Q3_K_M、Q4_K_M、Q5_K_M、Q6_K、Q8_0 等多档位	十数个文件 / 仓库级变体
Ollama / LM Studio 包装	Modelfile、预设 system prompt、工具调用模板	低到中
Agent prompt 模板	浏览器操作、MCP、代码执行、Shell 工具调用	中
Uncensored / Roleplay	基于 9B 底座做轻量去审查或角色化	低到中
任务型微调	信息抓取、自动化办公、代码修复、网页操作	早期，数量不大

估算口径：

官方 QwenPaw / CoPaw Collection：约 7 个条目。
社区二次衍生：当前估算 20-80 个，主要集中在 GGUF / Ollama / prompt template / tool-use 包装。
相比 Qwen3.6-27B / 35B-A3B 的 500-800 有效社区模型，QwenPaw 生态还小，但方向更聚焦。

5.4 代表性社区模型

模型 / 作者	底座	特点
AgentScope/QwenPaw-Flash-9B	Qwen3.5-9B 衍生	官方 AgentScope 衍生主模型，旧称 CoPaw-Flash-9B
AgentScope/QwenPaw-Flash-9B-GGUF	QwenPaw-Flash-9B	官方 / 准官方 GGUF 分发，面向本地 Agent
AgentScope/QwenPaw-Flash-9B-AWQ	QwenPaw-Flash-9B	AWQ INT4 推理版本
unsloth/Qwen3.6-27B-GGUF	27B	高下载量 GGUF，面向 llama.cpp / LM Studio / Ollama 本地生态
unsloth/Qwen3.6-27B-NVFP4	27B	NVFP4 量化，面向新 GPU / 高效推理
DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF	27B	Uncensored + code 方向 + GGUF
HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive	27B	激进去审查方向
HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive	35B-A3B	MoE 底座去审查方向
llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved	27B	强调保留 Native MTP
llmfan46/Qwen3.6-35B-A3B-uncensored-heretic-Native-MTP-Preserved	35B-A3B	MoE + MTP 保留 + 多量化格式
z-lab/Qwen3.6-27B-DFlash	27B	压缩 / 快速推理实验
cyankiwi/Qwen3.6-27B-AWQ-INT4	27B	AWQ INT4 部署版本
ggml-org/Qwen3.6-27B-MTP-GGUF	27B	ggml / llama.cpp 生态 MTP GGUF

生态判断：Qwen3.6 社区明显偏 量化、Agent、代码、MTP 保留、长上下文、去审查实验，传统“聊天微调”占比不再是主线。

六、版本演进与代际关系

6.1 前身模型

代际	代表	关系
Qwen3	0.6B、1.7B、4B、8B、14B、32B、30B-A3B、235B-A22B 等	通用开源大模型基础代
Qwen3.5	27B、35B-A3B、122B-A10B、397B-A17B 等	更强 coding / reasoning / MoE 实验
Qwen3.6	27B、35B-A3B	小型旗舰，强调稳定、真实开发、agentic coding
Qwen3.7	Max	闭源服务化旗舰，强调长周期 Agent

6.2 本代核心改进

维度	Qwen3.6	Qwen3.7
架构	Gated DeltaNet + Gated Attention + MTP + 多模态	未公开
目标	开源权重、稳定可部署、coding / agent 实用性	长周期 Agent、复杂工具链、持续执行
上下文	262K 原生，YaRN 到约 1.01M	未公开；评测覆盖长上下文和工具链
部署	HF / ModelScope / vLLM / SGLang / KTransformers / Transformers	服务化 API
生态	社区量化和微调极快	刚发布，社区只能通过 API / Chat 评测

6.3 关键技术跃迁

Qwen3 → Qwen3.5：MoE 大模型与 coding / reasoning 能力增强。
Qwen3.5 → Qwen3.6：把能力下沉到 27B dense / 35B-A3B MoE，让中小规模模型具备接近旗舰的 coding / agent 表现。
Qwen3.6 → Qwen3.7：从“可开源部署模型”转向“Agent frontier 模型”，重点是工具调用稳定性、长周期执行和真实任务闭环。

6.4 下一代路线图

官方未披露完整 Qwen3.8 / Qwen4 路线图。按当前趋势推断：

Qwen3.7-Max 先以服务化旗舰验证 Agent 能力。
若延续 Qwen 节奏，后续可能出现 Qwen3.7-Plus / Flash API 稳定版。
是否开放 Qwen3.7 权重、是否有 27B / 35B-A3B 开源版，截至 2026-05-22 未确认。
开源侧更可能继续围绕 Agent、coding、多模态、长上下文、小 MoE / dense 高性价比模型推进。

七、硬件与部署生态

7.1 权重显存 / 内存需求估算

以下为只加载权重的粗略估算，不含长上下文 KV cache、batch、视觉输入缓存和推理框架开销。

模型	BF16 / FP16	FP8	INT4 / GGUF Q4	实用建议
Qwen3.6-27B	54-56GB	28-32GB	14-18GB	24GB 显卡可短上下文本地跑 Q4；生产长上下文需多卡
Qwen3.6-35B-A3B	70-75GB	36-42GB	18-24GB	MoE active 低但全权重要加载；12-24GB 可尝试低比特 GGUF，长上下文需降窗口
Qwen3.7-Max	未公开	未公开	不适用	仅服务化，无法本地部署

7.2 长上下文显存现实

Qwen3.6 模型卡建议：

默认上下文 262,144 tokens。
遇到 OOM 可降低上下文。
为保留复杂任务 thinking 能力，建议上下文至少 128K。
vLLM / SGLang 官方示例常用 8 GPUs 跑 262K。

实际部署判断：

场景	可行配置
4K-16K 聊天 / 代码辅助	16-24GB 消费级 GPU + Q4 / IQ4
32K-64K 仓库分析	24-48GB 显存更稳
128K 长上下文	多卡或高显存 GPU
262K 官方满上下文	推荐多卡，官方示例多为 8 卡 tensor parallel
1M YaRN 扩展	研究 / 特殊生产场景，不适合普通本地部署

7.3 推理框架支持

框架	支持状态	说明
Hugging Face Transformers	官方支持	适合测试和中低并发
vLLM	官方模型卡示例支持；推荐 vLLM >= 0.19.0	支持 OpenAI-compatible API、tool-call parser、MTP
SGLang	官方模型卡示例支持；推荐 sglang >= 0.5.10	支持 tool use、MTP、长上下文
KTransformers	官方提及支持	适合 CPU-GPU 异构与 MoE 优化实验
llama.cpp / GGUF	社区支持成熟	主要依赖 unsloth、ggml-org、bartowski、社区 GGUF
Ollama / LM Studio	通过 GGUF 间接支持	适合本地体验
TensorRT-LLM	理论可适配，公开资料少于 vLLM / SGLang	生产部署需自行验证
Docker Model Runner	HF 页面给出入口	适合快速试跑

7.4 量化生态成熟度

维度	判断
官方 FP8	成熟，官方提供 2 个 Qwen3.6 FP8 仓库
GGUF	非常活跃，Qwen3.6-27B / 35B-A3B 均有大量社区版本
AWQ / GPTQ / AutoRound	活跃，适合服务端 INT4
NVFP4	活跃，面向新硬件
MTP 保留	社区重点方向之一，但不同量化版本质量差异大
长上下文量化	可用但不稳定，KV cache 与框架版本影响大

八、Qwen3.7-Max 能力节点

公开资料显示，Qwen3.7-Max 的主要指标集中在 Agent：

指标	数值
Terminal-Bench 2.0-Terminus	69.7
SWE-Verified	80.4
SWE-Pro	60.6
SWE-Multilingual	78.3
SciCode	53.5
MCP-Mark	60.8
MCP-Atlas	76.4
SkillsBench	59.2
Kernel Bench L3	1.98x median speedup / 96% win rate
BFCL-V4	75.0
连续 Agent 测试	约 35 小时
工具调用	报道口径称 1,000+ 次工具调用

重要限制：这些指标来自官方博客 / 公开报道，Qwen3.7-Max 权重、参数、训练数据、上下文窗口、API 价格和可复现实验细节尚未完整公开。

九、数量级总表

类别	Qwen3.6	Qwen3.7
官方开源主模型	2	0
官方开源 FP8	2	0
官方 HF Collection 条目	4	0
官方服务化正式模型	至少 Plus / Max 语境存在，但公开口径不完整	1：Qwen3.7-Max
Preview 服务化模型	约 1-2，社区语境	约 2：Max-Preview / Plus-Preview
CoPaw / QwenPaw 官方衍生线	约 7 个条目，基于 Qwen3.5-9B 的 AgentScope 衍生	不计入 Qwen3.7
CoPaw / QwenPaw 社区二次衍生	估算 20-80	不适用
HF Model Tree 衍生条目	约 1,135	0
去重后社区有效模型	估算 500-800	0-10 API 包装 / 评测项目
官方专项子模型	主要整合在主模型内；同期 Qwen3 专项线很多	未公开

十、总结判断

10.1 一句话概括

Qwen3.6 是 Qwen 在开源权重生态里最实用的一代小型旗舰，Qwen3.7-Max 则是 Qwen 向闭源服务化 Agent 前沿发起冲刺的旗舰模型。

10.2 官方 / 社区数量级对比

官方 Qwen3.6 开源条目：4 个。
社区 Qwen3.6 衍生条目：HF 可见 1,100+，去重有效估算 500-800。
官方 Qwen3.7 正式模型：1 个服务化模型。
Qwen3.7 开源 / 社区微调生态：基本尚未形成。

10.3 生态健康度

维度	判断
开源活跃度	Qwen3.6 极高
社区微调速度	极快，尤其 27B 和 35B-A3B
量化成熟度	高，但版本质量差异大
部署框架支持	vLLM / SGLang / Transformers / KTransformers 支持强
多模态生态	官方能力强，社区本地部署仍比纯文本复杂
Agent 方向	Qwen3.7-Max 明确强化，Qwen3.6 是开源侧主力
风险	Qwen3.7 信息不完整；Qwen3.6 社区模型重复和质量分层严重

10.4 趋势判断

开源侧：Qwen3.6-27B 和 Qwen3.6-35B-A3B 会继续成为本地 Agent / coding / 长上下文实验的热门底座。
服务侧：Qwen3.7-Max 代表 Qwen 正把竞争焦点从 benchmark 迁移到“真实长周期任务”。
社区侧：量化、MTP 保留、uncensored、Claude / Opus reasoning distill、repo-level coding 会继续扩张。
商业侧：Qwen3.7 如果 API 稳定且价格有优势，会直接进入 Claude Code / OpenCode / OpenClaw / DevRel 自动化工作流。
下一阶段看点：是否发布 Qwen3.7-27B / 35B-A3B 开源权重，以及 Qwen3.7-Max 是否开放稳定 API、价格和系统卡。

参考来源

Qwen3.6-35B-A3B Hugging Face 模型卡：https://huggingface.co/Qwen/Qwen3.6-35B-A3B
Qwen3.6-27B Hugging Face 模型卡：https://huggingface.co/Qwen/Qwen3.6-27B
Qwen3.6 Hugging Face Collection：https://huggingface.co/collections/Qwen/qwen36
QwenPaw-Flash / CoPaw-Flash Hugging Face Collection：https://huggingface.co/collections/agentscope-ai/copaw-flash
QwenPaw-Flash-9B Hugging Face 模型卡：https://huggingface.co/agentscope-ai/QwenPaw-Flash-9B
Qwen3.7: The Agent Frontier，Alibaba Cloud Community：https://www.alibabacloud.com/blog/qwen3-7-the-agent-frontier_603154
Qwen3.6-35B-A3B vLLM Recipes：https://recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B
Qwen3.6-27B vLLM Recipes：https://recipes.vllm.ai/Qwen/Qwen3.6-27B
TechNode：Alibaba introduces Qwen3.7-Max as next-gen AI agent model，https://technode.com/2026/05/21/alibaba-introduces-qwen3-7-max-as-next-gen-ai-agent-model/
CnTechPost：Alibaba releases Qwen3.7-Max agent model，https://cntechpost.com/2026/05/20/alibaba-releases-qwen3-7-max-agent-model-tackle-complex-ai-workflows/
Qwen3 Technical Report：https://arxiv.org/abs/2505.09388
Qwen-Scope：https://arxiv.org/abs/2605.11887

信息来源说明：本调研基于 Qwen 官方博客 / Alibaba Cloud Community、Hugging Face 官方 Qwen 模型卡、Hugging Face Collection、vLLM recipes、ModelScope / 第三方模型平台索引、TechNode / CnTechPost 等公开资料整理。Qwen3.7 仍处于刚发布阶段，部分信息仅有服务化模型与媒体报道，未公开权重、参数规模和完整模型卡；下文出现此类数据时统一标注"未公开"或"估算"。

一、核心结论

Qwen3.6 官方开源家族数量：4 个 Hugging Face 官方条目，分别为 Qwen3.6-35B-A3B、Qwen3.6-35B-A3B-FP8、Qwen3.6-27B、Qwen3.6-27B-FP8。
Qwen3.6 核心定位：面向 agentic coding、仓库级推理、多模态理解、长上下文与本地 / 私有化部署的开源权重模型线。
Qwen3.7 当前官方公开形态：Qwen3.7-Max，服务化 / 闭源旗舰 Agent 模型；公开权重数量为 0。
Qwen3.7 Preview 形态：公开报道和社区测试中出现 Qwen3.7-Max-Preview、Qwen3.7-Plus-Preview；是否作为正式模型计数，需等 Qwen 官方模型卡 / API 文档确认。
CoPaw-Flash / QwenPaw-Flash 口径：这是一条重要的官方 AgentScope 衍生线，旧名 CoPaw-Flash、现名 QwenPaw-Flash；它不是 Qwen3.6 主家族成员，但代表“官方专项微调 + Flash 小模型 + Agent 数据蒸馏”的路线。
生态规模：Qwen3.6 两个主底座在 HF Model Tree 下已有 约 1,100+ 衍生条目，其中量化模型占大头；去重后有效社区模型估算 500-800 个。
代际方向：Qwen3.6 解决“开源可用、开发者能跑、工具能接”；Qwen3.7 重点冲“长周期自主 Agent、复杂工具链、35 小时级连续任务”。

二、基础背景

2.1 系列名称与团队

项目	内容
模型系列	Qwen3.6 / Qwen3.7
开发团队	Alibaba Cloud / Qwen Team / 通义千问团队
所属公司	阿里巴巴集团 / 阿里云
前身	Qwen3、Qwen3.5、Qwen3-Next、Qwen3-Coder 等
开源平台	Hugging Face、ModelScope
服务入口	Qwen Chat、DashScope / Alibaba Cloud Model Studio、第三方 API 平台

2.2 首次发布时间

时间	事件	说明
2026-02	Qwen3.5 系列发布	Qwen3.6 的直接前身
2026-04	Qwen3.6-35B-A3B 发布	官方称为 Qwen3.6 第一个 open-weight 版本
2026-04	Qwen3.6-27B 发布	27B dense 多模态模型，主打旗舰级 coding 能力
2026-05-20 / 05-21	Qwen3.7-Max 发布	面向 Agent 工作负载的闭源服务化旗舰

2.3 开源协议

系列	权重状态	协议
Qwen3.6-35B-A3B	开源权重	Apache-2.0
Qwen3.6-27B	开源权重	Apache-2.0
Qwen3.6 FP8 版本	官方量化权重	Apache-2.0
Qwen3.7-Max	未开放权重	服务化 / 闭源，协议未按开源模型披露

2.4 基座架构与原生能力

模型	架构	参数	上下文	原生能力
Qwen3.6-27B	Dense + Vision Encoder + Gated DeltaNet / Gated Attention 混合结构	27B	262,144 tokens，YaRN 可扩展到约 1,010,000	文本、图像、视频输入，代码、工具调用、长上下文
Qwen3.6-35B-A3B	MoE + Vision Encoder + Gated DeltaNet / Gated Attention 混合结构	35B total / 3B active	262,144 tokens，YaRN 可扩展到约 1,010,000	多模态、代码、Agent、工具调用、长视频 / 长文档
Qwen3.7-Max	未公开	未公开	未公开；官方评测覆盖 128K MRCR-v2 等长上下文任务	复杂 Agent、代码调试、办公自动化、长周期工具调用

关键判断：Qwen3.6 的技术核心在于组合 Gated DeltaNet、Gated Attention、MTP、多模态 Encoder、262K 长上下文，已经超出传统 Transformer Dense/MoE 二分；Qwen3.7-Max 则进一步把能力目标从“模型能力”推向“Agent 稳定执行能力”。

三、官方完整家族

3.1 Qwen3.6 官方开源家族

Hugging Face 官方 Qwen3.6 Collection 当前显示 4 个条目：

模型	类型	参数	架构	上下文	发布时间	备注
Qwen3.6-35B-A3B	主模型	35B / 3B active	MoE，多模态	262K，可扩展约 1.01M	2026-04	首个 Qwen3.6 open-weight 版本
Qwen3.6-35B-A3B-FP8	官方量化	35B / 3B active	MoE，多模态	262K	2026-04	官方 FP8 权重
Qwen3.6-27B	主模型	27B	Dense，多模态	262K，可扩展约 1.01M	2026-04	旗舰级 coding dense 模型
Qwen3.6-27B-FP8	官方量化	27B	Dense，多模态	262K	2026-04	官方 FP8 权重

官方开源版本总数：4。

3.2 Qwen3.7 官方服务化家族

模型	类型	权重	参数	上下文	发布时间	状态
Qwen3.7-Max	服务化旗舰	未开放	未公开	未公开	2026-05-20 / 05-21	已发布 / API 即将或逐步开放
Qwen3.7-Max-Preview	预览版	未开放	未公开	未公开	2026-05	社区和媒体报道出现
Qwen3.7-Plus-Preview	预览版	未开放	未公开	未公开	2026-05	社区和媒体报道出现

Qwen3.7 已确认正式模型数量：1（Qwen3.7-Max）。
Qwen3.7 公开权重数量：0。
若把 Preview 名称也计入服务化变体：约 3 个。

3.3 Flash / Plus / Max

层级	Qwen3.6	Qwen3.7	说明
Flash	未见 Qwen3.6 官方开源权重同名模型	未确认	通常为服务化轻量 / 低价路线，需等 DashScope 文档
Plus	Qwen3.6-Plus 在社区和 API 语境出现，但缺少公开权重模型卡	Qwen3.7-Plus-Preview 出现在公开测试语境	服务化中档模型
Max	Qwen3.6-Max-Preview 在社区语境出现	Qwen3.7-Max 正式发布	闭源旗舰，面向复杂 Agent

口径说明：开源权重统计以 Hugging Face Qwen 官方 Collection 为准；Plus / Max 这类服务化版本应与开源权重分开统计。

四、官方衍生 / 子模型 / 专用模型

4.1 Qwen3.6 官方专项方向

Qwen3.6 本身没有拆成 Qwen3.6-Coder、Qwen3.6-Agent、Qwen3.6-LongContext 等独立命名专用模型；它把专项能力整合进主模型：

方向	代表	数量
Agentic Coding	Qwen3.6-27B、Qwen3.6-35B-A3B	2 个主模型
多模态	两个主模型均带 Vision Encoder	2 个主模型
长上下文	两个主模型均 262K 原生上下文，可扩展约 1.01M	2 个主模型
官方 FP8 量化	Qwen3.6-27B-FP8、Qwen3.6-35B-A3B-FP8	2 个量化版本
MTP / 推理加速	模型卡明确支持 multi-step MTP	2 个主模型

4.2 Qwen3 生态同期专项模型

这些不是 Qwen3.6 / Qwen3.7 命名，但属于同一 Qwen3 代际生态：

方向	官方系列	数量级
代码	Qwen3-Coder、Qwen3-Coder-Next	数个模型 / Collection
多模态	Qwen3-VL、Qwen3-Omni	多尺寸、多变体
Embedding / Reranking	Qwen3-Embedding、Qwen3-Reranker、Qwen3-VL-Embedding / Reranker	0.6B / 4B / 8B 等尺寸
语音	Qwen3-ASR、Qwen3-TTS	专项模型线
安全	Qwen3Guard	安全分类 / 守护模型线
机制解释	Qwen-Scope	14 组 SAE，覆盖 7 个 Qwen3 / Qwen3.5 变体

4.3 CoPaw-Flash / QwenPaw-Flash：官方 Agent 衍生线

模型	当前官方命名	底座 / 关系	参数	定位
CoPaw-Flash-9B	QwenPaw-Flash-9B	基于 Qwen3.5-9B 的 Agent / tool-use 微调	9B	轻量 Agent、工具调用、快速任务执行
CoPaw-Flash-9B-Preview	QwenPaw-Flash-9B-Preview	早期预览	9B	预览版能力验证
CoPaw-Flash-9B-FP8	QwenPaw-Flash-9B-FP8	官方 FP8 量化	9B	低显存部署
CoPaw-Flash-9B-GGUF	QwenPaw-Flash-9B-GGUF	官方 / 准官方 GGUF 分发	9B	llama.cpp / Ollama / LM Studio 本地生态
CoPaw-Flash-9B-GPTQ-Int4	QwenPaw-Flash-9B-GPTQ-Int4	官方 / 准官方 GPTQ 量化	9B	INT4 GPU 推理
CoPaw-Flash-9B-AWQ	QwenPaw-Flash-9B-AWQ	官方 / 准官方 AWQ 量化	9B	INT4 GPU 推理
CoPaw-Flash-9B-GPTQ-Int8	QwenPaw-Flash-9B-GPTQ-Int8	官方 / 准官方 GPTQ 量化	9B	INT8 GPU 推理

该衍生线官方 Collection 数量：约 7 个条目。

它的重要性在于：

不是主模型家族：不能把它算进 Qwen3.6 官方 4 个主条目。
是官方专项微调：它代表 Qwen 官方生态在 Agent / tool-use 方向做轻量专项模型。
底座更小：9B 级别比 Qwen3.6-27B / 35B-A3B 更适合低成本本地 Agent。
量化更完整：FP8、GGUF、GPTQ、AWQ 等格式齐全，说明官方希望它直接进入本地部署生态。
与 Qwen3.7 路线呼应：Qwen3.7-Max 做闭源旗舰 Agent，QwenPaw-Flash-9B 做开源轻量 Agent，两者构成“服务化旗舰 + 本地小模型”的双线布局。

关键判断：CoPaw-Flash-9B / QwenPaw-Flash-9B 是 Qwen 生态里非常值得重点关注的“官方衍生模型”：它主攻 Agent、工具调用、轻量部署和可量化分发，不追求通用最强。

4.4 官方量化 / 蒸馏 / 轻量

类型	官方代表	数量
FP8	Qwen3.6-27B-FP8、Qwen3.6-35B-A3B-FP8	2
QwenPaw-Flash 官方量化	QwenPaw-Flash-9B-FP8 / GGUF / GPTQ / AWQ / GPTQ-Int8	约 5 个量化条目
INT4 / GGUF	Qwen3.6 官方主仓未直接发布 GGUF / INT4；QwenPaw-Flash 已有对应分发	Qwen3.6：0；QwenPaw：多格式
蒸馏 / Agent 数据微调	QwenPaw-Flash-9B 属于 Agent 专项衍生；公开细节有限	1 条主线
服务化闭源	Qwen3.7-Max	1 正式

五、社区微调生态

5.1 最活跃底座

底座	活跃原因	HF 可见量级
Qwen3.6-27B	Dense、能力强、部署相对直接，社区更易量化	Model Tree：Adapters 52、Finetunes 182、Merges 4、Quantizations 369
Qwen3.6-35B-A3B	MoE 仅 3B active，适合低成本推理和实验	Model Tree：Adapters 21、Finetunes 129、Merges 1、Quantizations 377
Qwen3.6-27B-FP8	官方轻量权重，利于服务部署	主要作为部署版本
Qwen3.6-35B-A3B-FP8	官方轻量权重，利于服务部署	主要作为部署版本

5.2 社区主要微调方向

方向	占比判断	典型内容
量化	最高	GGUF、AWQ、GPTQ、AutoRound、NVFP4、FP8、IQ4_XS、Q4_K_M
代码 / Agent	高	Claude / Opus / Sonnet reasoning distill、repo-level coding、tool-call 优化
Uncensored / Abliterated	高	HauhauCS、Heretic、Huihui、AEON 等
长上下文	中	MTP 保留、KV cache 优化、YaRN 长上下文实践
中文 / 通用聊天	中	中文对话、角色、医疗 / 法律 / 教育类微调
多模态	中	保留 image-text-to-text 能力的量化与微调
行业应用	中低	安全、金融、医疗、科研、办公自动化
CoPaw / QwenPaw 二次衍生	中	围绕 QwenPaw-Flash-9B 的 GGUF、角色、tool-use、低显存部署再包装

5.3 CoPaw-Flash / QwenPaw 社区衍生

CoPaw-Flash-9B / QwenPaw-Flash-9B 因为尺寸小、Agent 定位明确、官方量化格式齐全，很容易形成二次衍生：

方向	社区玩法	数量级判断
GGUF 再分发	Q2_K、Q3_K_M、Q4_K_M、Q5_K_M、Q6_K、Q8_0 等多档位	十数个文件 / 仓库级变体
Ollama / LM Studio 包装	Modelfile、预设 system prompt、工具调用模板	低到中
Agent prompt 模板	浏览器操作、MCP、代码执行、Shell 工具调用	中
Uncensored / Roleplay	基于 9B 底座做轻量去审查或角色化	低到中
任务型微调	信息抓取、自动化办公、代码修复、网页操作	早期，数量不大

估算口径：

官方 QwenPaw / CoPaw Collection：约 7 个条目。
社区二次衍生：当前估算 20-80 个，主要集中在 GGUF / Ollama / prompt template / tool-use 包装。
相比 Qwen3.6-27B / 35B-A3B 的 500-800 有效社区模型，QwenPaw 生态还小，但方向更聚焦。

5.4 代表性社区模型

模型 / 作者	底座	特点
AgentScope/QwenPaw-Flash-9B	Qwen3.5-9B 衍生	官方 AgentScope 衍生主模型，旧称 CoPaw-Flash-9B
AgentScope/QwenPaw-Flash-9B-GGUF	QwenPaw-Flash-9B	官方 / 准官方 GGUF 分发，面向本地 Agent
AgentScope/QwenPaw-Flash-9B-AWQ	QwenPaw-Flash-9B	AWQ INT4 推理版本
unsloth/Qwen3.6-27B-GGUF	27B	高下载量 GGUF，面向 llama.cpp / LM Studio / Ollama 本地生态
unsloth/Qwen3.6-27B-NVFP4	27B	NVFP4 量化，面向新 GPU / 高效推理
DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF	27B	Uncensored + code 方向 + GGUF
HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive	27B	激进去审查方向
HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive	35B-A3B	MoE 底座去审查方向
llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved	27B	强调保留 Native MTP
llmfan46/Qwen3.6-35B-A3B-uncensored-heretic-Native-MTP-Preserved	35B-A3B	MoE + MTP 保留 + 多量化格式
z-lab/Qwen3.6-27B-DFlash	27B	压缩 / 快速推理实验
cyankiwi/Qwen3.6-27B-AWQ-INT4	27B	AWQ INT4 部署版本
ggml-org/Qwen3.6-27B-MTP-GGUF	27B	ggml / llama.cpp 生态 MTP GGUF

生态判断：Qwen3.6 社区明显偏 量化、Agent、代码、MTP 保留、长上下文、去审查实验，传统“聊天微调”占比不再是主线。

六、版本演进与代际关系

6.1 前身模型

代际	代表	关系
Qwen3	0.6B、1.7B、4B、8B、14B、32B、30B-A3B、235B-A22B 等	通用开源大模型基础代
Qwen3.5	27B、35B-A3B、122B-A10B、397B-A17B 等	更强 coding / reasoning / MoE 实验
Qwen3.6	27B、35B-A3B	小型旗舰，强调稳定、真实开发、agentic coding
Qwen3.7	Max	闭源服务化旗舰，强调长周期 Agent

6.2 本代核心改进

维度	Qwen3.6	Qwen3.7
架构	Gated DeltaNet + Gated Attention + MTP + 多模态	未公开
目标	开源权重、稳定可部署、coding / agent 实用性	长周期 Agent、复杂工具链、持续执行
上下文	262K 原生，YaRN 到约 1.01M	未公开；评测覆盖长上下文和工具链
部署	HF / ModelScope / vLLM / SGLang / KTransformers / Transformers	服务化 API
生态	社区量化和微调极快	刚发布，社区只能通过 API / Chat 评测

6.3 关键技术跃迁

Qwen3 → Qwen3.5：MoE 大模型与 coding / reasoning 能力增强。
Qwen3.5 → Qwen3.6：把能力下沉到 27B dense / 35B-A3B MoE，让中小规模模型具备接近旗舰的 coding / agent 表现。
Qwen3.6 → Qwen3.7：从“可开源部署模型”转向“Agent frontier 模型”，重点是工具调用稳定性、长周期执行和真实任务闭环。

6.4 下一代路线图

官方未披露完整 Qwen3.8 / Qwen4 路线图。按当前趋势推断：

Qwen3.7-Max 先以服务化旗舰验证 Agent 能力。
若延续 Qwen 节奏，后续可能出现 Qwen3.7-Plus / Flash API 稳定版。
是否开放 Qwen3.7 权重、是否有 27B / 35B-A3B 开源版，截至 2026-05-22 未确认。
开源侧更可能继续围绕 Agent、coding、多模态、长上下文、小 MoE / dense 高性价比模型推进。

七、硬件与部署生态

7.1 权重显存 / 内存需求估算

以下为只加载权重的粗略估算，不含长上下文 KV cache、batch、视觉输入缓存和推理框架开销。

模型	BF16 / FP16	FP8	INT4 / GGUF Q4	实用建议
Qwen3.6-27B	54-56GB	28-32GB	14-18GB	24GB 显卡可短上下文本地跑 Q4；生产长上下文需多卡
Qwen3.6-35B-A3B	70-75GB	36-42GB	18-24GB	MoE active 低但全权重要加载；12-24GB 可尝试低比特 GGUF，长上下文需降窗口
Qwen3.7-Max	未公开	未公开	不适用	仅服务化，无法本地部署

7.2 长上下文显存现实

Qwen3.6 模型卡建议：

默认上下文 262,144 tokens。
遇到 OOM 可降低上下文。
为保留复杂任务 thinking 能力，建议上下文至少 128K。
vLLM / SGLang 官方示例常用 8 GPUs 跑 262K。

实际部署判断：

场景	可行配置
4K-16K 聊天 / 代码辅助	16-24GB 消费级 GPU + Q4 / IQ4
32K-64K 仓库分析	24-48GB 显存更稳
128K 长上下文	多卡或高显存 GPU
262K 官方满上下文	推荐多卡，官方示例多为 8 卡 tensor parallel
1M YaRN 扩展	研究 / 特殊生产场景，不适合普通本地部署

7.3 推理框架支持

框架	支持状态	说明
Hugging Face Transformers	官方支持	适合测试和中低并发
vLLM	官方模型卡示例支持；推荐 vLLM >= 0.19.0	支持 OpenAI-compatible API、tool-call parser、MTP
SGLang	官方模型卡示例支持；推荐 sglang >= 0.5.10	支持 tool use、MTP、长上下文
KTransformers	官方提及支持	适合 CPU-GPU 异构与 MoE 优化实验
llama.cpp / GGUF	社区支持成熟	主要依赖 unsloth、ggml-org、bartowski、社区 GGUF
Ollama / LM Studio	通过 GGUF 间接支持	适合本地体验
TensorRT-LLM	理论可适配，公开资料少于 vLLM / SGLang	生产部署需自行验证
Docker Model Runner	HF 页面给出入口	适合快速试跑

7.4 量化生态成熟度

维度	判断
官方 FP8	成熟，官方提供 2 个 Qwen3.6 FP8 仓库
GGUF	非常活跃，Qwen3.6-27B / 35B-A3B 均有大量社区版本
AWQ / GPTQ / AutoRound	活跃，适合服务端 INT4
NVFP4	活跃，面向新硬件
MTP 保留	社区重点方向之一，但不同量化版本质量差异大
长上下文量化	可用但不稳定，KV cache 与框架版本影响大

八、Qwen3.7-Max 能力节点

公开资料显示，Qwen3.7-Max 的主要指标集中在 Agent：

指标	数值
Terminal-Bench 2.0-Terminus	69.7
SWE-Verified	80.4
SWE-Pro	60.6
SWE-Multilingual	78.3
SciCode	53.5
MCP-Mark	60.8
MCP-Atlas	76.4
SkillsBench	59.2
Kernel Bench L3	1.98x median speedup / 96% win rate
BFCL-V4	75.0
连续 Agent 测试	约 35 小时
工具调用	报道口径称 1,000+ 次工具调用

重要限制：这些指标来自官方博客 / 公开报道，Qwen3.7-Max 权重、参数、训练数据、上下文窗口、API 价格和可复现实验细节尚未完整公开。

九、数量级总表

类别	Qwen3.6	Qwen3.7
官方开源主模型	2	0
官方开源 FP8	2	0
官方 HF Collection 条目	4	0
官方服务化正式模型	至少 Plus / Max 语境存在，但公开口径不完整	1：Qwen3.7-Max
Preview 服务化模型	约 1-2，社区语境	约 2：Max-Preview / Plus-Preview
CoPaw / QwenPaw 官方衍生线	约 7 个条目，基于 Qwen3.5-9B 的 AgentScope 衍生	不计入 Qwen3.7
CoPaw / QwenPaw 社区二次衍生	估算 20-80	不适用
HF Model Tree 衍生条目	约 1,135	0
去重后社区有效模型	估算 500-800	0-10 API 包装 / 评测项目
官方专项子模型	主要整合在主模型内；同期 Qwen3 专项线很多	未公开

十、总结判断

10.1 一句话概括

Qwen3.6 是 Qwen 在开源权重生态里最实用的一代小型旗舰，Qwen3.7-Max 则是 Qwen 向闭源服务化 Agent 前沿发起冲刺的旗舰模型。

10.2 官方 / 社区数量级对比

官方 Qwen3.6 开源条目：4 个。
社区 Qwen3.6 衍生条目：HF 可见 1,100+，去重有效估算 500-800。
官方 Qwen3.7 正式模型：1 个服务化模型。
Qwen3.7 开源 / 社区微调生态：基本尚未形成。

10.3 生态健康度

维度	判断
开源活跃度	Qwen3.6 极高
社区微调速度	极快，尤其 27B 和 35B-A3B
量化成熟度	高，但版本质量差异大
部署框架支持	vLLM / SGLang / Transformers / KTransformers 支持强
多模态生态	官方能力强，社区本地部署仍比纯文本复杂
Agent 方向	Qwen3.7-Max 明确强化，Qwen3.6 是开源侧主力
风险	Qwen3.7 信息不完整；Qwen3.6 社区模型重复和质量分层严重

10.4 趋势判断

开源侧：Qwen3.6-27B 和 Qwen3.6-35B-A3B 会继续成为本地 Agent / coding / 长上下文实验的热门底座。
服务侧：Qwen3.7-Max 代表 Qwen 正把竞争焦点从 benchmark 迁移到“真实长周期任务”。
社区侧：量化、MTP 保留、uncensored、Claude / Opus reasoning distill、repo-level coding 会继续扩张。
商业侧：Qwen3.7 如果 API 稳定且价格有优势，会直接进入 Claude Code / OpenCode / OpenClaw / DevRel 自动化工作流。
下一阶段看点：是否发布 Qwen3.7-27B / 35B-A3B 开源权重，以及 Qwen3.7-Max 是否开放稳定 API、价格和系统卡。

参考来源

Qwen3.6-35B-A3B Hugging Face 模型卡：https://huggingface.co/Qwen/Qwen3.6-35B-A3B
Qwen3.6-27B Hugging Face 模型卡：https://huggingface.co/Qwen/Qwen3.6-27B
Qwen3.6 Hugging Face Collection：https://huggingface.co/collections/Qwen/qwen36
QwenPaw-Flash / CoPaw-Flash Hugging Face Collection：https://huggingface.co/collections/agentscope-ai/copaw-flash
QwenPaw-Flash-9B Hugging Face 模型卡：https://huggingface.co/agentscope-ai/QwenPaw-Flash-9B
Qwen3.7: The Agent Frontier，Alibaba Cloud Community：https://www.alibabacloud.com/blog/qwen3-7-the-agent-frontier_603154
Qwen3.6-35B-A3B vLLM Recipes：https://recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B
Qwen3.6-27B vLLM Recipes：https://recipes.vllm.ai/Qwen/Qwen3.6-27B
TechNode：Alibaba introduces Qwen3.7-Max as next-gen AI agent model，https://technode.com/2026/05/21/alibaba-introduces-qwen3-7-max-as-next-gen-ai-agent-model/
CnTechPost：Alibaba releases Qwen3.7-Max agent model，https://cntechpost.com/2026/05/20/alibaba-releases-qwen3-7-max-agent-model-tackle-complex-ai-workflows/
Qwen3 Technical Report：https://arxiv.org/abs/2505.09388
Qwen-Scope：https://arxiv.org/abs/2605.11887

一、核心结论

二、基础背景

2.1 系列名称与团队

2.2 首次发布时间

2.3 开源协议

2.4 基座架构与原生能力

三、官方完整家族

3.1 Qwen3.6 官方开源家族

3.2 Qwen3.7 官方服务化家族

3.3 Flash / Plus / Max

四、官方衍生 / 子模型 / 专用模型

4.1 Qwen3.6 官方专项方向

4.2 Qwen3 生态同期专项模型

4.3 CoPaw-Flash / QwenPaw-Flash：官方 Agent 衍生线

4.4 官方量化 / 蒸馏 / 轻量

五、社区微调生态

5.1 最活跃底座

5.2 社区主要微调方向

5.3 CoPaw-Flash / QwenPaw 社区衍生

5.4 代表性社区模型

六、版本演进与代际关系

6.1 前身模型

6.2 本代核心改进

6.3 关键技术跃迁

6.4 下一代路线图

七、硬件与部署生态

7.1 权重显存 / 内存需求估算

7.2 长上下文显存现实

7.3 推理框架支持

7.4 量化生态成熟度

八、Qwen3.7-Max 能力节点

九、数量级总表

十、总结判断

10.1 一句话概括

10.2 官方 / 社区数量级对比

10.3 生态健康度

10.4 趋势判断

参考来源

讨论

一、核心结论

二、基础背景

2.1 系列名称与团队

2.2 首次发布时间

2.3 开源协议

2.4 基座架构与原生能力

三、官方完整家族

3.1 Qwen3.6 官方开源家族

3.2 Qwen3.7 官方服务化家族

3.3 Flash / Plus / Max

四、官方衍生 / 子模型 / 专用模型

4.1 Qwen3.6 官方专项方向

4.2 Qwen3 生态同期专项模型

4.3 CoPaw-Flash / QwenPaw-Flash：官方 Agent 衍生线

4.4 官方量化 / 蒸馏 / 轻量

五、社区微调生态

5.1 最活跃底座

5.2 社区主要微调方向

5.3 CoPaw-Flash / QwenPaw 社区衍生

5.4 代表性社区模型

六、版本演进与代际关系

6.1 前身模型

6.2 本代核心改进

6.3 关键技术跃迁

6.4 下一代路线图

七、硬件与部署生态

7.1 权重显存 / 内存需求估算

7.2 长上下文显存现实

7.3 推理框架支持

7.4 量化生态成熟度

八、Qwen3.7-Max 能力节点

九、数量级总表

十、总结判断

10.1 一句话概括

10.2 官方 / 社区数量级对比

10.3 生态健康度

10.4 趋势判断

参考来源

讨论