魔搭社区公众号文章撰写规范

定位与调性

魔搭社区公众号面向AI开发者和研究人员，文章目标是让读者快速了解一个模型/技术的核心价值、技术架构、性能数据，并能上手使用。

调性要求：

技术导向，信息密度高，不说废话
客观准确，不夸大不贬低
简洁直接，每句话都要有信息增量
面向实践，读完能用

文章结构

必须包含

标题
引言（含开源地址）
技术内容（架构/方法/训练等）
性能表现（基准测试数据）

优选（强烈建议）

模型部署与推理（代码示例）

可选（根据内容灵活添加）

核心特性（快速概览）
模型版本（多版本对比）
效果展示（生成样例等）
模型微调
数据集使用
总结 / 写在最后

章节顺序不强制，但引言必须在最前面，技术内容应在性能表现之前。

各部分写作要求

标题

格式：模型名 + 关键动作 + 核心卖点1 + 核心卖点2

要求：

包含具体数字或对比，给读者直观感知
控制在30字以内
不使用问句、感叹号堆叠

好的标题：

"Nucleus-Image 17B开源：首个MoE架构文生图扩散模型，仅激活2B参数即超越Imagen 4"
"Mistral Medium 3.5开源：一个模型替代三个，128B稠密架构SWE-Bench 77.6%"
"DeepSeek-V4开源：1.6T参数，百万上下文，Agent能力比肩顶级闭源模型"

差的标题：

"震惊！！这个模型太强了！！快来看看！！"
"一个很厉害的新模型发布了"
"XX模型介绍"

引言

要求：

3-5句话说清楚：谁发布了什么、核心创新是什么、关键数据是什么
必须包含具体的性能数字（基准分数、参数量、加速比等）
引言后紧跟开源地址（ModelScope地址必须有，GitHub/HuggingFace等按需）
不要出现"本文将介绍""接下来我们来看"等引导语
不要在引言中写完所有技术细节，引言是概览不是摘要

示例：

NucleusAI开源了Nucleus-Image，一个拥有17B参数的文本到图像扩散模型。
该模型首次将稀疏混合专家（Sparse MoE）架构引入扩散模型领域，每次前向
传播仅激活约2B参数，在GenEval、DPG-Bench和OneIG-Bench三项基准上匹配
或超越GPT Image 1、Imagen 4等闭源模型，且完全来自预训练，未使用任何
DPO或RLHF。

开源地址：
● ModelScope：https://modelscope.cn/models/xxx
● GitHub：https://github.com/xxx

核心特性（如包含）

要求：

每条用加粗关键词开头，后跟一句话说明
每条控制在2行以内，信息密度要高
5条左右，不超过7条
不使用emoji作为列表标记（❌ 🧬、🎨、⚡）

格式示例：

**首个高质量MoE扩散模型**　17B参数仅激活约2B，大模型容量、
小模型推理成本，首次验证稀疏MoE在扩散模型中的可行性。

**纯预训练即达SOTA**　无DPO、无RL、无偏好调优，GenEval 0.87、
DPG-Bench 88.79（第一）、OneIG-Bench 0.522，超越Imagen 4。

技术内容

要求：

用读者能理解的语言解释技术，避免堆砌术语
每个技术点用加粗小标题标注，一段说清一个点
保留关键公式和架构图，但不要大段罗列推导过程
如有架构图，在图片位置标注"图片"作为占位
从论文/博客中提取核心创新，不要面面俱到

性能表现

要求：

必须使用表格展示基准数据，不要用纯文字罗列
表格中包含对比模型（至少2-3个主流竞品）
表格后用1-2句话点评关键结论
标注测试条件（分辨率、推理步数、温度、上下文长度等）
数据必须来自论文或官方发布，不可编造
表格列数不超过6列

表格示例：

| 基准 | 模型A | 模型B | 模型C |
|------|-------|-------|-------|
| GenEval | 0.87 | 0.84 | 0.87 |
| DPG-Bench | 88.79 | 88.27 | 88.32 |

部署与推理（如包含）

要求：

提供可直接运行的代码示例
代码用代码块包裹，标注语言类型（python/bash）
多种部署方式（vLLM、SGLang等）分别列出
每种给出安装命令和启动命令
关键参数加注释说明用途
单个代码块不超过30行，超出部分引导读者去GitHub查看

总结 / 写在最后（如包含）

要求：

3-5句话概括模型核心价值
回扣引言提到的核心创新和数据
不要出现"综上所述""总而言之"等套话

行文风格

必须遵守

简洁直接：每句话都要有信息增量，删掉不影响理解的修饰词
数字具体：用"17B参数"而非"大规模参数"，用"提升40.1分"而非"大幅提升"
不要重复：同一信息不要在多个章节原样出现（引言说过的数据，正文不要再抄一遍）
统一术语：全文对同一概念使用同一名称，不要混用（如"稠密"和"dense"选一个贯穿全文）
中英文混排：中文和英文/数字之间加空格，如"GenEval 达到 0.87"

禁止事项

不使用emoji作为章节标记或列表标记
不使用"本文""笔者""小编"等自称
不使用"震惊""竟然""居然"等情绪化用词
不使用"众所周知""不言而喻"等空洞表述
不在开头写"随着AI技术的快速发展"等万能开头（除非确实与主题强相关）

格式规范

章节使用统一编号（01、02、03...）或统一用加粗标题，不混用
列表项至少1-2句话，不要只有几个词
图片位置标注"图片"，后续由编辑替换
开源地址统一使用"●"作为列表符号
ModelScope地址必须包含，其他平台地址（GitHub、HuggingFace）按需添加

审稿检查清单

以下任何一项不满足，应打回修改：

标题没有具体数字或卖点
引言超过5句话，或缺少具体性能数字
缺少开源地址，或缺少ModelScope地址
同一信息在多个章节大段重复
性能数据用纯文字而非表格展示
性能表格缺少对比模型
数据无来源，或与论文/官方发布不一致
技术内容纯粹堆砌术语，缺少通俗解释
代码块超过30行且未精简
章节编号跳跃或格式不统一
术语前后不一致
使用emoji作为章节或列表标记

不同类型文章的侧重

大语言模型（LLM）

侧重：架构创新、训练方法、基准对比（编码/推理/Agent）、部署方式、推理参数推荐

图像/视频生成模型

侧重：生成效果展示（标注"图片"占位）、基准对比、架构创新、推理代码、支持的分辨率/宽高比

数据集/评测基准

侧重：数据集构成与规模、评测维度、关键发现、使用方法（下载和加载代码）

推理优化/系统工具

侧重：解决什么问题、技术方案、加速/压缩效果数据、与现有方案对比、快速实践教程