魔搭社区公众号文章撰写规范
定位与调性
魔搭社区公众号面向AI开发者和研究人员,文章目标是让读者快速了解一个模型/技术的核心价值、技术架构、性能数据,并能上手使用。
调性要求:
- 技术导向,信息密度高,不说废话
- 客观准确,不夸大不贬低
- 简洁直接,每句话都要有信息增量
- 面向实践,读完能用
文章结构
必须包含
- 标题
- 引言(含开源地址)
- 技术内容(架构/方法/训练等)
- 性能表现(基准测试数据)
优选(强烈建议)
- 模型部署与推理(代码示例)
可选(根据内容灵活添加)
- 核心特性(快速概览)
- 模型版本(多版本对比)
- 效果展示(生成样例等)
- 模型微调
- 数据集使用
- 总结 / 写在最后
章节顺序不强制,但引言必须在最前面,技术内容应在性能表现之前。
各部分写作要求
标题
格式:模型名 + 关键动作 + 核心卖点1 + 核心卖点2
要求:
- 包含具体数字或对比,给读者直观感知
- 控制在30字以内
- 不使用问句、感叹号堆叠
好的标题:
- "Nucleus-Image 17B开源:首个MoE架构文生图扩散模型,仅激活2B参数即超越Imagen 4"
- "Mistral Medium 3.5开源:一个模型替代三个,128B稠密架构SWE-Bench 77.6%"
- "DeepSeek-V4开源:1.6T参数,百万上下文,Agent能力比肩顶级闭源模型"
差的标题:
- "震惊!!这个模型太强了!!快来看看!!"
- "一个很厉害的新模型发布了"
- "XX模型介绍"
引言
要求:
- 3-5句话说清楚:谁发布了什么、核心创新是什么、关键数据是什么
- 必须包含具体的性能数字(基准分数、参数量、加速比等)
- 引言后紧跟开源地址(ModelScope地址必须有,GitHub/HuggingFace等按需)
- 不要出现"本文将介绍""接下来我们来看"等引导语
- 不要在引言中写完所有技术细节,引言是概览不是摘要
示例:
NucleusAI开源了Nucleus-Image,一个拥有17B参数的文本到图像扩散模型。
该模型首次将稀疏混合专家(Sparse MoE)架构引入扩散模型领域,每次前向
传播仅激活约2B参数,在GenEval、DPG-Bench和OneIG-Bench三项基准上匹配
或超越GPT Image 1、Imagen 4等闭源模型,且完全来自预训练,未使用任何
DPO或RLHF。
开源地址:
● ModelScope:https://modelscope.cn/models/xxx
● GitHub:https://github.com/xxx
核心特性(如包含)
要求:
- 每条用加粗关键词开头,后跟一句话说明
- 每条控制在2行以内,信息密度要高
- 5条左右,不超过7条
- 不使用emoji作为列表标记(❌ 🧬、🎨、⚡)
格式示例:
**首个高质量MoE扩散模型** 17B参数仅激活约2B,大模型容量、
小模型推理成本,首次验证稀疏MoE在扩散模型中的可行性。
**纯预训练即达SOTA** 无DPO、无RL、无偏好调优,GenEval 0.87、
DPG-Bench 88.79(第一)、OneIG-Bench 0.522,超越Imagen 4。
技术内容
要求:
- 用读者能理解的语言解释技术,避免堆砌术语
- 每个技术点用加粗小标题标注,一段说清一个点
- 保留关键公式和架构图,但不要大段罗列推导过程
- 如有架构图,在图片位置标注"图片"作为占位
- 从论文/博客中提取核心创新,不要面面俱到
性能表现
要求:
- 必须使用表格展示基准数据,不要用纯文字罗列
- 表格中包含对比模型(至少2-3个主流竞品)
- 表格后用1-2句话点评关键结论
- 标注测试条件(分辨率、推理步数、温度、上下文长度等)
- 数据必须来自论文或官方发布,不可编造
- 表格列数不超过6列
表格示例:
| 基准 | 模型A | 模型B | 模型C |
|------|-------|-------|-------|
| GenEval | 0.87 | 0.84 | 0.87 |
| DPG-Bench | 88.79 | 88.27 | 88.32 |
部署与推理(如包含)
要求:
- 提供可直接运行的代码示例
- 代码用代码块包裹,标注语言类型(python/bash)
- 多种部署方式(vLLM、SGLang等)分别列出
- 每种给出安装命令和启动命令
- 关键参数加注释说明用途
- 单个代码块不超过30行,超出部分引导读者去GitHub查看
总结 / 写在最后(如包含)
要求:
- 3-5句话概括模型核心价值
- 回扣引言提到的核心创新和数据
- 不要出现"综上所述""总而言之"等套话
行文风格
必须遵守
- 简洁直接:每句话都要有信息增量,删掉不影响理解的修饰词
- 数字具体:用"17B参数"而非"大规模参数",用"提升40.1分"而非"大幅提升"
- 不要重复:同一信息不要在多个章节原样出现(引言说过的数据,正文不要再抄一遍)
- 统一术语:全文对同一概念使用同一名称,不要混用(如"稠密"和"dense"选一个贯穿全文)
- 中英文混排:中文和英文/数字之间加空格,如"GenEval 达到 0.87"
禁止事项
- 不使用emoji作为章节标记或列表标记
- 不使用"本文""笔者""小编"等自称
- 不使用"震惊""竟然""居然"等情绪化用词
- 不使用"众所周知""不言而喻"等空洞表述
- 不在开头写"随着AI技术的快速发展"等万能开头(除非确实与主题强相关)
格式规范
- 章节使用统一编号(01、02、03...)或统一用加粗标题,不混用
- 列表项至少1-2句话,不要只有几个词
- 图片位置标注"图片",后续由编辑替换
- 开源地址统一使用"●"作为列表符号
- ModelScope地址必须包含,其他平台地址(GitHub、HuggingFace)按需添加
审稿检查清单
以下任何一项不满足,应打回修改:
- 标题没有具体数字或卖点
- 引言超过5句话,或缺少具体性能数字
- 缺少开源地址,或缺少ModelScope地址
- 同一信息在多个章节大段重复
- 性能数据用纯文字而非表格展示
- 性能表格缺少对比模型
- 数据无来源,或与论文/官方发布不一致
- 技术内容纯粹堆砌术语,缺少通俗解释
- 代码块超过30行且未精简
- 章节编号跳跃或格式不统一
- 术语前后不一致
- 使用emoji作为章节或列表标记
不同类型文章的侧重
大语言模型(LLM)
侧重:架构创新、训练方法、基准对比(编码/推理/Agent)、部署方式、推理参数推荐
图像/视频生成模型
侧重:生成效果展示(标注"图片"占位)、基准对比、架构创新、推理代码、支持的分辨率/宽高比
数据集/评测基准
侧重:数据集构成与规模、评测维度、关键发现、使用方法(下载和加载代码)
推理优化/系统工具
侧重:解决什么问题、技术方案、加速/压缩效果数据、与现有方案对比、快速实践教程
Scan to contact