讲好一个故事

2024-07-25
Author 孙新斌
~4.95K words

如何讲好一个故事？——科研论文写作

写论文步骤

1、画一个清楚

梳理文章故事如何找准最好的故事角度？

核心是回答以下的问题：

• 我们在解决的问题是什么？

• 为什么这个问题很重要？

• 之前的方法有哪些，他们有什么问题？

• 我们方法核心是什么，有什么是只有我们可以做到的？

• 我们（将）获得什么新的认知？

如何进行投稿管理？

1、以分层方式迭代论文

核心方法：从粗到细，先列每小节的标题，再每个小节里面列要点，不断迭代完整要点，最后整合成这一小节的内容

第一步：列每小节的标题

第二步：在每个小节里面列要点

第三步：不断扩充要点，填充内容

第四步：不断夯实要点，最后汇总要点，转化成这小节的文字

2、论文迭代流程

1. 论文标题

需要多次修改

2. 论文框架

确定各章节和小节的标题

论文框架之后，分为引言、相关工作、方法和实验四个核心部分。每个部分都包含初始的框架构建阶段和随后的完善阶段。

框架构建阶段

引言框架

列出每段想表达的要点。
不断填充和完善要点。
合作者尽早开始讨论迭代。
梳理故事思路在后面讲！

方法框架

列出每个小节的标题和要点。
展示你将如何引导读者理解你的方法。
为流程图预留位置。

实验框架

说明实验设置的要点。
列出小节标题和需要支持的论点。
为图表和表格预留位置。
列出计划进行的分析内容（无需实际结果，迭代）。

完善阶段

完善引言

要点详尽后写完整句子。
形成初稿，需要多次迭代。
画teaser figure。

完善相关工作

将框架中的内容填充完整。

完善方法

方法一般长且复杂。
可以分块展开写。
画流程图和展示图。

完善实验

填入实际的例子、数据和结果。
强调获取什么新的认知。

一份实用的论文投稿时间线

1. 投稿前一个月：起步与核心框架

目标： 完成3-4页左右的初稿。
内容： 初稿应包含引言和方法部分的关键要点。确保计划好的每一个实验都已清晰罗列。
行动： 与合作者/导师深入讨论稿件中的核心观点和实验设计。这是奠定基础的关键一步。

2. 投稿前两周：完善稿件与初步成果

目标： 形成7-8页左右的比较完整的稿件。
内容： 流程图、teaser figure（亮点图）以及实验图表都应有初步版本。此时，可能还会有一些实验正在进行或有待补充。
行动： 聚焦于论文的整体逻辑和初步成果的呈现，确保主要论点得到支持。

3. 投稿前一周：定稿冲刺与细节雕琢

目标： 完成8-10页左右的终稿，绝大部分实验和内容都已完成。
行动： 合作者应已仔细审阅并修改过文章文字和图。此阶段的主要精力应放在打磨文章的措辞、逻辑和图表质量上。减少新增内容，集中精力提升现有内容的表达。

4. 投稿前2-3天：最终检查与提交

目标： 获得一份非常完整的终稿。
行动： 此时不应再进行任何新的实验。将所有注意力放在文章的润色、语法修正和最终的细节修改上。导师进行最后一遍通读。
结局： 提交论文，然后——开香槟庆祝！

论文写作

Abstract

1.整篇文章做了一件什么事情(1句话)
2.创新点、过程或者怎么做的(2-3句话)
3.可以得到什么结果(选出重要的结论，可以只定性，尽量定量讲解，2-3句)
4.可以写出该项研究的意义(吹吹牛，1句话)
5.关键词(可能有些文章不需要，但是需要写出)

Introduction

第一段

1.给出背景信息，一般由广泛到具体来引出所研究的对象。
2.背景信息可以从现象、政策、大的全球背景、公认的某些问题等。
3.参考文献的引用是必要的(CO,is the largest source of greenhouse gases, accounting for approximately 90% of all greenhouse gases (Moraes, et al., 2020).)
4.避免一个普遍观点的文献引用超过3篇，最好只引1~2篇

引出研究内容

1.如果第一段写的面太宽，最后一句无法引出具体研究对象，可以考虑添加引出段。
2.该段的背景可以具体化，并深入引出你所研究内容的迫切性(千万不要太具体)
3.可以发现如果没有第一段，直接使用该两段作为首段也是可行的(须添加一句大方向的话)
4.个人习惯是先往大了扯，然后再慢慢收~~

文献综述段

1.这一部分是重点，关系到审稿人了解到你所掌握的知识背景有多少(如果综述文献较少，且不深入，很有可能被要求对综述部分进行提高)
2.你想综述的方面决定着这部分有几段。
3.逐步推进的方法依旧适用，例如。。。
4.对文献要有深刻的理解，避免写出xxx使用xxx做了
点评要到位，优缺点写出，并且可以前后关联引出自己想研究的主题

结论段

1.对上面进行总结，给出gap
2.说出你将要如何进行解决
3.可以将你的创新点进行总结，分点列出

准备工作

方法

评估

结论

1.避免完全看图说话
2.多以自己的结果和实验结果进行对此分析
3.可以多使用一些文献的观点来支撑你的观点4.避免一张图一解释，可以做大图标号a、b、c综合讨论
5.图片控制在8-9以内

1.对自己的工作总结一遍
2.给出一些规律或者一些有意义的数据
3.说明该项研究的意义和价值
4.给该方向或该领域提出一些展望(谈谈该工作的不足以及以后需要提高的点

示例：SketchDream: Sketch-based Text-to-3D Generation and Editing

paper code

摘要

图1展示的SketchDream系统支持通过二维草图来生成和编辑高质量的三维内容。生成部分包括：草图结合文字提示生成3D内容；编辑部分则是基于真实模型重建的NeRFs进行草图编辑。

背景：目前的基于文本生成三维内容的方法缺乏几何控制，这面临着2D到3D翻译的歧义和多模态条件集成的挑战。同时，在任意视图中对三维模型进行进一步编辑时，很难保证高质量的生成效果，保持未编辑区域的完整性，并管理形状组件之间的相互作用。

本文贡献了一个文本驱动的3D内容生成与编辑方法。该方法通过草图与NeRF实现了基于自由视图的局部编辑。

创新点在于引入了一个基于草图的多视图图像生成扩散模型，利用深度引导建立空间对应关系，解决了2D到3D的挑战。

方法采用由粗到细的处理方式：在粗略阶段，提供3D Masks标记编辑区域；在细致阶段，进行局部增强。

结论

设计了基于草图的多视图图像生成扩散模型，以补充缺失的外观并将单视图草图传播到三维空间中。
将输入的草图翻译成深度图，并利用深度图将草图变形为新的视图以建立3D对应关系。
3D ControlNet生成3D一致的多视角图像。
通过多视图扩散的3D SDS和文本到图像的2D ISM优化高质量NeRF模型。
不足之处：依然存在一些编辑生成效果不佳的样例，例如生成过于奇怪的情况；难以实现灯光、颜色、材质的细节控制；生成和编辑的时间较长（分别为1小时与1.5小时）。

介绍

段一：陈述背景，包括当前的情况和不足之处。

段二：分析国内外现状，重点讨论文本驱动生成的局限，进而引出本文的工作。

段三：讲述将草图引入过程中遇到的问题，以及现有相关方法的缺陷。

段四：讨论基于草图的编辑功能，阐述现有问题和相关方法的不足。

段五：为了克服上述问题，介绍本文的工作，包括解决的难题、设计的方案以及具体的实现方法。

段六：说明本文工作的主要作用，详细描述其框架的具体内容和流程。

段七：列出本文的贡献点。

准备工作

MVDream：基于该框架生成多视角图像，为草图到3D内容生成与编辑提供基础支持。
Score Distillation Sampling (SDS)：用于通过2D扩散模型进行文本到3D的生成优化，确保生成的3D模型质量与一致性。

方法

介绍基于草图的文本到3D内容生成和编辑框架，细分如下：

多视图扩散模型：引入一个基于草图的多视图扩散模型。该模型通过预测草图扭曲的深度图来建立空间对应关系，并生成逼真的多视图图像。
SDS与多视图扩散模型的协作：多视图扩散模型与SDS协作，以应用3D约束和草图控制。同时，预训练的2D文本到图像扩散模型用于增强生成内容的外观细节。
草图编辑框架：基于草图的编辑框架展示了其在局部编辑中的有效性，同时能够保留未编辑区域的原始特征。

4.1 基于草图的多视角扩散模型

多视角生成：对MVDream主干网络进行修改，生成4个不同视角的图像，同时添加草图图像作为输入。
深度驱动：段一描述先前的工作，引出本文内容。段二介绍所构建的深度图生成扩散模型，将草图与文本提示作为输入，输出相应的深度图。
3D注意力控制模块：应用ControlNet于预训练的MVDream中，仅输入草图和一个稍微扭曲的草图，其他三个视角为空图像，生成多视角图像。
训练过程：
1. 深度生成模型：基于2D ControlNet，将深度图代替彩色图像，使用Objaverse数据集，成对草图提取，修复VAE和ControlNet分支，训练文本到图像的UNet。
2. 基于草图的多视角生成模型：给定多视图图像和草图的数据集，输入包括五张图像与对应相机条件、两张草图和文本。

4.2 基于草图的3D生成

段一：由于4.1生成的图像存在问题，利用SDS优化，渲染五个视角的图像：草图视图图像用于控制几何图形，四个随机采样视图图像用于优化3D NeRF表示。

4.3 基于草图的3D编辑

段一：支持对生成或重建的3D模型的NeRF进行基于草图的本地编辑，设计了两种编辑阶段。

4.3.1 粗略阶段编辑

使用2D mask转换至3D空间，结合cylinder mesh模型。手绘2D草图，用户定义最大和最小深度值，渲染五个视图图像以优化NeRF。相机条件中渲染3D蒙版模型，定义图像损失。

4.3.2 精细阶段编辑

基于4.3.1生成的初始编辑结果，解决包含的不希望的更改，得到更精确的3D蒙版。将NeRF转换为Mesh，手动细化。提出局部增强策略，在局部编辑区域中单独添加扩散约束和注意力机制；利用精细阶段的2D扩散损失来改善细节。

评估

实施细节：使用两张A6000显卡进行训练，网络参数设置详述。在单张A100上生成图像需要1至1.3小时。

5.1 结果

段一：展示基于草图生成的效果，说明其质量与细节表现力。
段二：展示基于草图编辑的效果，展示编辑精度与局部修改的效果。

5.2 对比

基于草图生成：与直观的baseline进行比较，突出模型的优势。
基于草图编辑：支持基于草图和文本对真实对象进行本地编辑，并进行可视化对比。
定量研究：使用CLIP评估和用户评分进行量化分析。

5.3 消融研究

段一：介绍进行了哪些实验。
段二：分析深度图预测与草图扭曲的作用；讨论3D注意力ControlNet的贡献。
段三：评估SDS损失与2D损失的作用。
段四：分析在草图编辑中的局部增强策略的效果。

5.4 用户研究

段一：对41名调查者进行了用户验证，展示方法的有效性，绘制箱型图，并进行单因素方差分析与T检验。
段二：将草图编辑与SKED方法进行对比，采用与段一类似的方法阐述结果，突出本文方法的优势。

Neo Sun

如何讲好一个故事？——科研论文写作

如何进行投稿管理？

1、以分层方式迭代论文

2、论文迭代流程

1. 论文标题

2. 论文框架

框架构建阶段

引言框架

相关工作框架

方法框架

实验框架

完善阶段

完善引言

完善相关工作

完善方法

完善实验

1. 投稿前一个月：起步与核心框架

2. 投稿前两周：完善稿件与初步成果

3. 投稿前一周：定稿冲刺与细节雕琢

4. 投稿前2-3天：最终检查与提交

论文写作

Abstract

Introduction

相关工作

准备工作

方法

评估

结论

示例：SketchDream: Sketch-based Text-to-3D Generation and Editing

摘要

结论

介绍

相关工作

准备工作

方法

4.1 基于草图的多视角扩散模型

4.2 基于草图的3D生成

4.3 基于草图的3D编辑

4.3.1 粗略阶段编辑

4.3.2 精细阶段编辑

评估

5.1 结果

5.2 对比

5.3 消融研究

5.4 用户研究

This work is licensed under Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)