讲好一个故事


如何讲好一个故事?——科研论文写作

写论文步骤

1、画一个清楚

梳理文章故事如何找准最好的故事角度?

核心是回答以下的问题:

• 我们在解决的问题是什么?

• 为什么这个问题很重要?

• 之前的方法有哪些,他们有什么问题?

• 我们方法核心是什么,有什么是只有我们可以做到的?

• 我们(将)获得什么新的认知?

如何进行投稿管理?

1、以分层方式迭代论文

核心方法:从粗到细,先列每小节的标题,再每个小节里面列要点,不断迭代完整要点,最后整合成这一小节的内容

第一步:列每小节的标题

第二步:在每个小节里面列要点

第三步:不断扩充要点,填充内容

第四步:不断夯实要点,最后汇总要点,转化成这小节的文字

2、论文迭代流程

1. 论文标题

  • 需要多次修改

2. 论文框架

  • 确定各章节和小节的标题

论文框架之后,分为引言、相关工作、方法和实验四个核心部分。每个部分都包含初始的框架构建阶段和随后的完善阶段。


框架构建阶段

引言框架

  • 列出每段想表达的要点。
  • 不断填充和完善要点。
  • 合作者尽早开始讨论迭代。
  • 梳理故事思路在后面讲!

相关工作框架

  • 列出相关的主题。
  • 每个主题下列表出要讨论的论文。
  • 要点简述打算如何评价。

方法框架

  • 列出每个小节的标题和要点。
  • 展示你将如何引导读者理解你的方法。
  • 为流程图预留位置。

实验框架

  • 说明实验设置的要点。
  • 列出小节标题和需要支持的论点。
  • 为图表和表格预留位置。
  • 列出计划进行的分析内容(无需实际结果,迭代)。

完善阶段

完善引言

  • 要点详尽后写完整句子。
  • 形成初稿,需要多次迭代。
  • 画teaser figure。

完善相关工作

  • 将框架中的内容填充完整。

完善方法

  • 方法一般长且复杂。
  • 可以分块展开写。
  • 画流程图和展示图。

完善实验

  • 填入实际的例子、数据和结果。
  • 强调获取什么新的认知。
一份实用的论文投稿时间线

1. 投稿前一个月:起步与核心框架

  • 目标: 完成3-4页左右的初稿。
  • 内容: 初稿应包含引言和方法部分的关键要点。确保计划好的每一个实验都已清晰罗列。
  • 行动: 与合作者/导师深入讨论稿件中的核心观点和实验设计。这是奠定基础的关键一步。

2. 投稿前两周:完善稿件与初步成果

  • 目标: 形成7-8页左右的比较完整的稿件。
  • 内容: 流程图、teaser figure(亮点图)以及实验图表都应有初步版本。此时,可能还会有一些实验正在进行或有待补充。
  • 行动: 聚焦于论文的整体逻辑和初步成果的呈现,确保主要论点得到支持。

3. 投稿前一周:定稿冲刺与细节雕琢

  • 目标: 完成8-10页左右的终稿,绝大部分实验和内容都已完成。
  • 行动: 合作者应已仔细审阅并修改过文章文字和图。此阶段的主要精力应放在打磨文章的措辞、逻辑和图表质量上。减少新增内容,集中精力提升现有内容的表达。

4. 投稿前2-3天:最终检查与提交

  • 目标: 获得一份非常完整的终稿。
  • 行动: 此时不应再进行任何新的实验。将所有注意力放在文章的润色、语法修正和最终的细节修改上。导师进行最后一遍通读。
  • 结局: 提交论文,然后——开香槟庆祝!

论文写作

Abstract

1.整篇文章做了一件什么事情(1句话)
2.创新点、过程或者怎么做的(2-3句话)
3.可以得到什么结果(选出重要的结论,可以只定性,尽量定量讲解,2-3句)
4.可以写出该项研究的意义(吹吹牛,1句话)
5.关键词(可能有些文章不需要,但是需要写出)

Introduction

第一段

1.给出背景信息,一般由广泛到具体来引出所研究的对象。
2.背景信息可以从现象、政策、大的全球背景、公认的某些问题等。
3.参考文献的引用是必要的(CO,is the largest source of greenhouse gases, accounting for approximately 90% of all greenhouse gases (Moraes, et al., 2020).)
4.避免一个普遍观点的文献引用超过3篇,最好只引1~2篇

引出研究内容

1.如果第一段写的面太宽,最后一句无法引出具体研究对象,可以考虑添加引出段。
2.该段的背景可以具体化,并深入引出你所研究内容的迫切性(千万不要太具体)
3.可以发现如果没有第一段,直接使用该两段作为首段也是可行的(须添加一句大方向的话)
4.个人习惯是先往大了扯,然后再慢慢收~~

文献综述段

1.这一部分是重点,关系到审稿人了解到你所掌握的知识背景有多少(如果综述文献较少,且不深入,很有可能被要求对综述部分进行提高)
2.你想综述的方面决定着这部分有几段。
3.逐步推进的方法依旧适用,例如。。。
4.对文献要有深刻的理解,避免写出xxx使用xxx做了
点评要到位,优缺点写出,并且可以前后关联引出自己想研究的主题

结论段

1.对上面进行总结,给出gap
2.说出你将要如何进行解决
3.可以将你的创新点进行总结,分点列出

相关工作

准备工作

方法

评估

结论

1.避免完全看图说话
2.多以自己的结果和实验结果进行对此分析
3.可以多使用一些文献的观点来支撑你的观点4.避免一张图一解释,可以做大图标号a、b、c综合讨论
5.图片控制在8-9以内

1.对自己的工作总结一遍
2.给出一些规律或者一些有意义的数据
3.说明该项研究的意义和价值
4.给该方向或该领域提出一些展望(谈谈该工作的不足以及以后需要提高的点

示例:SketchDream: Sketch-based Text-to-3D Generation and Editing

paper code

摘要

图1展示的SketchDream系统支持通过二维草图来生成编辑高质量的三维内容。生成部分包括:草图结合文字提示生成3D内容;编辑部分则是基于真实模型重建的NeRFs进行草图编辑。

背景:目前的基于文本生成三维内容的方法缺乏几何控制,这面临着2D到3D翻译的歧义和多模态条件集成的挑战。同时,在任意视图中对三维模型进行进一步编辑时,很难保证高质量的生成效果,保持未编辑区域的完整性,并管理形状组件之间的相互作用。

本文贡献了一个文本驱动的3D内容生成与编辑方法。该方法通过草图与NeRF实现了基于自由视图的局部编辑。

创新点在于引入了一个基于草图的多视图图像生成扩散模型,利用深度引导建立空间对应关系,解决了2D到3D的挑战。

方法采用由粗到细的处理方式:在粗略阶段,提供3D Masks标记编辑区域;在细致阶段,进行局部增强。

结论

  1. 设计了基于草图的多视图图像生成扩散模型,以补充缺失的外观并将单视图草图传播到三维空间中。
  2. 将输入的草图翻译成深度图,并利用深度图将草图变形为新的视图以建立3D对应关系。
  3. 3D ControlNet生成3D一致的多视角图像。
  4. 通过多视图扩散的3D SDS和文本到图像的2D ISM优化高质量NeRF模型。
  5. 不足之处:依然存在一些编辑生成效果不佳的样例,例如生成过于奇怪的情况;难以实现灯光、颜色、材质的细节控制;生成和编辑的时间较长(分别为1小时与1.5小时)。

介绍

段一:陈述背景,包括当前的情况和不足之处。

段二:分析国内外现状,重点讨论文本驱动生成的局限,进而引出本文的工作。

段三:讲述将草图引入过程中遇到的问题,以及现有相关方法的缺陷。

段四:讨论基于草图的编辑功能,阐述现有问题和相关方法的不足。

段五:为了克服上述问题,介绍本文的工作,包括解决的难题、设计的方案以及具体的实现方法。

段六:说明本文工作的主要作用,详细描述其框架的具体内容和流程。

段七:列出本文的贡献点。

相关工作

基于草图的3D生成

  • 段一:从早期的检索方法到深度学习发展后的各种方法,并陈述这些方法的局限性。
  • 段二:介绍本文的方法及其优点。

基于文本到图像的3D生成

  • 段一:从扩散模型到3D表示,探讨预训练2D扩散进行SDS优化等方法的不足,并说明本文方法的优点。
  • 段二:讨论3D生成的可控性,列举现有方法如make-it-3D、magic123、ImageDream、MVControl的不足。

3D内容编辑

  • 段一:分析几何编辑等方法的现状,并说明与现有作品相比,本文方法如何支持基于单视图草图的编辑,实现更复杂的编辑操作,如可控的几何修改。

准备工作

  • MVDream:基于该框架生成多视角图像,为草图到3D内容生成与编辑提供基础支持。
  • Score Distillation Sampling (SDS):用于通过2D扩散模型进行文本到3D的生成优化,确保生成的3D模型质量与一致性。

方法

介绍基于草图的文本到3D内容生成和编辑框架,细分如下:

  1. 多视图扩散模型:引入一个基于草图的多视图扩散模型。该模型通过预测草图扭曲的深度图来建立空间对应关系,并生成逼真的多视图图像。

  2. SDS与多视图扩散模型的协作:多视图扩散模型与SDS协作,以应用3D约束和草图控制。同时,预训练的2D文本到图像扩散模型用于增强生成内容的外观细节。

  3. 草图编辑框架:基于草图的编辑框架展示了其在局部编辑中的有效性,同时能够保留未编辑区域的原始特征。

4.1 基于草图的多视角扩散模型

  • 多视角生成:对MVDream主干网络进行修改,生成4个不同视角的图像,同时添加草图图像作为输入。

  • 深度驱动:段一描述先前的工作,引出本文内容。段二介绍所构建的深度图生成扩散模型,将草图与文本提示作为输入,输出相应的深度图。

  • 3D注意力控制模块:应用ControlNet于预训练的MVDream中,仅输入草图和一个稍微扭曲的草图,其他三个视角为空图像,生成多视角图像。

  • 训练过程

    1. 深度生成模型:基于2D ControlNet,将深度图代替彩色图像,使用Objaverse数据集,成对草图提取,修复VAE和ControlNet分支,训练文本到图像的UNet。
    2. 基于草图的多视角生成模型:给定多视图图像和草图的数据集,输入包括五张图像与对应相机条件、两张草图和文本。

4.2 基于草图的3D生成

  • 段一:由于4.1生成的图像存在问题,利用SDS优化,渲染五个视角的图像:草图视图图像用于控制几何图形,四个随机采样视图图像用于优化3D NeRF表示。

4.3 基于草图的3D编辑

  • 段一:支持对生成或重建的3D模型的NeRF进行基于草图的本地编辑,设计了两种编辑阶段。

4.3.1 粗略阶段编辑

  • 使用2D mask转换至3D空间,结合cylinder mesh模型。手绘2D草图,用户定义最大和最小深度值,渲染五个视图图像以优化NeRF。相机条件中渲染3D蒙版模型,定义图像损失。

4.3.2 精细阶段编辑

  • 基于4.3.1生成的初始编辑结果,解决包含的不希望的更改,得到更精确的3D蒙版。将NeRF转换为Mesh,手动细化。提出局部增强策略,在局部编辑区域中单独添加扩散约束和注意力机制;利用精细阶段的2D扩散损失来改善细节。

评估

  • 实施细节:使用两张A6000显卡进行训练,网络参数设置详述。在单张A100上生成图像需要1至1.3小时。

5.1 结果

  • 段一:展示基于草图生成的效果,说明其质量与细节表现力。
  • 段二:展示基于草图编辑的效果,展示编辑精度与局部修改的效果。

5.2 对比

  • 基于草图生成:与直观的baseline进行比较,突出模型的优势。
  • 基于草图编辑:支持基于草图和文本对真实对象进行本地编辑,并进行可视化对比。
  • 定量研究:使用CLIP评估和用户评分进行量化分析。

5.3 消融研究

  • 段一:介绍进行了哪些实验。
  • 段二:分析深度图预测与草图扭曲的作用;讨论3D注意力ControlNet的贡献。
  • 段三:评估SDS损失与2D损失的作用。
  • 段四:分析在草图编辑中的局部增强策略的效果。

5.4 用户研究

  • 段一:对41名调查者进行了用户验证,展示方法的有效性,绘制箱型图,并进行单因素方差分析与T检验。
  • 段二:将草图编辑与SKED方法进行对比,采用与段一类似的方法阐述结果,突出本文方法的优势。