好的,还是回到原来的图像编辑的话题,对于交互式的因果推理图像编辑,其实本质上是不是可以认为把多个单轮的图像编辑整合到一起,然后把每一轮之间的语义和图像信息再次利用起来,对吧 那么对于每一个单轮的交互,我希望先构造一个数据集用于训练 ...