前人乃至我们之前的工作中,对伪负样本的使用,实质上是对正样本的逆向使用,将研究区域简单分为:正样本区、负样本区。
实际上可以采集到的数据是:已识别的正样本(对应已识别的正样本区),已识别的负样本(对应已识别的负样本区),未识别/无样本(对应未知区域,即未识别的正样本区+未识别的负样本区)。
伪负样本的偏差,在于未知——伪负样本——负样本这一逻辑推理上的偏差。
前人乃至我们之前的工作中,对伪负样本的使用,实质上是对正样本的逆向使用,将研究区域简单分为:正样本区、负样本区。
实际上可以采集到的数据是:已识别的正样本(对应已识别的正样本区),已识别的负样本(对应已识别的负样本区),未识别/无样本(对应未知区域,即未识别的正样本区+未识别的负样本区)。
伪负样本的偏差,在于未知——伪负样本——负样本这一逻辑推理上的偏差。