正文
MassBank
和
Norman
)确认
794
种新污染物(
ECs
)。这些
ECs
主要包括药物、杀虫剂、工业材料、个人护理品及食品添加剂等,污染物种类和丰度在三大支流汇合处的珠三角河网区达到最高值(
3661
种),随后沿下游至海洋逐步递减。在置信度最高的
92
种
EC
中,农药类占比最大,平均浓度达到
304 ng/L
,其中新烟碱类杀虫剂如噻虫嗪、噻虫胺和吡虫啉占比显著,反映出其在农业活动中的广泛使用与环境残留风险。药物类污染物中,尼古丁浓度高达
65 ng/L
,来源与烟草消费密切相关,而抗生素类如磺胺甲噁唑、磺胺喹啉等的检出提示可能的生态抗药性风险。此外,咖啡因浓度亦高(
56 ng/L
),凸显生活消费品在水体污染中的重要贡献。总体来看,城市生活污水、农业面源排放及工业输入共同驱动了区域内
ECs
的高负荷积累,并通过水文过程向下游扩散,揭示出人为活动与水体污染之间密切的空间关联。
图
1.
非靶向筛选水平定量结果
本研究提出通过引入
DOM
作为中介变量,弥合卫星遥感光谱与水体中
ECs
丰度之间的预测差距,从而提升
ECs
非靶向筛查的精度。由于
ECs
在天然水体中的浓度极低(
ng/L
级),直接利用卫星影像进行预测存在显著难度。相比之下,
DOM
在河流至海洋的连续体中广泛分布,且其光谱特征中包含部分
ECs
的光学指纹信息。基于此,研究采用
Landsat-8
与
Sentinel-2
卫星影像,结合实测
DOM
光谱及
UPLC-HRMS
的非靶向筛查数据,构建了以
DOM
为桥梁的机器学习预测框架。采用
3
种机器学习方法(
SVM
、
XGBoost
、
GPR
)与
5
种深度学习算法(
Informer
、
TCN
、
Transformer
、
CNN
、
LSTM
)进行比较,结果显示以
DOM
为中介变量的预测模型显著优于直接预测模型,其中
Informer
算法表现最佳,
R²
值达到
0.957
。与不使用
DOM
相比,深度学习预测精度提升
2.59
至
7.08
倍,机器学习方法提升
1.15
至
5.71
倍。该方法有效整合遥感数据、
DOM
信息与化学丰度特征,为实现高效、低成本的新污染物监测提供了新思路,并展示了
DOM
在污染物遥感预测中不可忽视的关键作用。
图
2.
模型预测结果与预测框架图
进一步运用可解释机器学习方法(因果推断与