文献阅读

您所在的位置:网站首页 三维荧光光谱图怎么看出来是什么 文献阅读

文献阅读

2024-07-04 19:41| 来源: 网络整理| 查看: 265

使用平行因子分析法表征溶解性有机质荧光特性的教程

 

阅读者:张树煇

 

【核心内容】

    我们使用平行因子分析法(parallel factor analysis, PARAFAC)对三维荧光数据进行处理分析,so,平行因子分析法到底是什么,又该怎么做呢?

    PARAFAC的基础是方程(1),通过交替最小二乘法最小化方程中的残差平方和(εijk)来对三维数据建模。

 

    其中,xijk是在发射波长j和激发波长k处测得的第i个样品的荧光强度;εijk代表了噪声等不能解释的信号,也就是残差;a、b、c分别代表荧光底物的浓度,发射光谱和激发光谱;F是荧光组分的个数。

    这个方程需要一些基本的假设,底物的荧光强度需要遵循朗伯比尔定律;不同荧光组分之间没有相互作用;浓度的改变只会影响荧光组分的荧光强度,而不会导致荧光形状发生改变;并且内滤效应以及环境因素的变化对荧光的影响小到可以忽略。这其中一些影响很难完全消除,比如内滤效应,但是只要结果能得到合理的解释,PARAFAC的结果就将有效。

    向量b与c分别代表某一荧光组分的发射与激发光谱,也就是说着b与cT相乘所得的矩阵Z即为该荧光组分的EEM矩阵,混合物的EEM矩阵是所有荧光组分的荧光矩阵的加和,而每个荧光组分的荧光强度又遵循朗伯比尔定律,因此,混合物的EEM是不同荧光组分单位浓度的EEM通过浓度加权得到的和:

    也就是说,对于X中的每一个元素,都可以写成:

 

    这其实就是公式(1),只不过只有一个样品,i=1。以上就是PARAFAC的基础。

 

 

    看到这里,你已经完全掌握PARAFAC的基础知识了,接下来就让我们开始进行一个真正的PARAFAC分析。第一步显而易见是荧光数据的收集,在这一过程中有一些基本原则需要遵守。首先是样品的数量,推荐采集不少于20个样品,100个左右为佳,或者越多越好。其次,当研究在某一变化的过程对有机质荧光特性的影响时,样品最好能覆盖这个过程,例如要探究某一时间序列上有机质荧光特性的变化,最好是在实验过程中的多个时间点收集样品,而不是只在实验开始和结束的两个时间点采样。此外,正如人不能两次踏进同一条河流,即便是当下基于广泛的样品创建的模型,也不能保证它能被应用于未来所有的样本,新的数据集需要新的模型。

    获得数据之后需要对数据进行初步的处理,以校正测量时产生的偏差。不过DOM的结构复杂多变,在这里很难应用标准物质标准曲线等常见的定量校准方法。常用的校准手段有两种,一种是磷酸喹啉校正,另一种是利用纯水的拉曼信号校正,现在我们更常使用后者,将荧光强度标准化为拉曼单元(Raman Units, R.U.)。光谱仪的光源与光路有时也会对测量结果产生微小的影响,不过按照文章所说,现代的光谱仪大多能自己解决这个问题,不需要我们操心。

   如果测量时比色皿中的样品浓度较高,测量的结果还可能会受到内滤效应的影响,即激发光或发射光(主要是激发光)被样品吸收而导致的误差。内滤效应可以借助样品的紫外可见吸收光谱数据,通过一定的手段校正,当然最好还是尽量稀释一下样品,让内滤效应的影响尽可能小。

    数据初步处理的最后一步是消除水的拉曼散射和瑞利散射对数据的影响。对于瑞利散射,通常直接给他嘎了。而对于拉曼散射,则可以通过扣减水空白的方法去除。

 

    a、b、c分别是原始数据,嘎掉瑞利散射后的数据,和嘎掉瑞利散射也扣减了水拉曼的数据。注意!这张图的Ex和Em标反了。

    完成数据的校正之后,就可以借助PARAFAC进行分析了,但是在分析的一开始,并不能直接确定模型中含有几个组分是最合适的,所以最初的分析需要不断尝试,在尝试中找到最佳的模型设置。组分数太多或太少都不利于最后的分析,从我读过的文献来看,3到4个组分似乎比较好。一般来讲,随着组分数增多,模型能解释超过99%的方差才为佳,除非残差阵看起来已经非常非常像噪音。

    由于实验操作的失误或者样点选取的不好,有可能会收集到一些离群的样点,需要在正式的分析之前把它们挑出来并删掉。通常来讲删掉样本中的某一个正常的样点,不应该导致模型的结果出现很大的变化,因此如果删掉一个点会让模型有很大的变化,那就最好真的把这个点删掉。不过这样做实在太麻烦了,可以借助杠杆率来简单的判断一个点是否应该被叉出去。杠杆率是一个在0到1之间的数,代表了样品偏离均值的程度,0代表样品等于均值,1则代表样品唯一,与其他所有样品都不同。只要仔细检查一下杠杆率显著高于其他样品的样点,排除实验操作的影响后,试着删掉这样的样点,如果模型没有发生大的改变,就可以把样点留下,如果模型变得明显不同,那还是删掉吧。另外需要注意的是,在不同组分数的模型中,每个样品的杠杆率会有不同,因此需要在不同组分数的模型中都试试,并最终找到最合适的模型。

    得到合适的模型之后,可以通过四种方法对模型进行验证。第一种手段是看一看模型的残差,残差就是模型解释不了的那部分,理论上讲应该完全来自误差的影响,因此这部分应当看起来完全就是噪音的模样,如果不是,那就说明模型不能解释的部分太多,浪费了一些有用的信息,需要调整。

 

    另一种有效的手段是看一看所得到的每种组分,这些组分至少应该看起来像是一个荧光物质。简要的说,激发波长可以存在多个峰值,但发射波长只应该有一个峰;并且激发光谱与发射光谱之间怎么也要有一些重叠;两个光谱也应该尽可能平滑。如果所得到的组分的光谱看起来一点也不想一种荧光有机质,那结果很可能就只是一个数学上的解,而完全不具备现实意义。

 

    分半检验也是一种强有力的手段。将数据集分成两半,对两部分分别建模,然后比较两部分的激发和发射光谱特征。如果模型足够鲁棒,理论上两部分的光谱特征应该是极为相像的。不过需要注意的是,样品数量太少或者样品跨越的范围过大都可能会使分半检验的有效性降低。

   在确定最优组分数之后,还可以进行随机初始化分析,使用随机数作为初始估计,对一系列模型进行拟合,通过比较每个模型的拟合结果,确保结果有效。

    经过以上步骤,一个荧光有机质的PARAFAC分析就做好了。在这里需要注意的一点是,由于并不能确定每个组分究竟是什么,组分的荧光强度并不能简单的与浓度挂钩,最大荧光强度不能,使用磷酸喹啉或者水拉曼校准的相对值也不能。组分a的荧光信号比组分b高,并不意味着组分a在环境中有比组分b更高的浓度。除非能确信荧光信号来自何种物质,并使用加标等方法建立了组分浓度与荧光强度间的关系。

    PARAFAC听起来十分复杂,做起来好像也非常麻烦,不过,嘿嘿,以上全部内容都可以借助EFC轻松的实现。所以,快拿起手中的键盘,借助EFC与PARAFAC开始投稿自己的第一篇sci吧,勇敢的少年啊,快去创造奇迹!

【个人感受】    通过这篇文章,基本掌握了PARAFAC的原理和方法。

【参考文献】

STEDMON C A, BRO R. Characterizing dissolved organic matter fluorescence with parallel factor analysis: a tutorial [J]. Limnol Oceanogr-Meth, 2008, 6(572-9)



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3