结果与讨论
1. 相同操作条件下不同样品色谱指纹谱的自动峰识别及匹配虽然采用的数据处理模式各有不同,但在已有的有关色谱指纹谱质量控制的工作中,基本采用人工进行色谱指纹谱的峰识别及匹配后将峰高(或峰面积)数值输入电脑进行数据处理。这种做法不适于把指纹谱质量控制真正运用于实际。人工比对、手工输入既烦琐又容易出错,本文提出了一套方法及原则,并编程实现了对11种吴茱萸样品液相色谱指纹图谱(见图1)的自动峰匹配。 随着分析仪器技术的进步,分析仪器上保留时间的重复性越来越好,只要严格控制色谱条件就能够保证色谱峰的出峰次序不变并且保留时间差异较小, 对液相色谱即使在梯度分离的条件下保留时间差别小于1min是容易做到的,对气相色谱而言保留时间的差异甚至小于2s,在这种情况下用计算机进行色谱峰的匹配也是能够做到的。以液相色谱的峰匹配为例,液相色谱的峰宽最小在0.3min左右,如果仅考虑保留时间差别小于1min这个条件则对第一张谱图的每个色谱峰在第二张色谱图上能找到0到3个峰与之对应(1min内最多出3个峰),也就是说每个色谱峰的峰匹配可能性有0-3个,把全体色谱峰的匹配可能性排列组合就可列出所有可能的谱图匹配结果,当然有的匹配结果违反色谱峰流出次序不变的原则应被排除,在剩下的其它匹配结果中,挑选相似度最大的匹配结果作为答案输出。由于对应的色谱峰峰高越接近则相似度的计算结果越好,挑选峰高最接近的匹配结果就可以保证相似度的计算结果最大,这样可以减小运算量加快程序的运行速度。
2. 本文提出的程序是在下列三条原则的基础上进行峰匹配(流程图见图2)(略):
(1) 同一分析条件下两张指纹谱对应色谱峰的保留时间差异在合理的范围以内。(视具体情况而定,本文吴茱萸指纹谱的例子中保留时间差异小于1min);
(2) 同一分析条件下两张指纹谱的出峰次序不变。
(3) 在满足(1)、(2)的同时寻找使相似度最大(峰高最接近)的峰匹配结果。以灌阳与广元样品为例详细说明在保留时间漂移的情况下本程序是如何进行峰匹配、并给出正确的匹配结果。
众所周知,人工比较谱图进行峰匹配的做法主要是依据保留时间,在保留时间有漂移的情况下用计算机寻找相似度最大的峰匹配结果会比人工比较更可靠。此外人工比较时通常只比较大一点的色谱峰而忽略小峰,而计算机比较则可以把小色谱峰也考虑在内,这样的计算结果能反应谱图的细微差别。四川广元样品与广西灌阳样品的谱图在直观上看来是比较相似的,如果仅考虑信噪比>30的色谱峰则它们的相似度计算结果为95%,而如果考虑所有信噪比>5的色谱峰则相似度计算结果是89%,从这个结果看考虑小峰的差别能更精细的反应谱图的不同。一般来说不同品种的药材其指纹图谱差异较大而相同品种的药材指纹图谱差异较小因此本方法也有可能用作区分不同品种及产地的药材。如果利用多种道地药材的标准提取物建立了标准谱图,那么通过待测样品与标准谱图的相似度比较有可能判断样品究竟是哪一种药材,这也是今后进一步研究的目标。
3. 向量夹角余弦法与其它数据处理方法的比较 向量夹角余弦法数学概念简单、数据处理过程简便快速,在定量计算两张色谱指纹谱相似度方面有其优势,但在数据分类、特征变量的提取等其它方面,还是传统的模式识别及人工神经网络方法更有效,将来的质量控制也许应当将两者结合起来,发挥各自的优势,共同解决指纹谱质量控制的难题。