本文提出了一种基于岩屑图像的火山岩岩性识别方法,首先通过实验分析并确定了对火山岩岩屑识别率较高的颜色与纹理特征;其次通过对这些特征的组合研究,提出了基于线性加权的特征融合法;最后采用极限学习机作为分类器,对特征融合后的火山岩岩屑进行测试。最终实验表明,融合特征对于火山岩岩屑能达到92.05%的识别率,为火山岩的岩性识别提供了一种可靠的参考依据。 In this paper, a new method based on features fusion for volcanic rocks lithology recognition is proposed. First, the color and texture with higher recognition rate are analyzed and determined through experiments. Secondly, a method based on feature fusion is proposed by combining the features into a new integration feature. And finally the extreme learning machine is used as the classifier. Experiments show that the recognition accuracy of integration features is up to 92.05%. This method provides a reliable reference for lithology identification of volcanic.
罗韬,余艳梅*,滕奇志
四川大学电子信息学院图像信息研究所,四川 成都
收稿日期:2016年3月20日;录用日期:2016年4月3日;发布日期:2016年4月8日
本文提出了一种基于岩屑图像的火山岩岩性识别方法,首先通过实验分析并确定了对火山岩岩屑识别率较高的颜色与纹理特征;其次通过对这些特征的组合研究,提出了基于线性加权的特征融合法;最后采用极限学习机作为分类器,对特征融合后的火山岩岩屑进行测试。最终实验表明,融合特征对于火山岩岩屑能达到92.05%的识别率,为火山岩的岩性识别提供了一种可靠的参考依据。
关键词 :岩屑图像,特征融合,极限学习机,火山岩识别
岩屑录井是石油地质勘探的一个重要环节,而岩性的判断是岩屑录井技术的关键部分。针对岩性的判定,目前主流的方法是测井资料法 [
火山岩是因为地球内部地壳剧烈运动,岩浆沿着缝隙上升,从火山通道喷出地表形成的。高温岩浆的液态冷却会结晶形成多种矿物,矿物再紧密结合成多种火山岩。因此火山岩的成份比较复杂,表现形式也更为多种多样。为了寻找比较好的火山岩特征,我们首先通过实物来观察其主要特征,再通过实验对其进行验证。
本文选择了火山岩岩屑中比较常见的凝灰岩与玄武岩作为样本,如图1所示。从实物上来看,无论是凝灰岩还是玄武岩二者的颜色特征都很明显,区分度比较大,可以作为主要特征。另外二者表面大多有火山喷发时留下的微小气孔或者岩浆冷却结晶形成的微小颗粒,因此纹理特征也具有一定的区分度,可以作为次要特征。
为了验证观察结果,本文作者提取了岩屑识别 [
表1的数据显示颜色矩的识别效果最好,可以达到88.75%。从总体上看,颜色特征对于火山岩的区分度是最大的,其次是纹理特征,至于边缘特征基本上没有区分度,这也与上面的观察结果相吻合。而且同样是颜色特征,颜色矩与颜色直方图的效果也是存在一定的差距;纹理特征中,灰度共生矩阵与局部二进制式则相差更大。由此可见,特征的选择对于识别效果的影响比较大。上面只选择了两类样本进
行比较,为了验证这三种特征对其他类别也有效,本文作者以灰色凝灰岩、灰黑色凝灰岩、深灰色凝灰岩、杂色凝灰岩、紫色玄武岩为样本对颜色特征再次进行测试,实验结果见表2。
由表2来看,对于颜色比较相近的几类岩屑来说,颜色矩的识别率仍然在80%以上,可见颜色特征是火山岩比较重要的特征。
单个的特征往往无法完全反映样本的真实特征,因此在特征选择领域中,研究者常常将不同的特征组合成新的特征 [
图1. 火山岩岩屑样本。(a) 紫色玄武岩图;(b) 灰色凝灰岩
特征 | 颜色直方图 | 主色调直方图 | 颜色矩 | 灰度共生矩阵 | 局部二进制式 | 和差直方图 | 边缘方向直方图 |
---|---|---|---|---|---|---|---|
识别率 | 70.85% | 84.60% | 88.75% | 81.36% | 58.29% | 70.38% | 59.24% |
表1. 常用特征的火山岩识别
特征类别 岩屑类别 | 灰色凝灰岩 | 灰黑色凝灰岩 | 深灰色凝灰岩 | 杂色凝灰岩 | 紫色玄武岩 |
---|---|---|---|---|---|
颜色直方图 | 68.95% | 71.31% | 72.63% | 73.24% | 75.89% |
主色调直方图 | 73.71% | 75.66% | 83.28% | 77.49% | 80.05% |
颜色矩 | 80.15% | 81.88% | 82.46% | 82.51% | 83.43% |
表2. 颜色特征的火山岩识别
特征组合 | 主色调直方图 | 颜色矩 | 灰度共生矩阵 | 主色调直方图 +灰度共生矩阵 | 颜色矩 + 灰度共生矩阵 | 主色调直方图 + 颜色矩 | 主色调直方图 + 灰度共生矩阵 + 颜色矩 |
---|---|---|---|---|---|---|---|
特征维数 | 6维 | 9维 | 6维 | 12维 | 15维 | 15维 | 21维 |
识别率 | 84.60% | 88.75% | 81.36% | 82.14% | 87.29% | 88.38% | 77.24% |
表3. 特征维数拓展的火山岩识别
从表3可以看出对于特征的直接组合并不能提升火山岩的识别率,甚至还有可能出现大幅度下滑,究其原因在于简单的特征维数的增加,并不一定能真实的反映各个特征在样本中的比重,反而有可能造成特征的相互干扰,从而导致识别率的降低。
基于此本文提出了基于线性加权的特征融合。即在保持原有特征类别不变的情况下,将原来单纯的特征叠加方式改为依据各类别特征所占比重,将特征进行线性加权融合成新的特征。本文设定了一个加权比重值
其中
为了验证融合后特征的识别效果,本文采用相同的岩屑样本进行测试,具体情况见表4。
从表4可以看出当颜色矩特征的加权值
从数学角度来说,利用融合特征来判定岩屑的类别是一种非线性问题,前面采用的BP神经网络能够很好地拟合实验数据。但是BP神经网络需要人为设置大量的参数,训练时间过长,且容易陷入局部最优解。因此,BP神经网络并不是最合适的分类器选择。极限学习机(extreme learning machine) ELM是一种简单易用、有效的单隐层前馈神经网络(SLFNs)学习算法,2004年由南洋理工大学黄广斌副教授提出 [
给定一个N-L-T结构且激励函数为
以矩阵形式表示公式(2):
融合 特征C | 主色调 直方图 | 颜色矩 | 灰度共 生矩阵 | 主色调直方图 + 灰度共生矩阵 | 颜色矩 + 灰度共生矩阵 | 主色调直方图 + 颜色矩 |
---|---|---|---|---|---|---|
特征维数 | 6维 | 9维 | 6维 | 6维 | 9维 | 9维 |
ω取值 | 1 | 1 | 1 | 0.7 | 0.8 | 0.4 |
识别率 | 84.60% | 88.75% | 81.36% | 88.67% | 91.29% | 89.16% |
表4. 融合特征的火山岩识别
其中,
传统的单隐层前馈神经网络一般采用误差反向传播算法(BP) [
ELM则不需要再对
1) 当隐含层节点数等于输入样本数,即
以矩阵形式表示公式(5)
隐含层输出矩阵
这样公式(7)求出
2) 当样本数大于隐含层节点数,即
即:
由极小范数求解准则可以求出最小二乘解:
其中
ELM算法流程如下:
1) 训练过程:
输入:训练样本集
输出:输出权重
i. 随机生成
ii. 由输入值以及随机生成的
iii. 由公式(11)求出输出权值
2) 测试过程:
输入:测试样本集
输出:测试样本标签值
i. 由输入值确定隐含层输出矩阵
ii. 由公式(3)求出标签值
本次实验中训练样本共有340个,其中凝灰岩153个,分为灰色凝灰岩、灰黑色凝灰岩、深灰色凝灰岩、杂色凝灰岩、紫色凝灰岩这5小类;另外还有玄武岩187个,包括灰黑色玄武岩、深灰色玄武岩、杂色玄武岩、紫色玄武岩这4小类。测试样本共有422个,其中凝灰岩218个,玄武岩204个,小类划分情况与训练样本相同。本次实验采用的是融合特征,并且对BP神经网络与ELM做了对比测试,由于ELM输入权值与偏置值都是随机选择的,导致每次识别结果都有所不同,因此其识别率为多次测量取平均值,具体测试情况可以见表5。
从表5可以看出,ELM在识别率上相比于BP神经网络有一定的提升,说明ELM在火山岩的岩性识别上还是具有一定的泛化优势,能够有效识别火山岩。在时间上更是缩短为原来的1/4左右,这在工程应用上也是一个很大的提升。
为了显示工程上的实际效果,本文测试了油田部门现场采集的火山岩岩屑。如图2所示,现场图片中含有深灰色凝灰岩与杂色凝灰岩两种岩屑。
效果图中蓝色代表杂色凝灰岩,灰色代表深灰色凝灰岩,黑色空白处代表背景。图3为专家判别的真实效果图,图4与图5分别为BP神经网络与本文改进后的实际效果图。从二者的效果图来看,两种方法都能将岩屑大致识别出来,为了进一步比较二者的差异,本文计算了3、4、5效果图中各类颜色岩屑的面积以及与总岩屑面积的百分比,通过数值分析可以判别各类算法的识别效果,具体情况见表6。
岩屑类别 | 训练样本数 | 测试样本数 | 分类器 | ||||
---|---|---|---|---|---|---|---|
BP神经网络 极限学习机 | |||||||
识别情况 | 训练时间(s) | 识别情况 | 训练时间(s) | ||||
灰色凝灰岩 | 29 | 42 | 33/42 | 36/42 | |||
灰黑色凝灰岩 | 30 | 24 | 19/24 | 20/24 | |||
深灰色凝灰岩 | 28 | 47 | 42/47 | 43/47 | |||
杂色凝灰岩 | 33 | 44 | 39/44 | 40/44 | |||
紫色凝灰岩 | 33 | 61 | 55/61 | 59/61 | |||
灰黑色玄武岩 | 53 | 54 | 49/54 | 50/54 | |||
深灰色玄武岩 | 43 | 71 | 63/71 | 66/71 | |||
杂色玄武岩 | 48 | 35 | 30/35 | 32/35 | |||
紫色玄武岩 | 43 | 44 | 40/44 | 42/44 | |||
总计 | 340 | 422 | 87.7% | 12.4 | 92.05% | 3.7 |
表5. 多分类火山岩识别
图2. 现场岩屑图
图3. 专家识别效果图
图4. BP神经网络识别效果图
图5. 本文改进算法识别效果图
岩屑组分 | 面积(mm2) | 含量(%) | |
---|---|---|---|
杂色凝灰岩 | 实际含量 | 72.300 | 59.1 |
本文改进算法 | 66.585 | 54.4 | |
BP神经网络算法 | 62.764 | 51.3 | |
深灰色凝灰岩 | 实际含量 | 50.202 | 40.9 |
本文改进算法 | 55.917 | 45.6 | |
BP神经网络算法 | 59.739 | 48.7 |
表6. 岩屑成份含量表
从表6可以看出,杂色凝灰岩的真实含量占整个岩屑比例为59.1%,本文改进后的算法判别中杂色凝灰岩所占比例为54.4%,而BP神经网络算法判别中杂色凝灰岩所占比例为51.3%,相比较而言本文改进后的算法判别更贴近真实效果。
本文探索了基于岩屑图像的火山岩岩性识别法,通过观察并实验验证了以颜色,纹理,边缘为特征的火山岩岩性的识别,在此基础上提出了基于线性加权的特征融合,并将ELM分类器引入火山岩的岩屑识别过程。实验证明,改进后的方法不但可以提升火山岩的识别率,并且能够大幅度降低训练时间,在实际工程中,能够有效提高工作效率。
罗 韬,余艳梅,滕奇志. 基于岩屑图像的火山岩岩性识别 Lithologic Identification of Volcanic Based on Cutting Figures[J]. 图像与信号处理, 2016, 05(02): 58-65. http://dx.doi.org/10.12677/JISP.2016.52008