葡萄的风味由口味和香味组成,涉及可溶性固形物等多个理化性质。在本文中,作者从6个因素入手,以经过训练的品评人员打分为结果,将风味评级划分为5个等级,提出了融合注意力机制的深度神经网络风味评价模型。模型经过训练后,预测分数与实际分数的平均差值为3.0分,等级预测准确率达到92.6%。本文在一定程度上对葡萄的评价起到了积极作用,为今后葡萄选种提供理论依据。<br/>The flavor of grapes is composed of taste and aroma, involving multiple physical and chemical properties such as soluble solids. In this paper, the author starts from 6 factors, divides the flavor rating into 5 grades based on the results of the trained tasters, and proposes a deep neural network flavor evaluation model integrating attention mechanism. After the model is trained, the average difference between the predicted score and the actual score is 3.0 points, and the level prediction accuracy rate reaches 92.6%. This paper has played a positive role in the evaluation of grapes to a certain extent, and provided a theoretical basis for the selection of grapes in the future.
葡萄的风味由口味和香味组成,涉及可溶性固形物等多个理化性质。在本文中,作者从6个因素入手,以经过训练的品评人员打分为结果,将风味评级划分为5个等级,提出了融合注意力机制的深度神经网络风味评价模型。模型经过训练后,预测分数与实际分数的平均差值为3.0分,等级预测准确率达到92.6%。本文在一定程度上对葡萄的评价起到了积极作用,为今后葡萄选种提供理论依据。
深度神经网络,注意力机制,风味评价,评价模型
Lei Guo1, Yu Zhang2*
1College of Information, Zhejiang Sci-Tech University, Hangzhou Zhejiang
2Zhejiang Academy of Agricultural Science, Hangzhou Zhejiang
Received: Mar. 7th, 2022; accepted: Apr. 7th, 2022; published: Apr. 14th, 2022
The flavor of grapes is composed of taste and aroma, involving multiple physical and chemical properties such as soluble solids. In this paper, the author starts from 6 factors, divides the flavor rating into 5 grades based on the results of the trained tasters, and proposes a deep neural network flavor evaluation model integrating attention mechanism. After the model is trained, the average difference between the predicted score and the actual score is 3.0 points, and the level prediction accuracy rate reaches 92.6%. This paper has played a positive role in the evaluation of grapes to a certain extent, and provided a theoretical basis for the selection of grapes in the future.
Keywords:Deep Neural Networks, Attention, Flavor Evaluation, Evaluation Model
Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
葡萄一直是我国人民最喜爱的水果之一,其食用方式涵盖鲜食、制酒、榨汁、果干等,其中鲜食比例高达80% [
以往的研究者多基于葡萄理化性质之间的关系,采用主成分分析、聚类分析等统计学方法进行分析,这些方法着重于研究葡萄数据之间的相关性及差异性,但忽略了消费者对葡萄的主观偏好因素 [
机器学习是一种多领域交叉学科,在农业等领域应用较多。目前将机器学习模型应用于葡萄相关领域,如葡萄酒品质评价已有相应的研究工作。曾祥燕 [
本文结合主观与客观数据,面向市面上最常见的六种葡萄,针对最能代表风味的六个指标 [
本文问卷参数如表1所示:
问卷信息 | 参数 |
---|---|
投放平台 | 问卷星 |
总问卷数 | 1162份 |
有效问卷数 | 1154份 |
覆盖地区 | 浙江、河北、福建、山东等15个省市地区 |
问卷者年龄区间 | 18~60岁 |
真实性判断 | 基于IP检验 |
Cronbach’s Alpha | 0.981 |
表1. 调查问卷参数
对问卷数据进行分析,口味偏好结果如图1所示。
图1. 口味问卷结果
选取2021年6月份刚刚上市的葡萄,主要有巨玫瑰、阳光玫瑰、巨峰、夏黑、醉金香、金手指。从农贸市场进货的果园订购后,放入23℃恒温保鲜室保存12 h,洗净后,筛选出外表光滑,颗粒饱满的果实,去皮、榨汁、过滤后作为备选样本。
理化性质 | 测定方法 |
---|---|
可溶性固形物 | 爱拓(ATAGO)糖度计 |
总酸 | 酸碱滴定 |
固酸比 | 计算可得 |
C6化合物及酯类 | 文献 [ |
多酚 | 福林酚比色法 |
表2. 理化性质检测方法
对上述六种葡萄进行试验,按照表2所示方法测定其理化性质,根据GB/T 10220-2012《感官分析方法学总论》采用直接打分来表征对风味的影响。根据GB/T 14195《感官分析选拔与培训感官分析优选评价员导则》对本院师生(年龄位于21~45周岁)进行感官培训,筛选出12位具有正常味觉辨识能力及描述和表达感官反应能力的品评人员,身体健康且在品评前一天未曾饮酒,并向其介绍品评标准及分数区间含义,如表3所示:
分数 | 语义描述 |
---|---|
0~10 | 极不喜欢,难以下咽 |
10~20 | 非常不喜欢 |
20~30 | 很不喜欢 |
30~40 | 不喜欢 |
40~50 | 一般 |
50~60 | 较喜欢 |
60~70 | 喜欢 |
70~80 | 很喜欢 |
80~90 | 非常喜欢 |
90~100 | 极其喜欢 |
表3. 评分标准语义描述
本文采用深度神经网络将表2所示理化性质作为输入参数,得分结果作为输出参数 [
图2. 模型结构
本模型结构分为3大部分:1) 数据处理层:对理化性质及其对应的品评得分进行数据处理,经由多层感知机特征提取以增加模型的非线性表达能力;2) 注意力层:将数据处理层提取的特征通过注意力机制训练出各特征的权重,再与特征进行相乘;3) 预测输出层:将注意力层的输出结果送入多层感知机,最终得到模型的预测得分。
深度神经网络(Deep Neural Network, DNN)是一种多层神经网络,分为输入层、隐藏层、输出层。其每一层包含一个或多个神经元,相邻层的神经元进行全连接从而构成整个深度神经网络,广泛应用于结果预测 [
X = [ x 11 ⋯ x 16 ⋮ ⋱ ⋮ x m 1 ⋯ x m 6 ] (3-1)
Y = [ y 1 ⋮ y m ] (3-2)
其中 x i 1 到 x i 6 分别为第 组的输入向量,即表2所示6个理化指标,m指输入样本数, y i 是第i组的输出结果。
利用深度神经网络解决非线性问题的核心就在于使用激活函数模拟人脑机制将神经元的特征激活然后保留关键特征并映射到下一层的输入 [
f ( x ) = { 0 , x ≤ 0 x , x > 0 (3-3)
从表达式不难看出,ReLU由于非负区间的梯度为常数,因此不存在梯度消失问题,使得模型的收敛速度维持在一个稳定状态。
注意力机制(Attention Mechanism)是在机器学习中用来自动学习和计算输入数据对输出数据的贡献大小,一般可以视作输入特征的权重。如人类视觉在看到一幅图片时,往往首先聚焦于某些重点区域,忽略掉其他非重点信息 [
图3. 注意力结构
我们采用单层全连接网络实现注意力机制,其表达式如下:
a i = f ( W T ( max ( x i ) + avg ( x i ) ) + b ) (3-4)
其中 a i 是注意力分数, f ( ⋅ ) 是Sigmoid激活函数, W T 是全连接层权重,b是全连接层偏置项, max ( ⋅ ) 和 avg ( ⋅ ) 分别是最大池化函数和平均池化函数, x i 是输入向量。
均方根误差(root mean square error, RMSE)可以很好的展示实测值和预测值之间误差的方法,能够表示所有区间内的预测误差,是深度学习中最有效的损失函数之一,其表达式如下:
RMSE = ∑ i = 1 m ( h ( x i ) − y i ) 2 m (3-5)
其中 h ( x i ) 是第i个预测值, y i 是对应的实际值,m是测试集样本数量。
选取数据总量的80%作为训练集,剩余数据作为测试集。将表2所示作为输入层,品评得分作为输出层,其表达式如下:
h 1 = f ( W 1 z + b 1 ) h 2 = f ( W 2 h 1 + b 2 ) ⋮ h m = f ( W m h m − 1 + b m ) (3-6)
其中 f ( ⋅ ) 是ReLU激活函数, W i 和 b i 分别是第i个隐藏层的权重以及偏移值,z是初始输入向量。
鉴于神经网络、支持向量机、随机森林等方法在葡萄酒品质预测上的良好表现 [
服务器配置 | 参数 |
---|---|
CPU | Intel(R) Xeon Silver 4114 |
内存 | 128GB DDR4 |
操作系统 | Ubuntu18.04 STL |
硬盘 | 1TB SSD |
编程语言 | Python3.7 |
框架 | PyTorch |
表4. 实验环境
为证明本文模型优于传统DNN模型,本文与DNN模型进行对照实验,实验结果如图4所示。可以看出本文模型在收敛速度及损失函数大小上均优于DNN模型,RMSE最终稳定在3.0,表明模型预测得分与实际得分平均分差为3.0分。
图4. RMSE随迭代次数的变化
根据表3设定的打分标准,我们将样品的等级设置为5个等级,每个等级间距为20分,因此设定预测得分和实际得分位于同一等级为正确预测,反之为错误预测。
本文对比SVM、RF等分类模型,实验结果如表5所示,结果表明本文模型准确率相较其他分类模型,准确率提升了9%~15%。
Model | 准确率 |
---|---|
SVM | 0.765 |
RF | 0.814 |
DNN without Attention | 0.833 |
DNN with Attention | 0.926 |
表5. 不同模型结果
本文采用在不同种葡萄取汁的基础上,检测其理化性质含量,并使用经过专业训练的品评人员打分作为风味偏好的唯一结果。基于此,本文使用融合注意力机制的深度神经网络进行训练,以理化性质含量为输入参数,品评人员打分为输出参数构建葡萄风味评价模型。
结论如下:RMSE稳定在3.0说明模型的预测得分与实际得分的平均差值为3.0分;划分五个等级区间,准确率达到92.6%;与对照组的模型对比,我们模型的准确度优于其他对照组模型。本文提出的融合注意力机制的DNN风味评价模型,不仅可以为葡萄育种及栽培研究提供方向及理论依据,而且为正确定位葡萄最适采摘时机提供参考。
葡萄风味评价模型的构建涉及多方面的理论与方法,本文提出的模型基于6种葡萄的6个指标,在葡萄品种和指标数量方面还有扩充的余地,进而使模型更加精准全面地表征葡萄风味。同时随着机器学习的不断发展,有望未来涌现出更好的算法来使模型预测结果的拟合度更高。
现代农业产业技术体系建设专项资金(CARS-29)。
郭 雷,张 玉. 基于神经网络对葡萄风味的研究Research on Grape Flavor Based on Neural Network[J]. 软件工程与应用, 2022, 11(02): 259-266. https://doi.org/10.12677/SEA.2022.112028