机器学习算法在预测茉莉花茶风味品质中的应用

黄叶群1,周晗林1,童秀平1,吉伟明2,孙意岚3,饶建青4,温成荣5,庞 杰1

(1. 福建农林大学 食品科学学院,福建 福州 350002;2. 福建农林大学 计算机与信息学院,福建 福州 350002;3. 福建农林大学 海峡联合研究院 农林大数据研究中心,福建 福州 350002;4. 福建省顺昌县饶氏佰钰食品有限公司,福建 南平 353200;5. 大连工业大学 食品学院,辽宁 大连 116038)

摘 要:机器学习作为人工智能的一个子领域,因其能够在大量数据中学习模型总结经验的出色能力得到广泛应用。针对茉莉花茶风味品质预测中存在耗时耗力、客观性差、准确率低等问题,引入机器学习算法。机器学习算法作为人工智能和计算机科学的一个分支,利用数据和算法来模拟或实现人类的学习行为,在处理无关信息、提取特征变量、建立校准模型等方面具有强大能力,在食品行业有着广泛的应用。近年来,针对机器学习在茶叶加工中的应用研究报道较多,但有关该技术应用于茉莉花茶风味品质中的报道较少。本文综述了随机森林、支持向量机、卷积神经网络等常用机器学习原理模型及其对茉莉花茶风味品质预测,介绍了当前机器学习模型在其风味品质预测中物理测试、化学指标、微生物和病虫害检测研究等方面的应用,为机器学习在茉莉花茶产业发展中的应用提供参考。

关键词:机器学习;茉莉花茶;预测;风味品质;应用

茶的产业发展和加工历史十分悠久[1]。2022年11 月29 日,福州茉莉花茶窨制工艺成功入选世界非物质文化遗产名录[2]。茉莉花茶作为我国花茶中产量最多的品种,因其具有馥郁芬芳的独特香气与醇厚鲜爽的滋味,而深受消费者的喜爱。然而,茉莉花茶生产过程中风味品质形成机理不明,对其风味品质的预测大都停留在研究茉莉花香气组分和茶叶品质之间的关系,且预测方法除了易受外界环境、生理、心理等因素的影响外,还缺乏可靠的科学标准和理论依据,同时需要消耗大量的时间和人力物力。因此,快速、客观、高效地对茉莉花茶风味品质进行预测是茶产业的研究热点之一。

目前,针对茉莉花茶的风味品质预测研究及应用主要集中在感官品评[3]、成分分析检测[4]和机器学习方法[5]三个方面。其中,感官品评是茉莉花茶风味品质预测最常用的方法,其具有直观、快捷等优点,但受外界因素和品评人员的主观性影响较大,结果客观性差[6]。成分分析检测主要是借助相关检测仪器对茉莉花的挥发性呈香物质和茶的内含营养物质进行分析检测,具有客观、准确等优点,但存在花费高、耗时长、对样本破坏性大等缺点。机器学习作为传统数据处理过程的一种有效而经济的替代方法[7-9],具有自学习、容错能力强、预测准确率高等优点。因此,通过机器学习对茉莉花茶生产中的大量数据进行分析总结,从而预测其风味品质是解决该问题的方向之一。本文从传统茉莉花茶生产过程出发,阐述其生产过程中导致风味品质不稳定问题的原因,同时对当前机器学习模型在茉莉花茶风味品质预测中应用进行具体介绍,并对今后的研究方向作出展望,以期为常用机器学习方法在茉莉花茶风味品质预测应用的深入研究提供相应借鉴和参考。

1 传统茉莉花茶生产概况

传统的茉莉花茶制作工序如图1 所示:茉莉花茶常以“三窨一提”为良好标准[10],经过三次窨制与一次提花加工工序制得的茉莉花茶气韵芬芳、浓郁和鲜灵,茶汤呈现黄绿色。虽然在一定的窨制次数内,茉莉花茶的香气浓郁程度随着窨制次数增加而增加,但是当茶坯吸香饱和时,增加窨制次数并未增加其价值及意义。

图1 传统茉莉花茶制作工序流程图
Fig.1 Traditional jasmine tea processing process flow chart

茉莉花茶窨制工艺参数的研究主要包括茶坯处理的含水量、堆温、配花量、窨制时间等[11]。部分窨制工艺参数对茉莉花茶风味品质的影响见表1。

表1 部分窨制工艺参数对茉莉花茶风味品质的影响
Table 1 Influence of some process parameters on flavor quality of jasmine tea

工艺 参数 风味、品质 原因 参考文献茶坯处理的含水量3%~5% 花茶香气淡花渣出现枯黄现象 茶坯含水量偏低,茉莉鲜花枯萎[12]3%~8% 花茶香气易消散花渣多呈黄熟状态 茉莉鲜花生命力下降快7.5%~10% 花茶香气尚浓花渣少部分鲜白 茶坯含水量适中,鲜花吐香量增加8%~25% 花茶香气馥郁花渣半数鲜白 茶坯吸香能力与含水量的增大呈正相关堆温配花量窨制时间10%~30% 花茶香气持久花渣大部分鲜白 该范围内茶坯吸香能力最强低于20 ℃ 花香浓度低 温度过低,酶活性较弱20~30 ℃ 花香气较淡 温度低于30 ℃时,茶坯吸水速率下降30~40 ℃ 香气浓郁 鲜花的新陈代谢活动旺盛,酶活性较强高于40 ℃ 茉莉鲜花凋萎 酶活性逐渐降低钝化,茉莉鲜花被灼伤30%~85% 茉莉花茶香气浓度增加 茶坯香气吸附量增加96%~115% 花香浓度趋于平稳 茶坯吸香能力趋于饱和12~18 h 花茶香气增加,18 h 左右最浓 茶坯吸附的茉莉鲜花香气呈上升趋势[13][14][15]18~20 h 花茶香气减淡 茉莉鲜花完全盛开,吐香量降低

2 机器学习下茉莉花茶的风味品质预测

机器学习在茉莉花茶风味品质预测的流程如图2 所示,包括以下几个过程:(1)获取相关数据,从而建立茉莉花茶数据库;(2)对所建立的数据库中需要进行处理的数据进行准备。首先,进行预处理,提取相关的特征参数,形成特征数据样本。接着进行数据标准化,为后续的预测效率做铺垫。(3)将数据导入机器学习模型进行训练和测试,通过模型在数据集上的误差不断迭代使误差最小来训练模型,得到对数据集拟合合理的最优模型。然后,将新数据输入到所得的最优模型中进行预测,从而得到最终的预测结果。

图2 基于机器学习的茉莉花茶风味品质预测流程
Fig.2 Predictive process of jasmine tea flavor and quality based on machine learning

3 机器学习模型

根据数据集的类别信息和预测方式,机器学习被划分为传统机器学习和深度机器学习。传统机器学习(Traditional machine learning,TML)主要是在小样本数据集上进行手工提取特征,通过分析数据来平衡学习结果的有效性和学习模型的可解释性,并在有限样本可用时为解决学习问题提供框架[16]。深度学习(Deep learning,DL)则是根据预先设计的特征提取规则,从现有数据中提取特征的模式,从中获得相应的深度特征,达到降维的目的[17]。根据训练方法和训练数据是否标记,通常可分为有监督学习和无监督学习[18]。茉莉花风味品质预测属于TML 中的监督学习,常用模型有最邻近模型、决策树模型、随机森林模型、向量机模型和卷积神经网络模型等。

3.1 随机森林模型

机器学习中易出现过拟合问题,随机森林(Random forest,RF)算法则是通过构建众多的决策树(Decision tree,DT)来减小过拟合。DT是一种可分为回归树和分类树的树型结构划分的传统机器学习中的监督学习算法,主要步骤包含生长和剪枝。其剪枝是预防模型的过拟合问题。DT 中的每个内部的节点表示其对属性的判断,而分支则是将判断结果进行输出,末段叶点则是对样本分类结果的呈现。图3 中(a)图为DT 与RF 结构呈现。

图3 三种算法模型示意图
Fig.3 Three schematic diagrams of algorithm models

注:(a)决策树与随机森林模型;(b)支持向量机模型;(c)卷积神经网络模型。
Note: (a) Decision tree (DT) and Random forest (RF); (b)Support vector machine (SVM); (c) Convolutional neural network(CNN).

其误差估计公式根据公式(1)计算:

式中:Q(ti)为每个结点ti 的罚分;e(T)为训练样本集的错分样本数;Nt 为训练样本总数;k 为叶结点数。

3.2 支持向量机模型

支持向量机(Support vector machine,SVM)是一种应用于样本分类与回归的传统机器学习监督学习算法,其将分离超平面最大化后,将目标样本映射至支持向量所建设的新空间中。支持向量中的分离超平面可用于线、面及数据的分离,具有较好分类性能。SVM 主要可解决三类:样本线性、样本近似线性和样本非线性,其中,当样本低维非线性时可转化为高维度线性。故SVM 目标为取得多维度的最优分割面。图3 中(b)图为SVM 作用于二维空间分类。

3.3 卷积神经网络模型

卷积神经网络(Convolutional neural network,CNN)包括多个阶段,由卷积层、池化层和全连接层组成,用于分类与回归,为深度学习中的一种高效识别方法。示意图如图3 中(c)图所示,数据集特征提取与特征位置关系确定,后至卷积层进行卷积运算,通常池化层跟随卷积层进行特征映射维度的降低,并将卷积层与池化层成所输出的结果称为特征映射,最后由全连接层将特征映射用于图像的分类中。

通过以上各种机器学习算法的分析可知,机器学习模型的选择和应用应结合具体的场景、具体的数据特征和预测目的来选择最优模型进行使用[19]。机器学习的分类及常用算法的比较分析如表2 所示。

表2 不同机器学习算法的优缺点及改进措施
Table 2 Advantages and disadvantages of different machine learning algorithms and improvement measures

机器学习分类 算法 优点 缺点 改进措施传统机器学习决策树 可处理数据大样本预测结果可视结果可解释性强适合处理有缺失值的样本数据支持向量机 适用于数据小样本可在线学习无需依赖数据整体能处理非线性特征数据随机森林 可在高维大数据上运行不容易出现过拟合预测精度高异常值、缺失值容忍度高噪声鲁棒性能好不支持在线学习容易出现过拟合对噪声敏感占用内存大逻辑理解困难测试大样本需消耗时间长对数据缺失值敏感计算成本高决策树个数多的情况下,模型训练速度较慢对于低维数据或小数据,分类结果不是很好对决策树的树枝部分进行修剪改进向量算法来稀疏向量改进数据采样方法对算法构建过程进行优化

续表

机器学习分类 算法 优点 缺点 改进措施深度机器学习卷积神经网络 综合局部感知的数据得到全局信息可实现网络中的权值共享从而减少参数的个数具有多核性对数据的需求量很大输入的图片大小固定进行数据扩增人工神经网络 分布处理、储存能力强分类的准确度高具备自主学习的联想记忆功能能处理复杂的非线性关系需要大量参数学习时间过长测试过程为黑盒过程,无法观察学习过程结果的可解释性和可接受度差引入交叉熵成本函数加快学习速度采用正则化方法选取参数

4 机器学习在茉莉花茶风味品质预测中的应用

针对茉莉花茶的检测项目有感官检测、理化检测、微生物检测和卫生检测。机器学习可以通过分析学习茉莉花茶风味品质数据库中的数据,获取各因素之间的关系,总结经验规律,从而对其风味品质进行预测。预测内容包括物理测试、化学指标、微生物指标和病虫害检测等。

4.1 在物理测试预测上的应用研究

茉莉花茶的物理测试主要分为外形测试和内质测试两部分。外形检测是对茉莉花茶茶叶的形状、嫩度、色泽、匀整度等指标进行检测。内质检测则是通过香气、滋味、汤色、叶底等来鉴别。

首先,是考察茉莉花茶的外观品质。刘鹏等[20]利用RF 算法和SVM 算法对茉莉花茶茶叶外形特征参数进行分析,结合计算机视觉建立茉莉花茶茶叶等级评判模型,引入Kappa 参数来评估模型SVM 和RF 的性能。研究结果显示,RF 算法在Kappa 系数和整体识别率提高了0.066 和3.5%,由此可知,与SVM 模型相比,RF 模型对于茉莉花茶茶叶品,且在稳定性能和总体识别率上都优于SVM 模型,结果如表3。该方法虽然为茉莉花茶茶叶品质的实时检测开发了新思路,但其所比较的算法局限于机器学习中的两种算法,且检测的茶底品种较为单一,不具有普适性。

表3 不同分类模型的性能比较
Table 3 Performance comparison of different classification models

模型名称 Kappa 系数 总体识别率/%RF 0.933 95.75 SVM 0.867 92.25

根据Xu 等[21]所进行茉莉花茶茶叶等级识别的研究中可知,该研究利用多项式逻辑回归(Logistic regression,LR)算法将SVM 和最邻近(K-Nearest nelghbor,KNN)构建的数据模型的分类结果进行集成,同时结合电子鼻和基于决策层融合的机器视觉系统相结合进行决策,对茉莉花茶茶叶品质进行识别。该方法为机器学习技术在快速鉴定茉莉花茶茶叶品质方面提供了思路扩展。

但是,如果能引入其他机器学习算法,同时结合光谱影像法这样的其他可视化技术来对茉莉花茶茶叶样本进行拍照存底、比对,从而对茶叶外形进行分级,不仅能提高其检测的准确性,而且在一定程度上也保证了茉莉花茶的风味品质。

由于茶叶的生长环境和栽培过程会影响其内质,因此茶叶的地理溯源对茶叶品质评价也非常重要。张怡等[22]基于卷积神经网络的机器学习方法对8 种产地不同的绿茶进行识别。该研究选取4 种卷积神经网络模型结构(ResNet-18、ResNet-34、ResNet-50、ResNet-101),结合评价了4 种不同的优化算法:随机梯度下降(Stochastic gradient descent,SGD)算法,RMSprop 算法,Adam 算法和Adadelta 算法对混淆的8 种绿茶图像进行识别,发现将SGD 作为优化算法,ResNet-18 作为网络模型的效果最佳,所需训练时间最短,识别速度最快(平均单张图片识别速度为0.098 s),且准确率仅损失0.15%,结果如图4。研究结果为绿茶识别提供了一个便捷高效的新方法,同时为深度机器学习在茶叶领域的进一步利用提供了理论基础,但该研究仅挑选了8 种常见的绿茶且并未对不同季节下所采摘的绿茶样品的品质评价作进一步研究,因此该研究的绿茶品种具有一定的局限性。

图4 4 种网络模型比较示意图
Fig.4 Schematic comparison of the four network models

注:数据为3 次重复的平均值标准差(n=3);表中前两列数据不同字母表示 P<0.05,相同字母间无显著性差异。
Note: The data were mean Standard Deviation (n=3) for 3 repetitions; The data of the first two columns in the table showed different letters P<0.05, but there was no significant difference between the same letters.

以上研究实验在引入机器学习算法的方法在一定程度上为茉莉花茶在物理测试风味品质预测上拓宽了新思路,但仍存在一定的局限性,主要为以下几个方面:(1)结合的机器学习算法种类较少,且未结合其他技术。未来可结合更多高新技术,如可视化技术等,从多维度出发进行更加全面的预测,从而提高预测结果的准确度和精确性;(2)测试的茉莉花茶样本比较单一,覆盖面较窄。实验所测定的茶叶品种数量有限,且未深入探究多个季节的同种茶样的风味品质,结果客观性较差。

4.2 在化学指标预测上的应用研究

茉莉花茶茶叶内有丰富的呈味物质,主要包括茶多酚、游离氨基酸、咖啡碱等,这些物质的含量、种类以及比例的不同会使茶的品质出现差别[23]。机器学习算法主要通过与计算机视觉技术相结合,用以检测相关化学成分。

唐夏妮等[24]在检测分析32 个茉莉花茶样挥发性成分的基础上,分析了茉莉花茶的香气指数,进一步构建了32 个茉莉花茶茶样窨制品质的DT鉴定模型。确定特征挥发物的缺失峰数和茉莉花香气评价指数(Jasmine tea flavor index,JTF)值为判定节点,并且所建立的决策树模型准确率较高,为93.8%。结果表明,该模型能够快速、准确的检测出不同窨制品质的茉莉花茶,为市面上茉莉花茶窨制品质鉴定与掺假判别提供理论依据。

周天山等[25]通过兰香型茶叶共有的呈香组分进行PCA 算法分析,并建立香气质量评价模型。通过对产地不同的具有明显兰花香的1 份乌龙茶茶样和3 份绿茶茶样采用顶空-固相微萃取-气相色谱-质谱联用法测定它们的香气挥发物组分,模型结果显示香气评价模型评判结果与感官审评结果排序一致,甚至更客观,结果如图5。该方法的不足之处在于只收集了部分兰香型茶叶进行分析,所采用的机器学习算法较为单一,但其仍可作为茉莉花茶进行风味品质的智能化评估方法的一种借鉴思路。

图5 兰香型茶叶香气质量评价
Fig.5 Assessment of aroma quality in tea with orchid-like aroma

4.3 在微生物指标和病虫害检测预测上的应用研究

经相关研究报道,茶树的主要害虫是斜叶直虱和灰叶直,每年侵袭数千公顷的茶叶,对来年的茶叶产量造成严重影响[26]。微生物污染和病虫害会造成茉莉花茶原料利用率降低和品质损耗。因此在微生物检测结合机器学习技术对提高茶叶产量、防治茶树病虫害、茶叶贮藏保鲜和提高成品茶质量等方面具有重要意义。

在研究茶树病虫害方面,Sun 等[27]通过不同比例的斜孢杆菌和灰孢杆菌对茶树进行攻击,利用电子鼻进行检测。采用LR 和SVM 两种机器学习预测方法对斜叶螟和灰螟对茶树的侵染率进行了预测,并对两种预测方法的预测效果进行了比较。研究结果表明,LR 对训练集的正确率为99.10%,测试集的正确率为78.10%;SVM 对训练集的分类正确率为99.07%,测试集的正确率为91.22%,由此可见SVM 显著优于LR。

同时利用SVM 从茶树不同的损伤类型,入侵严重程度和入侵时间等方面对茶树害虫危害进行了检测。陶国柱[28]利用CNN 对茉莉花进行病虫害识别。CNN 参数改进如下:批处理大小为16,使用结合Momentum 和RMSProp 优化算法,对比算法有Momentum、RMSProp、Adam 和SGD。激活函数采用 ELU(Exponential linear unit),迭代epoch 为90,学习速率为0.001,平均衰减速率。利用Momentum 和RMSProp 算法相结合,使得优化的模型网络收敛更快,对茉莉花相关的病虫害图像识别的准确率有更大提升,识别准确率最终达到94.34%,结果如图6。

图6 5 种算法准确率和损失率比较直方图
Fig.6 Histogram comparing the accuracy and loss rate of the five algorithms

该方法对茉莉花采摘工作具有一定的实践意义,不仅降低了人工成本,也为农民防治病虫害提供了科学依据。但在一定程度上仍存在需要完善的部分,如所采集的茉莉花病虫害的样本图像种类和数量较少,需进行一定程度的扩充,且算法模型只能针对特定时期的病虫害进行识别,未来需进行优化和改进,增强模型的实用性和泛化性。

5 结语

在茉莉花茶产业中结合机器学习技术,不仅符合“十四五”国家技术智能升级和“机器换人”的国家发展新战略,也是促进茶产业健康发展的一种重要方式。未来工作可以向以下几个方面发展:(1)集中在像深度机器学习这样的高级机器学习上,根据其在训练阶段具有很强的特征学习发挥其应有的应用潜力;(2)在现有的茉莉花茶茶叶研究类型基础上增加茶样本种类的多样性,为建立不同茶叶类型的茉莉花茶风味品质预测库提供数据基础;(3)结合大数据和物联网技术,突破茉莉花茶的加工技术壁垒,创新茉莉花茶风味品质的预测方法。

参考文献:

[1] ZHAI X, ZHANG L, GRANVOGL M, et al. Flavor of tea(Camellia sinensis): A review on odorants and analytical techniques[J]. Comprehensive Reviews in Food Science and Food Safety, 2022, 21(5): 3867-3909.

[2] 赖格英, 邓名明, 马云梦, 等. 福州茉莉花茶文化系统与旅游产业耦合发展的影响因素研究[J]. 生态与农村环境学报,2022, 38(10): 1239-1248.LAI G Y, DENG M M, MA Y M, et al. Reasearch on the influencing factors of coupling development of the Fuzhou jasmine tea culture system and the tourism indurstry[J]. Journal of Ecology and Rural Environment, 2022, 38(10): 1239-1248.

[3] OUYANG J, JIANG R, CHEN H, et al. Characterization of key odorants in ‘Baimaocha’ black teas from different regions[J/OL]. Food Chemistry: X, 2024: 101303.

[4] YAN H, LI W X, ZHU Y L, et al. Comprehensive comparison of aroma profiles and chiral free and glycosidically bound volatiles in Fujian and Yunnan white teas[J/OL]. Food Chemistry, 2024:139067.

[5] AL-ORAIQAT A M, SMIRNOVA T, DRIEIEV O, et al. Method for determining treated metal surface quality using computer vision technology[J]. Sensors, 2022, 22(16): 6223.

[6] 高涛, 罗黄洋, 吴韧, 等. 主客观组合权重法在食品感官评价中的应用[J]. 食品工业科技, 2021, 42(18): 300-307.GAO T, LUO H Y, WU R, et al. Application of subjective and objective combination weighting method in food sensory evaluation[J]. Food Industry Science and Technology, 2021,42(18): 300-307.

[7] BADILLO S, BANFAI B, BIRZELE F, et al. An introduction to machine learning[J]. Clinical Pharmacology & Therapeutics,2020, 107(4): 871-885.

[8] REN G, GAN N, SONG Y, et al. Evaluating Congou black tea quality using a lab-made computer vision system coupled with morphological features and chemometrics[J]. Microchemical Journal, 2021, 160: 105600.

[9] LIU C, LU W, GAO B, et al. Rapid identification of chrysanthemum teas by computer vision and deep learning[J].Food Science & Nutrition, 2020, 8(4): 1968-1977.

[10] 朱建新. 自动窨制工艺对茉莉花茶香气品质形成的影响[D].福州:福建农林大学, 2022.ZHU J X. Effect of automatic manuring process on the formation of aroma quality of jasmine tea[D]. Fuzhou: Fujian Agriculture and Forestry University, 2022.

[11] WANG C, LI J, WU X, et al. Pu-erh tea unique aroma: Volatile components, evaluation methods and metabolic mechanism of key odor-active compounds[J]. Trends in Food Science &Technology, 2022, 124: 25-37.

[12] 卢健, 王东, 朱建杰, 等. 茉莉花茶隔离窨制中主要影响因子对挥发性组分的影响[J]. 中国食品学报, 2019, 19(1): 65-74.LU J, WANG D, ZHU J J, et al. Effects of major influencing factors on volatile fractions in the isolated manuring of jasmine tea[J]. Chinese Journal of Food, 2019, 19(1): 65-74.

[13] 叶秋萍, 余雯, 郑世仲, 等. 茉莉花茶窨制过程水分变化与香气品质变化的相关性分析[J]. 食品科学, 2022, 43(24): 266-272.YE Q P, YU W, ZHENG S Z, et al. Correlation analysis of moisture changes and aroma quality changes in jasmine tea manuring process[J]. Food Science, 2022, 43(24): 266-272.

[14] LI T, LU C, HUANG J, et al. Qualitative and quantitative analysis of the pile fermentation degree of Pu-erh tea[J]. LWT,2023, 173: 114327.

[15] 陈发来. 高窨次窨花工艺创新性发展探究[J]. 福建茶叶,2022, 44(8): 7-9.CHEN F L. Exploration on the innovative development of high manhole times celling process[J]. Tea in Fujian, 2022, 44(8): 7-9.

[16] AN H, OU X, ZHANG Y, et al. Study on the key volatile compounds and aroma quality of jasmine tea with different scenting technology[J]. Food Chemistry, 2022, 385: 132718.

[17] ADIR O, POLEY M, CHEN G, et al. Integrating artificial intelligence and nanotechnology for precision cancer medicine[J]. Advanced Materials, 2020, 32(13): 1901989.

[18] SAHA D, MANICKAVASAGAN A. Machine learning techniques for analysis of hyperspectral images to determine quality of food products: A review[J]. Current Research in Food Science, 2021,4: 28-44.

[19] MERGHADI A, YUNUS A P, DOU J, et al. Machine learning methods for landslide susceptibility studies: A comparative overview of algorithm performance[J]. Earth-Science Reviews,2020, 207: 103225.

[20] 刘鹏, 吴瑞梅, 杨普香, 等. 基于计算机视觉技术的茶叶品质随机森林感官评价方法研究[J]. 光谱学与光谱分析, 2019,39(1): 193-198.LIU P, WU R M, YANG P X, et al. Research on random forest sensory evaluation method for tea quality based on computer vision technology[J]. Spectroscopy and Spectral Analysis, 2019,39(1): 193-198.

[21] XU M, WANG J, GU S. Rapid identification of tea quality by E-nose and computer vision combining with a synergetic data fusion strategy[J]. Journal of Food Engineering, 2019, 241:10-17.

[22] 张怡, 赵珠蒙, 王校常, 等. 基于ResNet 卷积神经网络的绿茶种类识别模型构建[J]. 茶叶科学, 2021, 41(2): 261-271.ZHANG Y, ZHAO Z M, WANG X C, et al. Construction of green tea species recognition model based on ResNet convolutional neural network[J]. Tea Science, 2021, 41(2):261-271.

[23] WANG J, WANG Y, CHENG J, et al. Enhanced cross-category models for predicting the total polyphenols, caffeine and free amino acids contents in Chinese tea using NIR spectroscopy[J].LWT, 2018, 96: 90-97.

[24] 唐夏妮, 夏益民, 雷永宏, 等. 利用茉莉花茶香气指数鉴定其窨制品质及构建决策树模型[J]. 茶叶科学, 2016, 36(6):646-654.TANG X N, XIA Y M, LEI Y H, et al. Identification of jasmine tea aroma indices for its cellar quality and construction of decision tree model[J]. Tea Science, 2016, 36(6): 646-654.

[25] 周天山, 米晓玲, 余有本, 等. 兰香型茶叶香气组分主成分分析[J]. 西北林学院学报, 2016, 31(1): 254-259.ZHOU T S, MI X L, YU Y B, et al. Principal component analysis of aroma components of orchid tea[J]. Journal of Northwest Forestry Academy, 2016, 31(1): 254-259.

[26] WANG D, LI C F, MA C L, et al. Novel insights into the molecular mechanisms underlying the resistance of Camellia sinensis to Ectropis oblique provided by strategic transcriptomic comparisons[J]. Scientia Horticulturae, 2015, 192: 429-440.

[27] SUN J, ZHOU X, HU Y G, et al. Visualizing distribution of moisture content in tea leaves using optimization algorithms and NIR hyperspectral imaging[J]. Computers and Electronics in Agriculture, 2019, 160: 153-159.

[28] 陶国柱. 基于卷积神经网络的茉莉花病虫害识别算法研究[D]. 南宁:广西民族大学, 2021.TAO G Z. Research on jasmine pest identification algorithm based on convolutional neural network[D]. Nanning: Guangxi University for Nationalities, 2021.

备注:本文的彩色图表可从本刊官网(http//lyspkj.ijournal.cn)、中国知网、万方、维普、超星等数据库下载获取。

Application of Machine Learning Algorithms in Predicting Flavor and Quality of Jasmine Tea

HUANG Ye-qun1, ZHOU Han-lin1, TONG Xiu-ping1, JI Wei-ming2, SUN Yi-lan3,RAO Jian-qing4, WEN Cheng-rong5, PANG Jie1

(1. College of Food Science, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China;2. School of Computer and Information Sciences, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China; 3. Center for Agroforestry Mega Data Science, Haixia Institute of Science and Technology,Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China; 4. Fujian Shunchang Rao’s Baiyu Food Co., Ltd., Nanping, Fujian 353200, China 5. School of Food Science and Technology, Dalian Polytechnic University, Dalian, Liaoning 116038, China)

Abstract: As a subfield of artificial intelligence, machine learning has gained widespread application due to its exceptional ability to learn models and summarize experiences from large datasets. To address the issues of time consumption, labor intensity, poor objectivity, and low accuracy in the flavor quality prediction of jasmine tea, machine learning algorithms were introduced. As a branch of artificial intelligence and computer science, machine learning utilizes data and algorithms to simulate or replicate human learning behavior,exhibiting strong capabilities in handling irrelevant information, extracting feature variables, and building calibration models. It has found broad applications in the food industry. In recent years, there have been numerous reports on the application of machine learning in tea processing, but there are relatively few review articles specifically focused on the application of machine learning techniques in predicting the flavor quality of jasmine tea. This paper reviewed the principles of commonly used machine learning models and their application in predicting the flavor quality of jasmine tea. It introduced the application of current machine learning models in the physical testing, chemical indicators, and microbial and pest detection aspects of jasmine tea flavor quality prediction, with the aim of providing a reference for the application of machine learning in the development of the jasmine tea industry.

Key words: machine learning; jasmine tea; prediction; flavor quality; application

中图分类号:TS201.1

文献标识码:A

文章编号:1007-7561(2024)05-0142-09

网络首发时间:2024-08-29 11:07:17

网络首发地址:https://link.cnki.net/urlid/11.3863.TS.20240828.1527.017

DOI: 10.16210/j.cnki.1007-7561.2024.05.018

黄叶群, 周晗林, 童秀平, 等. 机器学习算法在预测茉莉花茶风味品质中的应用[J]. 粮油食品科技, 2024, 32(5): 142-150.

HUANG Y Q, ZHOU H L, TONG X P, et al. Application of machine learning algorithms in predicting flavor and quality of jasmine tea[J].Science and Technology of Cereals, Oils and Foods, 2024, 32(5): 142-150.

收稿日期:2024-01-17

基金项目:十四五国家重点研发计划(2022YFD2101102)

Supported by: National Key Research and Development Progect of the 14th five-year plan, China (No. 2022YFD2101102)

作者简介:黄叶群,女,2000 年出生,在读硕士生,研究方向为食品科学、茶叶风味品质及机器学习,E-mail: yqhuang0712@163.com

通信作者:庞杰,男,1965 年出生,博士,教授,研究方向为机器学习及分子数值模拟在活性多糖中的功能化设计与应用,E-mail:pang3721941@163.com