- 许光宇;吴敏;
针对神经网络在图像超分辨率(super-resolution, SR)任务中因结构复杂导致的参数量过大、训练困难等问题,提出基于改进多尺度特征金字塔网络(multi-scale feature pyramid network, MFPNet)的轻量化图像SR重建模型。首先,设计改进MFPNet架构,通过迭代下采样操作构建不同尺度的特征表达空间,有效增强网络对图像多粒度细节特征的捕获能力。其次,采用位置感知循环卷积(position aware circular convolution, ParC)作为网络的主要信息提取模块,在降低参数量的同时扩大网络的感受野大小。最后,设计动态注意力块(dynamic attention block, DAB),通过注意力引导层(attention guidance layer, AGL)动态调整高效通道注意力(efficient channel attention, ECA)和空间注意力(spatial attention, SA)模块的占比,提升网络对纹理细节的恢复能力。实验结果表明,改进MFPNet模型与其他前沿模型相比,结构相似性指数度量(structure similarity index measure, SSIM)最高为0.961 3,峰值信噪比(peak signal-to-noise ratio, PSNR)最高为38.11 dB。该研究证实改进MFPNet模型能够应用于重建图像任务,细节纹理更自然。
2025年03期 v.43;No.127 334-340页 [查看摘要][在线阅读][下载 1397K] [下载次数:167 ] |[引用频次:0 ] |[阅读次数:5 ] - 丁浪;罗庆斌;廖颢羽;李好;陈卓妍;
针对如何利用量子计算的优势对分组密码进行实际密钥恢复攻击的问题,在改进Yo-yo分组密码算法量子电路的基础上,基于格罗弗(Grover)算法优化了其量子密钥恢复攻击时所需量子资源。首先,基于替代(substitution, S)盒查找表,利用Dorcis工具成功实现S盒的量子电路;其次,利用输入变量的直接置换,去除S盒量子电路中的交换门;然后,将该方法应用于加密算法和密钥扩展算法,取消其中的置换操作;随后,回推第2轮迭代的密文,并利用第1轮迭代得到的值构建Grover算法的目标函数,从而避免了第2轮的迭代操作;最后,采用Grover算法对Yo-yo分组密码执行量子密钥恢复攻击,并成功找到正确密钥。量子电路的正确性在Qiskit Aer量子模拟器中得到了验证,结果表明,优化后的Grover算法攻击Yo-yo的量子电路在受控非(controlled-not, CNOT)门、非(not, NOT)门、托福利(Toffoli)门和交换(swap, SWAP)门的消耗上,相比Vu方法(Vu method, VM)分别平均减少了22%、13%、33%和68%。该算法有效降低了量子实现成本,从而减少了量子密钥恢复攻击所需的资源消耗。
2025年03期 v.43;No.127 341-345页 [查看摘要][在线阅读][下载 1123K] [下载次数:46 ] |[引用频次:0 ] |[阅读次数:4 ] - 王一帆;苏树智;尹欣乐;赵晨琦;杨帆;
针对尘肺病X光胸片中病灶分布稀疏、形态多变、类间差异小的问题,提出基于动态卷积与曼巴(dynamic convolution and Mamba, DC-Mamba)的双分支尘肺病分期模型。首先,通过动态卷积分支自适应核参数生成策略,增强对微小纤维化病灶的局部特征提取能力;同时,利用Mamba分支的序列建模能力,捕捉多区域病灶的全局空间依赖关系。其次,设计双路径注意力协同机制的特征融合模块,实现局部细节与全局上下文信息的整合。在1 760张真实匿名患者X光胸片上进行验证。结果表明,DC-Mamba模型的准确率达到78.3%,召回率达到79.0%,F1分数达到77.6%,均优于对比模型。DC-Mamba模型明显增强了对肺部病灶整体分布和细微病灶的理解能力,提高了对尘肺病的早期筛查和精准分期能力。
2025年03期 v.43;No.127 346-350+356页 [查看摘要][在线阅读][下载 1209K] [下载次数:82 ] |[引用频次:0 ] |[阅读次数:7 ] - 高林;郜世佳;焦思航;刘华国;
为解决电力行业中复杂缺陷样本稀缺、故障类型多样导致传统目标检测模型泛化能力不足的问题,系统研究小样本目标检测(few-shot object detection, FSOD)模型在电力行业发电、输电、变电、配电、用电5个环节的应用现状并分析发展趋势。研究表明,FSOD模型通过元学习、迁移学习、数据增强、度量学习等策略,在缺陷检测、故障检测、设备监控、安全检测等方面表现优异,但在复杂背景下的模型结构与感知能力、泛化能力与数据融合、样本依赖与系统工程等方面仍面临挑战,需进一步优化。FSOD模型可在模型结构改进、多模态数据融合、领域知识引入与系统部署优化方面进一步发展。该研究为FSOD模型在电力行业的深化应用提供重要参考。
2025年03期 v.43;No.127 351-356页 [查看摘要][在线阅读][下载 1045K] [下载次数:78 ] |[引用频次:0 ] |[阅读次数:5 ] - 陈慧;王涛;
为提升在复杂场景下的安全帽语义分割精度,解决边缘模糊、小目标分割不佳、多尺度变化问题,提出融合注意力机制与边缘引导的多尺度注意力金字塔场景解析网络(multi-scale attention pyramid scene parsing network, MA-PSPNet)工地作业场景语义分割模型。在模型的特征提取主干网络中引入多尺度卷积注意力(multi-scale convolutional attention, MSCA)模块,增强对关键区域的特征提取;在主干网络第2阶段特征提取后引入边缘引导注意力(edge-guided attention, EGA)模块,提升对边界的识别能力;另外,将金字塔场景解析网络(pyramid scene parsing network, PSPNet)的金字塔池化结构替换为空洞空间金字塔池化模块,增强多尺度适应性。结果表明,MA-PSPNet模型的平均交并比为83.28%,较原始PSPNet模型上升了9.13个百分点,像素准确率与平均像素准确率分别为95.62%与88.74%。MA-PSPNet模型能够有效提升复杂工业场景中的安全帽分割精度与边界感知能力,具备良好的实用性。
2025年03期 v.43;No.127 357-361+369页 [查看摘要][在线阅读][下载 1247K] [下载次数:52 ] |[引用频次:0 ] |[阅读次数:4 ] - 崔凤健;张梅;
为了实现对带式输送机煤流量及跑偏的准确检测,提出改进比例-积分-微分网络(proportional-integral-derivative network, PIDNet)语义分割模型。首先,引入特征稳定(feature stabilization, FS)模块,为关键特征动态分配更高权重,减少连续下采样过程中网络的信息损失;其次,重构并行聚合金字塔池化(parallel aggregation pyramid pooling, PAPP)模块的连接架构,采用可变形卷积网络(deformable convolution network, DCN)替代标准卷积,同时嵌入轻量级高效通道注意力(efficient channel attention, ECA)机制,在保持多尺度特征完整性的同时降低模型参数量;最后,设计双路径边缘增强(dual-path edge enhancement, DPEE)模块,通过边缘路径与语义路径的协同优化机制,提升边缘检测的交并比。结果表明,改进PIDNet模型检测速度为78帧/s,对分割目标的平均交并比和平均准确率分别达到86.51%和95.38%,较原始PIDNet模型分别提升了1.79和2.21个百分点。该研究能够为带式输送机的煤流智能运输提供有效的技术支撑。
2025年03期 v.43;No.127 362-369页 [查看摘要][在线阅读][下载 1615K] [下载次数:30 ] |[引用频次:0 ] |[阅读次数:4 ] - 何昕怡;朱黎;谭寒钟;李云;周远鑫;
针对可见光-热成像(red-green-blue-thermal, RGB-T)图像语义分割中模态特征失配与热成像过曝光噪声导致的精度下降问题,提出了基于跨模态交互与动态融合的RGB-T图像语义分割(cross-modal interaction and dynamic fusion for RGB-T image semantic segmentation, CIDF)模型,实现RGB-T模态的高效协同感知。首先,设计了跨模态跳跃连接(cross-modal skip connection, CMSC)机制,在编码阶段建立RGB-T模态的多尺度特征交互,通过跨层级特征传递与自适应聚合策略,有效缓解模态间特征分布差异。其次,提出了多模态卷积融合模块(multi-modal convolution fusion module, MCFM),通过卷积实现了动态特征优选,抑制了热成像模态的过曝光噪声干扰。实验基于公开的多光谱图像融合网络的城市道路场景(multi-spectral image fusion net for urban road scenes, MFNet)数据集及光伏巡检场景的自建数据集。结果表明,在MFNet数据集上,CIDF模型取得72.9%平均准确率和56.6%平均交并比。此外,在光伏巡检数据集上平均准确率和平均交并比分别达到98.9%和97.4%。该研究成果不仅验证了CIDF模型的有效性,也证明了其在跨场景应用中的优越性能。
2025年03期 v.43;No.127 370-375页 [查看摘要][在线阅读][下载 1296K] [下载次数:138 ] |[引用频次:0 ] |[阅读次数:4 ] - 彭李朋;赵佰亭;
针对立井罐道表面缺陷检测模型检测准确率低、识别困难、参数量大等问题,提出多增强轻量级高效-你只看一次第11版纳米型(multi-enhanced lightweight efficient-you only look once version 11 nano, MELE-YOLOv11n)模型。首先,设计了高效通道注意力双流(efficient channel attention dual-stream, ECA-DS)和深度可分离卷积-高效多尺度注意力(depthwise separable convolution-efficient multi-scale attention, DWEMA)模块,增强模型在矿井复杂环境中对目标缺陷特征的适应性,提高模型的检测性能。然后,采用了卷积3尺度可变核双路径全内核(convolutional three-scale kernel-adaptive dual-path-omni-kernel, C3K2-OK)模块,捕捉不同尺度的特征图信息,缓解信息丢失问题。最后,针对原有检测头计算量大的问题,提出轻量级共享细节增强卷积检测头(lightweight shared detail-enhanced convolutional detection head, Detect-LSDECD)模块,使用共享策略结合细节增强卷积增强模型的轻量化性能。结果表明,与YOLOv11n模型相比,MELE-YOLOv11n模型在立井罐道表面缺陷数据集上的平均精确率均值提高了2.5%,参数量降低了0.3×10~6个。MELE-YOLOv11n模型能够满足准确性和轻量化之间的平衡需求,可以为立井罐道表面缺陷的自动化检测提供有力的技术支持。
2025年03期 v.43;No.127 376-381页 [查看摘要][在线阅读][下载 1332K] [下载次数:243 ] |[引用频次:0 ] |[阅读次数:4 ] - 张飞;张梅;
针对煤矿井下粉尘干扰强、光照条件复杂等导致的煤流检测难题,提出基于煤流U型网络(coal flow U-shaped network, CFU-Net)的井下煤流实时分割模型。首先,基于轻量化移动网络版本4(mobile network version 4,MobileNetV4)改进U-Net的主干网络结构,提升模型的运行效率。其次,采用轻量化多尺度特征保持(lightweight multi-scale feature preservation, LMFP)模块与动态采样(dynamic sampling, DySample)算子,弥补通道压缩导致的特征缺失,强化模型的细节重建能力。最后,通过动态特征拼接(dynamic feature interaction, DFI)模块改进U-Net的跳跃连接方式,实现跨层特征的自适应深度融合,增强模型对不同尺度特征的感知能力。结果表明,CFU-Net模型的平均交并比(mean intersection over union, mIoU)可达95.10%,检测速度提升至70.20帧/s,兼具精度高与速度快的优点,与金字塔场景解析网络(pyramid scene parsing network, PSPNet)、深度双分辨率网络(deep dual-resolution network, DDRNet)等主流模型相比展示出明显优势。该研究证实基于CFU-Net的井下煤流实时分割模型可以满足实际场景中的煤流检测需求。
2025年03期 v.43;No.127 382-387页 [查看摘要][在线阅读][下载 1470K] [下载次数:62 ] |[引用频次:0 ] |[阅读次数:3 ] - 杜阳;王前;贺永姣;章晓爽;黎格献;王林;
针对钢材表面缺陷特征不明显和尺度差异大导致其难以被检测的问题,提出了全局特征交互融合-你只看一次(global feature interaction fusion-you only look once, GFIF-YOLO)钢材表面缺陷检测模型。首先,将YOLO第8版纳米型(YOLO version 8 nano, YOLOv8n)模型中的特征金字塔网络(feature pyramid network, FPN)替换成聚合分发(gather-and-distribute, GD)机制,在增强模型特征融合能力的同时,解决了跨层信息传递中的信息丢失问题;其次,在主干网络的最后1层嵌入全局注意力机制(global attention mechanism, GAM),进而增强模型对全局特征的关注能力;最后,通过引入多尺度轻量化卷积头(efficient multi-scale convolution head, EMSCHead),在减少模型参数量和计算量的同时提升模型的检测精度。结果显示,GFIF-YOLO模型在东北大学缺陷检测(Northeastern University detection, NEU-DET)、通用工业组件10类检测(generic component 10-class detection, GC10-DET)数据集的检测平均精确率均值达到了82.0%、66.7%,相较于YOLOv8n模型分别提升了3.0、3.4个百分点。GFIF-YOLO模型具有良好的性能,能够有效地完成钢材表面缺陷的检测任务。
2025年03期 v.43;No.127 388-395页 [查看摘要][在线阅读][下载 1264K] [下载次数:388 ] |[引用频次:0 ] |[阅读次数:5 ] - 刘冬旭;许光宇;
针对红外与可见光图像融合中存在目标信息减弱、细节信息不够丰富等问题,同时为了增强融合图像的语义信息保留能力,提出了融合语义分割和跳跃连接的红外与可见光图像融合(sematic segmentation-skip connections for infrared and visible image fusion, SS-SC-IVIF)对抗学习模型。在生成器端,通过语义分割获得带有语义信息的掩膜,利用掩膜将图像分为红外图像目标区域和可见光图像背景区域;利用2幅源图像与语义掩模运算的结果构造跳跃连接,以提取更多的源图像特征信息;结合语义信息掩膜设计专门的损失函数来引导特征提取和重构。2个判别器促使融合结果能够保留红外图像的强度信息和可见光图像的纹理信息。结果表明,在6个客观评价指标上,除了标准差(standard deviation, SD)指标以外,其他5个指标在荷兰应用科学研究组织(Netherlands organization for applied scientific research, TNO)数据集和道路数据集上均有提升,在熵(entropy, EN)指标上SS-SC-IVIF模型的平均值较对比模型的平均值提升了3.7%,在结构相似指数(structural similarity, SSIM)指标上提升了4.3%。该模型最大程度地保留了源图像的细节信息,明显提升了融合精度。
2025年03期 v.43;No.127 396-404页 [查看摘要][在线阅读][下载 1277K] [下载次数:151 ] |[引用频次:0 ] |[阅读次数:5 ] - 胡春阳;刘唤唤;葛斌;韦忠亮;霍振革;
针对基于自注意力机制的变换器(Transformer)模型在序列推荐任务中,存在动态用户兴趣捕捉不足以及计算复杂度随序列长度呈平方级增长的问题,提出了基于曼巴2(Mamba2)与自适应时频分析的序列推荐模型(sequential recommendation model based on Mamba2 and adaptive time-frequency analysis, M2ATFSRec),用于提升模型对动态用户兴趣的捕捉能力,进而在降低模型计算复杂度的同时提升模型的推荐精度。首先,采用自适应时频分析方法提取用户历史行为序列的时频特征,对兴趣的多尺度周期模式进行显示编码;然后,利用Mamba2的选择性状态空间机制,实现长序列的高效动态兴趣建模。M2ATFSRec在电影镜头100万条评分(movielens 1 million ratings, MovieLens-1M)、亚马逊美妆产品(Amazon beauty products, Amazon-Beauty)和亚马逊视频游戏(Amazon video games, Amazon-Video-Games)数据集上进行实验,在归一化累积折损增益(normalized discounted cumulative gain, NDCG)指标上相比面向高效的顺序推荐与选择性状态空间模型(towards efficient sequential recommendation with selective state space model, Mamba4Rec)分别提升了6.42%、22.76%和33.22%。该模型在长序列场景下具有更优的推荐性能。
2025年03期 v.43;No.127 405-410页 [查看摘要][在线阅读][下载 1117K] [下载次数:155 ] |[引用频次:0 ] |[阅读次数:7 ] - 王志忠;孙克雷;
为解决印制电路板(printed circuit board, PCB)制造时出现的微小缺陷(如缺孔、鼠咬、开路等)差异性小导致难以区分的问题,提出了基于你只看一次第11版纳米型(you only look once version 11 nano, YOLOv11n)的层级式部分多尺度卷积与小目标增强金字塔-YOLO(hierarchical partial multi-scale convolution and small targets strengthen pyramid-YOLO,HS-YOLO)模型。首先提出了层级式部分多尺度卷积(hierarchical partial multi-scale convolution, HPMSConv)模块,采用递进式混合特征融合策略,提高模型对多种缺陷类型的适应性。其次提出了小目标强化金字塔,设计了交叉全向卷积核模块,并在路径聚合特征金字塔网络(path aggregation feature pyramid network, PAFPN)上进行改进,通过关注缺陷的全局信息显著提升小目标的检测能力。在北京大学市场印制电路板(Peking University market powered by printed circuit board, PKU-Market-PCB)数据集上的实验结果表明,HS-YOLO模型在交并比阈值为0.50~0.95且步长为0.05下的平均精确率均值比YOLOv11n模型提高了3.7个百分点,召回率提高了4.1个百分点。HS-YOLO模型不仅提高了对PCB微小缺陷的检测准确性,而且有效改善了PCB缺陷检测中差异性小的目标检测能力不足的问题,为PCB自动化检测提供了高性能解决方案。
2025年03期 v.43;No.127 411-417+424页 [查看摘要][在线阅读][下载 1401K] [下载次数:310 ] |[引用频次:0 ] |[阅读次数:5 ] - 朱林枫;王军号;
针对数据稀疏场景下,基于共享的跨域推荐模型未能有效获取和传递跨域信息,导致用户偏好未能充分迁移以及推荐效率降低的问题,提出了结合图神经网络和多头注意力机制的跨域推荐模型(cross-domain recommendation model based on graph neural network and multi-head attention mechanism, GMACDR)。首先,利用节点到向量(node to vector, Node2Vec)算法进行作图嵌入,通过随机游走生成节点传播路径,并根据跳字(Skip-gram)模型生成高相似性的节点表示。然后,在图卷积神经网络的信息传播过程中,利用多头注意力机制,动态调整不同领域信息的传播权重,捕捉用户物品的深层次联系。最后,利用动态加权机制对领域特征加权求和,以改进特征融合过程,生成更具代表性的用户嵌入。结果表明,GMACDR在多个跨域推荐数据集上优于传统方法,对比最优基线模型,命中率最高提升了4.61%,归一化折损累计增益最高提升了10.47%,平均倒数排名最高提升了9.71%。研究结果证明该模型能够为用户提供更精准的推荐结果。
2025年03期 v.43;No.127 418-424页 [查看摘要][在线阅读][下载 1459K] [下载次数:385 ] |[引用频次:0 ] |[阅读次数:7 ] - 甄点点;唐超礼;朱振业;
针对在臭氧质量浓度预测中时空特征建模不足与时间动态依赖捕捉不充分的问题,提出基于多尺度图空间特征提取-时间注意力增强门控循环单元(multi-scale graph spatial feature extraction-temporal attention enhanced gated recurrent unit, MSGSFE-TAGRU)预测模型。该模型由MSGSFE与TAGRU模块构成。MSGSFE模块通过结合图注意力网络(graph attention network, GAT)与图卷积网络(graph convolutional network, GCN)构建多尺度图结构,实现对局部与全局空间特征的有效提取;TAGRU模块通过引入时间注意力机制动态聚焦关键历史时刻,提升门控循环单元(gated recurrent unit, GRU)对时序依赖的建模能力。结果表明,MSGSFE-TAGRU模型在短期预测中相较于表现最优的图神经网络-GRU(graph neural network-GRU,GNN-GRU)模型,均方根误差和平均绝对误差分别降低了5.22%和5.76%;在中长期预测中,该模型亦表现出更优的精度和稳定性,验证了其卓越的时空特征建模能力与泛化性能。该研究为臭氧质量浓度的高精度预测和空气质量管理提供了新的方法框架。
2025年03期 v.43;No.127 425-430页 [查看摘要][在线阅读][下载 1358K] [下载次数:61 ] |[引用频次:0 ] |[阅读次数:4 ]