过刊目录

  • 2024年, 45卷, 第1期
    刊出日期:2024-01-26
      

  • 全选
    |
  • 张铁,徐林莉,周远远
    2024, 45(1): 1-8.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类式联邦学习利用数据分布的差异对用户群体进行聚类,实现个性化的联邦模型训练,可以有效解决联邦学习中的特征分布异构问题.本文针对现有方法通信复杂度较高,难以适用于类别分布异构与小数据场景等问题,基于元学习方法中的原型网络模型提出了一种迭代聚类式联邦学习框架.本文从期望最大化算法的角度出发,利用类原型信息构建用户嵌入表示,并基于此提出用于度量用户与聚类簇之间差异性的模型距离.该迭代式框架交替地执行用户聚类与局部更新以优化全局目标函数.由于新的模型距离可以在服务器端被计算,该框架在每一轮通信中有着近似于FedAvg算法的通信代价.相关实验结果表明了本文提出的方法对于聚类式联邦学习问题,特别是在类别分布异构与小样本数据场景的有效性.
  • 刘峰,曹子宁,王福俊,李振
    2024, 45(1): 9-15.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着信息物理融合系统(CPS)日益复杂,很难捕获其相关行为并以一种可解释的方式检测它.因此本文提出了一种基于线性支持向量机(LSVM)框架的规范挖掘算法,从有限长度的信号轨迹中挖掘具有可解释性的信号时序逻辑(STL)公式.挖掘出的STL公式可以作为监控行为的抽象,用于CPS运行时验证的监控机制中.该算法根据一组被标记的有限时间轨迹和STL模板公式,将信号时序逻辑特有的鲁棒性满意度与LSVM的优化算法相结合生成所需规范.另外,本文还将对一维信号轨迹的规范挖掘技术扩展到多维信号上.最后,通过两个案例研究来说明提出算法的可行性和优势,结果表明该算法在保证高准确率的前提下,执行效率和可解释性都优于其他的规范挖掘算法.
  • 郭奇涵,谢文军,王冬,程景铭,刘晓平
    2024, 45(1): 16-22.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    运动数据去噪在影视特效、游戏和康复医疗等动作捕捉应用中起着重要作用.为提高低成本动作捕捉设备的精确度和鲁棒性,提出一种融合Kinect和惯性测量单元(IMU)两种模态运动数据的多阶段去噪网络MMCapNet,利用特征提取器从两种模态数据中提取并融合运动特征,使用关节位置估计器分阶段预测关键关节、身体关节和手部关节坐标位置.为了提高方法的泛化能力,在现有2180332帧多模态数据的基础上,采集了227160帧包含高噪声的多模态运动数据集.实验结果表明,在日常运动和高噪声多模态数据集上输出结果的关节点位置精度均有提升.与BRA、DIP和STTrans方法相比,在日常运动数据集上全身估计误差分别降低78.5%、87.1%和31%,在高噪声数据上的估计结果更加合理.本文通过特征提取,融合多模态数据和多阶段预测,在降低位置估计误差的同时增强了对高噪声数据的处理能力.
  • 陈魏红,麦可,许璇,刘子玄,张红雨,彭辉
    2024, 45(1): 23-29.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    受到生物大脑神经胶质细胞和神经元互作用机制的启示,提出一种胶质细胞偶联人工神经网络(Glia-Coupled Artificial Neuron Networks,GCANNs)模型.对当前人工神经网络模型中的基本单元—神经元进行扩展,将每一个神经元连接一定数量的胶质细胞作为网络基本单元,通过神经元和胶质细胞的相互作用模型进行基本单元各元素的计算和更新,最后通过遗传算法对该模型的参数、拓扑结构进行优化.该网络模型能反应胶质细胞和神经元之间的双向通讯机制,更接近神经系统各元素之间的信息处理方式.实验表明,该模型能提升网络学习性能,在图像、文本等的分类任务上表现出比传统人工神经网络更高的准确率.此外,基于遗传算法的网络优化实验表明,为获得更高的适应度,大部分神经元都选择了与一定数量的胶质细胞“相连”,说明胶质细胞偶联的模型是经过了“自然进化、优胜劣汰”的更优模型.该模型能为构建更符合大脑工作机理的神经网络提供新的思路和方法,也能反向启发和推进神经科学研究.
  • 袁德荣,张勇,唐颖军,李波燕,谢宝来
    2024, 45(1): 30-36.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    面部表情识别已经广泛运用于人机交互、教育、自动驾驶等各种领域,针对现有表情识别方法网络结构复杂、参数多、泛化能力不足、识别率低等问题,且人脸表情在自然环境下易受到光照、姿态和局部遮挡等环境因素的影响,提出了一种多尺度残差注意力网络.以ResNet-18网络为基础,提出了一种新的多尺度残差注意力模块,通过提取不同尺度特征,增加特征多样性.引入CBAM注意力机制获取表情图像重点特征信息,有利于提升遮挡表情的识别.构建特征残差融合块,将浅层特征与深层特征进行残差融合,有利于获取丰富的人脸表情图像整体特征.实验结果表明,本文方法在CK+、JAFFE和Oulu-CASIA 3个公开表情数据集上分别达到了99.49%、98.53%和97.08%的准确率,与一些现有方法相比,本文方法表情识别率更高,证明了该方法可用于人脸表情识别.
  • 万宇杰,陈羽中
    2024, 45(1): 37-44.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,深度神经网络特别是图神经网络在方面级情感分析任务上取得了较大进展,但是仍存在未充分利用外部知识信息、句法依赖树的边关系信息以及知识图谱结构信息的缺陷.针对上述问题,本文提出了一种知识增强的双图卷积网络BGCN-KE(Knowledge-enhanced Bi-Graph Convolutional Network).首先,提出一种融合句法依赖关系与外部知识的子图构造算法,得到节点间语义关系更紧密的知识子图.其次,提出了双图卷积网络,分别利用两个图卷积网络在句法依赖知识子图中引导评论文本的节点学习邻接节点的外部知识,以及在评论文本的句法依赖图中融合特定方面相关的语义信息,从而增强评论文本的特定方面知识表示和语义表示.再次,BGCN-KE引入边关系注意力机制,更好地捕获特定方面和上下文词语间的语义关系.最后,提出了一种多级特征融合机制,充分融合特定方面相关的外部知识、语义信息和边关系特征.多个公共数据集上的实验证明,BGCN-KE的性能优于最新的对比模型.
  • 陈林威,宋玉蓉,宋波
    2024, 45(1): 45-51.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,在线社交媒体的发展大大加速了谣言的滋生和传播,谣言的危害性使得谣言的自动检测技术受到研究学者的广泛关注.本文同时考虑事件与事件之间的全局结构关系以及事件内部消息传播的时序关系,以异质图为载体共同显式建模两种关系,提出一种新的时序感知的异质图神经谣言检测模型.该模型利用时序感知的自注意力机制捕获事件内部转发(或评论)贴之间的时序关系,并将具有时序信息的转发(或评论)贴与源贴融合,得到事件的局部时序表征;接着利用元素级注意力机制捕捉事件与事件之间的全局结构关系,学习事件的全局结构表征;最后将二者融合用于检测谣言.实验结果表明,该模型优于大多数现有模型,可以提高谣言检测性能,并且同样具有优秀的早期检测性能.
  • 曾奕博,钱鸿,李丙栋,窦亮,周爱民
    2024, 45(1): 52-61.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    贝叶斯网络结构学习是贝叶斯网络推理及应用的基础.搜索高质量的节点序是贝叶斯网络结构学习的一类重要方法.针对在节点序空间中,搜索高质量节点序存在的难以高效、准确评估解的问题,本文提出了一种近似图引导的演化贝叶斯网络结构学习算法.首先,该算法利用互信息构建无向近似图;其次,该算法通过结合节点序和无向近似图构造有向图结构,将其贝叶斯信息准则评分作为节点序的适应度来高效评估节点序,并在演化优化的框架下,使用提出的基于Kendall Tau Distance的交叉算子和基于逆度的变异算子搜索最优节点序;最后,将搜索到的最优节点序输入K2算法得到其对应的贝叶斯网络结构.在4种不同规模网络上的实验结果表明,该算法在收敛时间和准确度之间取得了较好的平衡,其评分相较于对比算法中的次优解分别提升了10.91%、12.28%、53.96%、10.87%.
  • 吕梦柯,郭佳乐,丁英强,陈恩庆
    2024, 45(1): 62-68.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    得益于图卷积网络(GCN)对于处理非欧几里得数据有着非常好的效果,同时人体的骨骼点数据相对于RGB视频数据具有更好的环境适应性和动作表达能力.因此,基于骨骼点的人体动作识别方法得到了越来越多的关注和研究.将人体骨骼建模为时空图形的数据进行基于GCN模型的动作识别取得了显著的性能提升,但是现有的基于GCN的动作识别模型往往无法捕获动作视频流中的细节特征.针对此问题,本文提出了一种基于分段时间注意力时空图卷积骨骼点动作识别方法.通过将数据的时间帧进行分段处理,提取注意力,来提高模型对细节特征的提取能力.同时引入协调注意力模块,将位置信息嵌入注意力图中,这种方法增强了模型的泛化能力.在NTU-RGBD数据集和Kinetics-Skeleton数据集上的大量实验表明,本文所提模型可以获得比目前多数文献更高的动作识别精度,有更好的识别效果.
  • 蔡茂东,沈国华,黄志球
    2024, 45(1): 69-74.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据集的前提上的,无法在低资源环境下快速运用.本文提出了一种考虑词频、词长以及词大小写特征的无监督算法以及结合了该无监督算法的自扩展迭代的半监督学习关键词抽取方法.半监督学习方法在同样无需手工标注关键词的前提下,相比无监督算法具有更高的F1值.
  • 曹振,邓莉,谢同磊,梁晨君
    2024, 45(1): 75-83.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云平台任务的CPU负载预测有助于云平台资源的优化配置,以改善资源利用率.它是有效管理云资源的重要手段.为提高任务CPU负载预测精度,本文主要做了以下工作:1)利用热度图提取用于进行CPU负载预测的资源使用特征;2)设计并实现了一种基于n-LSTM的云平台任务的CPU负载预测方法DPFE-n-LSTM;3)分别在阿里云平台数据集和Google云平台数据集上进行了实验,结果表明,相对于目前已经提出的CPU负载预测模型BP、LSTM和CNN-LSTM,DPFE-n-LSTM方法具有更好的预测性能.
  • 李晓劼,杨志斌,王翰丰,周勇,李维
    2024, 45(1): 84-92.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    安全关键系统和软件的安全性、可靠性需要形式化验证来保障,使用形式化验证的前提是从自然语言需求文本中提取相关验证性质并将其转化为形式化规约,这已成为当前形式化验证领域研究的热点和难点.当前的形式化规约提取工作大多针对英文需求,较少针对中文自然语言需求.此外,由于AADL具有强大的表达能力和完善的验证机制,已成为航空航天领域的主要建模语言之一,而现有的工作较少考虑如何从需求中提取AADL模型的验证性质.为了解决上述问题,本文提出一种面向自然语言需求的AADL模型验证性质自动生成方法,从自然语言需求中提取验证的相关性质,并将其转化为AADL模型验证工具AGREE可识别的形式化规约.首先,定义了模式定义语言(Contract Pattern Language,CPL),将需求划分为不同模式,并给出由固定句型和占位符组成的需求模板;其次,通过自然语言处理技术解析需求文本,获取替换需求模板中占位符的原子命题,以便生成完整的形式化规约;最后,设计并实现了相关工具,并将其用于工业界实际案例来说明该方法的可用性和有效性.
  • 段乐乐,李博一,丁滋钊,朱小飞
    2024, 45(1): 93-100.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    冷启动问题一直是推荐系统中十分有挑战性的问题.目前,基于映射的跨域推荐技术在解决冷启动问题上已取得了十分不错的效果,其方法主要分为两类,一类关注共性,即所有用户共享一个映射函数;另一类则关注个性,即为每个用户分别分配个性化的映射函数;然而,这两类方法均没有考虑到用户共性与个性的互补性;此外,这两类方法也忽视了目标域知识本身的挖掘.为了解决以上问题,本文提出了目标域特征感知与互补用户迁移的跨域推荐模型.一方面,提出个性-共性互补映射模块以显式建模用户个性和共性的互补信息,另一方面,提出了关系网络以挖掘目标域知识.最后,在Amazon数据集上的实验取得了目前最优的效果,验证了本文所提出模型的有效性.
  • 赵源,李卫疆
    2024, 45(1): 101-107.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    方面级情感分类的任务是判断给定方面的情感极性,图注意网络是处理句法信息的有效手段,然而传统图注意神经网络在通过中间节点聚合与方面间接相邻的信息时,并不直接考虑该节点与方面的相关性,这将导致不相关信息过多传递到最终表示,影响分类效果.本文提出了使用方面引导图注意网络的方面级情感分类模型,首先使用多头自注意编码学习文本句内表示,然后使用方面引导图注意网络对情感信息进行聚合,同时使用了语义注意力模块突出浅层网络中可能被遮蔽注意力遗漏的情感信息,结合生成最终表示进行分类预测.本文通过公开数据集上的实验证明本文模型具有更好的效果,进而通过实验验证了方面引导图注意网络相比传统图注意网络在方面级情感分类中具有更优的性能以及其它组件的有效性.
  • 刘漳辉,林宇航,陈羽中
    2024, 45(1): 108-114.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对话状态追踪是对话系统的重要组成部分,旨在从用户与系统的对话中跟踪用户意图,其通常表示为槽位-槽值对序列.近年来,深度神经网络模型在对话状态追踪问题上取得了较大进展.然而,现有模型在槽位相关性建模方面还存在可拓展性差与易引入噪声等问题.针对上述问题,本文提出了一种知识增强与自注意力引导的图神经网络KESA-GNN(Knowledge-Enhanced & Self-Attention Guided Graph Neural Network).首先,KESA-GNN通过外部知识嵌入增强槽的语义表征提升多头自注意力机制对槽位间相关性的辨别能力.其次,为了精确建模槽位间的诸如共指、共现等相关性,提出了一种自注意力引导的图神经网络建模槽位相关性.该网络采用多头注意力机制获得槽位间的注意力矩阵以及槽位表征,通过Max-N Relation算法获得注意力矩阵中强相关关系集,将稠密的注意力矩阵稀疏化,从而引导图神经网络中强相关槽位间的信息传播,降低无关槽位的噪声影响.最后,KESA-GNN采用门控融合机制过滤槽位多头注意力和图神经网络输出的槽位表征,从而获取更准确的槽位表征向量,进一步提升了KESA-GNN的鲁棒性.在多域对话数据集上的实验结果表明,KESA-GNN模型的性能优于最新的基线模型.
  • 傅晨波,陈殊杭,胡剑波,潘星宇,俞山青,闵勇
    2024, 45(1): 115-122.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,社会化推荐作为推荐算法之一被广泛应用于各大平台.由于引入了用户的社交信息,社会化推荐可以较好地缓解数据稀疏问题.然而,大部分社会化推荐难以高效地从原始信息中提取用户的有效信息,导致引入社会信息的同时也会引入大量噪声.为了解决上述问题,本文提出了SRBHL(Social Recommendation Based on Hypergraph embedding and Limited attention)模型,通过超图嵌入模块提取用户的历史行为信息和社交信息,以缓解原始目标用户数据稀疏问题,并结合有限注意力模块来过滤原始信息的噪声,最后将得到的有效好友信息用于推荐.在Yelp-Urbana、Yelp-Phoenix和Epinions3个真实数据集上的实验结果表明SRBHL模型相比其他的推荐算法表现更出色.此外,本文还对SRBHL模型进行了鲁棒性分析,并给出了模型最优参数的取值范围.
  • 陈世伟,李静,玄佳兴,石竹玉,乔宇杰,高颖
    2024, 45(1): 123-131.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    多元时间序列数据的异常检测旨在发现对应时序特征中不符合一般规律的特异性模式,识别特定时间步长中的异常状态.针对多元时序数据时间依赖性建模难以及数据维度不断增加导致难以有效进行异常检测等问题,本文以自编码器为基础,融合生成对抗网络(Generative Adversarial Network,GAN)和双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,Bi-LSTM),提出了一种无监督异常检测模型LSTM-GAN,该模型在每一轮训练中,以迭代的方式重构正常数据,通过GAN来放大异常,Bi-LSTM来捕获时间特性,训练完成后的模型用于时序数据的异常检测.本文在4个公开数据集上和几种先进同类方法进行了对比实验,实验结果表明,LSTM-GAN的检测性能提升了4.4%~16.6%,在IT数据集SMD中的模型检测F1分数达到0.9672,实现了高效的时序数据异常检测.
  • 孙磊,冯智伟,韩美灵,邓庆绪
    2024, 45(1): 132-138.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    电动汽车的续航里程和充电速度受电池技术的制约,由此产生的里程焦虑问题阻碍了电动汽车的普及.为了解决这一问题,降低用户成本,本文从用户的需求和使用方式出发,根据当前充电设施的发展趋势提出弹性充电策略,利用动态规划的方法在保障电量可靠供给的前提下优化充电成本.针对动态规划的复杂性,本文进而提出改进的近似算法,在降低计算复杂度的同时使充电策略更符合用户使用习惯.本文采用一辆主流型号的电动汽车对上述方法进行了实际测试,结果表明该方法能够有效降低用户充电成本.
  • 许艺凡,李宜铮,王光耀,段靖海,王科翔,陶军
    2024, 45(1): 139-144.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于在网络测量中存在不可避免的数据损失,网络监测数据通常是不完备的甚至是稀疏的,这使得大象流的精确检测成为一个具有挑战性的问题.本文提出了一种基于数据补全的离线大象流检测方法.为实现对于大象流的精准检测,首先实现了一个基于矩阵分解的数据补全算法,将流量数据补全问题转化为一个低秩矩阵奇异值分解问题.其次,在此基础上进行高阶扩展,引申出张量补全模型,利用张量CP分解实现数据补全,将原问题转化为通过最小化张量秩来恢复缺失条目的张量补全问题.最后对上面使用的矩阵补全算法和张量补全算法进行了仿真实验,对比了各算法精准度,评估了超参数,并展示了张量补全算法的时间开销.实验结果证明该方法取得了较好的效果.
  • 邹岩,陶秋子,张少卿,林川,陈佳润,王亚卓,赵爽宇,韩光洁
    2024, 45(1): 145-150.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    信息技术的飞速发展促使未来空战由机械化向信息化、智能化、多平台集成化转化和发展.本文针对未来多平台航空电子体系架构下的航电系统可信度评估与仿真验证问题,建立多平台航电系统可信度度量方法,提出集成“系统可靠性”和“任务支撑度”的多平台航电系统可信度度量指标体系架构.在此基础上,提出基于专家打分和模糊层次分析法的多平台航空电子可信度值计算方法,以对未来空战的多模态作战任务进行综合分析和量化判断.仿真实验结果表明,本文提出的多平台航电系统可信度度量方案可以根据各子平台、子系统的状态、综合评估整个多平台系统的信任度.
  • 聂君凤,于卓然,李均利
    2024, 45(1): 151-159.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,复杂网络的鲁棒性优化问题引起人们广泛关注.复杂网络暴露在外会受到各种各样的攻击,因此如何设计抗击能力较好的网络结构成为了研究热点.虽然现有的方法在小规模复杂网络的鲁棒性方面已经取得了显著成果,但大规模复杂网络的能控性鲁棒性优化的计算成本非常大.而代理模型可以以较低的计算成本来代替优化过程中对复杂网络能控性鲁棒性的评估,但一个代理模型不可能适用于评估所有类型的复杂网络能控性鲁棒性.文中将Dempster-Shafer理论应用于代理模型选择及其混合,并把选择出的代理模型用来辅助进化算法搜索能控性鲁棒性更优的网络结构.此方法在SF、ER、SW、RR、RT和QS 6种合成网络上的实验结果表明:在不同类型的复杂网络中选择合适的代理模型能更好的辅助进化算法找到能控性鲁棒性更优的网络结构.
  • 吴昕怡,沈航,白光伟,张贝宁
    2024, 45(1): 160-167.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    5G车联网差异化的服务质量(Quality of Service,QoS)需求需要网络切片技术的辅助和多运营商协作提供资源.然而,多方参与下的车联网切片资源提供往往伴随着不信任、欺骗性攻击等问题.针对这些问题,本文提出一种基于区块链的5G车联网切片资源交易框架,目的是构建安全可信、可追溯的车联网资源交易生态.首先,设计一种基于智能合约的分布式资源交易方法,保证交易的公平性和隐私安全.然后,探索一种基于VCG拍卖的信誉评估机制,在资源交易者选择时作为参考.最后,开发一种信用感知的实用拜占庭式容错(Practical Byzantine Fault Tolerance,PBFT)共识机制.安全性分析和仿真结果表明,提出的方法可以实现安全可信的资源交易,提高节点运行效率,并且降低恶意节点参与共识的概率.
  • 吉晨钟,次旺晋美,张伟,陈云芳
    2024, 45(1): 168-176.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于深度学习的视频动作识别方法处理时间信息的方式主要有两种,一是利用光流表示相邻帧之间的运动信息,但其无法有效建模长程时间特征,二是利用3D卷积对时空信号进行混合建模,但其引入了大量的参数,导致内存消耗和计算量剧增.针对上述问题,本文提出了一种改进2D CNN时空特征提取的动作识别方法,在2D CNN中嵌入时空门控和动作注意力聚合(Spatial-temporal Gate and Motion Attention-aggregation,SGMA)模块增强其时空特征提取能力.SGMA包含时空动态门控和动作注意力聚合两个子模块,时空动态门控能够可视化各通道特征的运动比例因子并依此逐通道分离运动强相关特征和运动弱相关特征,动作注意力聚合利用运动强相关特征构建金字塔结构来提取不同时间跨度的运动特征,并使用注意力机制自适应聚合各时间跨度特征实现长程时间建模,运动弱相关特征经过2D卷积提取空间特征后融合动作注意力聚合模块的输出最终获得强有力的时空特征表达.在相同帧采样策略下,本文方法在Something-SomethingV1&V2验证集上的Top1准确度比基准TSM分别提高了4.4%和6.2%.
  • 刘义鹏,曾东旭
    2024, 45(1): 177-184.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    眼底血管分割算法常作为一种辅助分析工具用于眼部疾病的诊断.具有良好泛化性能的算法需要大量有标签数据作为支撑,但眼底数据难以获取且标注成本高.当数据匮乏时,模型训练容易过拟合,导致产生域泛化性能弱的问题.使用生成对抗网络进行数据增强能在一定程度上缓解该问题,但是合成的图像往往包含噪声数据,性能提升有限.本文从频域角度出发,设计一种数据增强算法,定义频域语义信息量,将眼底数据集的频段划分为低频、中频和高频.在训练阶段,对低频分量进行随机融合,中频分量使用随机权重增强.在测试阶段通过聚类算法缩小源域和目标域在频域上的语义信息偏差,从而提升算法的泛化性能.
  • 方康,黄琴,王克琪,靳帅,刘畅,钱宇华,陈路
    2024, 45(1): 185-191.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的多光谱行人检测算法大多是基于Faster R-CNN的两阶段检测或设置了锚框机制的一阶段检测,此类模型存在推理速度慢,检测准确率低等不足.为此,本文设计出一种基于一阶段无锚框检查算法YOLOX的多光谱行人检测算法.该算法将多模态特征提取解耦为特性特征提取和共性特征提取两阶段.针对基准特性特征提取网络学习能力不足、提取的语义信息和纹理细节信息不够丰富的问题,本文设计出一种多尺度特征增强(Multi-scale Feature Enhancement,MFE)模块,该模块可提取出特性特征图中丰富的语义和纹理细节信息.此外,本文使用基于差异性的特征融合方法来充分捕获两种模态的差异性特征信息.为证实本文方法的有效性和可行性,本文在KAIST数据集和FLIR数据集上进行了实验验证,实验结果表明本文所提方法可显著提高多光谱行人检测的性能.
  • 戴锡笠,龚海刚,刘明
    2024, 45(1): 192-198.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出了一个线卷积网络,可以从图像中检测线段.通过预测每条线段的中心位置、长度和角度,该网络能够以端到端的方式检测线段.此外,根据线中心检测的特点,本文设计了一维旋转卷积模块,并通过分析,证明其满足等变性质.在实现上,本文采用改进的数据增强和非极大值抑制方法,有效的提高了线检测的性能.通过大量消融实验以及对比实验,本文提出的线卷积网络相比于当前最优算法HAWP,在精度上高出3个百分点,达到了当前最优.最后,将该方法应用于单张图三维线框重建任务,从可视化结果上看,明显优于之前的方法.
  • 顾兆军,韩强,王家亮,陈辉,董楷
    2024, 45(1): 199-206.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决四轴飞行器在执行目标检测与跟踪任务时无法判断机身与障碍物或跟踪目标之间安全距离问题,提出一种四轴飞行器单目视觉测距算法,算法融合基于帧间差分技术的水平测距模型与基于小孔成像的垂直测距模型.首先,算法可利用基于YOLOV4-Tiny的目标检测算法识别视频帧中的物体类别,并可在视频帧中框选出被测物体,依据现场环境选择最佳的测距方法进行测距;其次,系统终端执行测距方法,基于被测物体的视频帧成像位置与设定参数之间的差值控制四轴飞行器飞行,并记录飞行数据;最后,通过测距模型对飞行数据进行处理,计算出四轴飞行器在初始位置和最终位置与被测物体之间的距离.通过在特洛(Tello)飞行器平台上的实际飞行验证,实验结果表明所提出的四轴飞行器单目视觉测距算法可以有效分析出视频帧中各物体的景深,测距误差百分比均值为4.07%.在四轴飞行器与障碍物或跟踪目标之间距离较近,却无法评估此距离是否处于安全距离时,所提出的算法可为搭载单目摄像头的四轴飞行器提供可靠的测距技术支持.
  • 邓博文,徐胜军,孟月波,刘光辉,韩九强,史亚
    2024, 45(1): 207-215.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对遥感图像中建筑物区域尺度跨度大且区域边界模糊导致分割精度低的问题,本文提出了一种基于交叉区域注意力的遥感建筑物分割算法.首先,设计了交叉自注意力模块和分组通道注意力模块用于建立遥感图像区域间和区域内特征的相关性表征,进而引导模型关注待分割目标的区域级细节特征与通道组选择能力;最后,针对分割结果缺乏空间相关性约束问题,提出一种区域一致性监督的损失函数,约束局部区域内像素标签分配的一致性.所提算法在WHU数据集上IoU、Precision、Recall、F1-score分别可达到91.2%、 95.28%、95.4%和95.3%;在Massachusetts数据集上IoU、Precision、Recall、F1-score分别可达到74.6%、83.7%、86.9%和85.3%,各项指标均优于主流遥感图像建筑物分割算法.
  • 杨浩,周冬明,赵倩
    2024, 45(1): 216-223.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    模糊图像不仅影响人类感知还会影响后续计算机视觉任务的性能,例如自动驾驶系统和户外监控系统中的视觉算法.针对以往基于深度学习的去模糊方法感受野较小,不能动态适应输入内容和重建图像细节信息困难等问题,提出了一种基于Transformer 的图像去模糊网络.网络包含两个分支:图像内容分支和梯度分支,每条分支均以具有窗口机制的Transformer作为主干,通过梯度分支的信息指导图像去模糊重建,能够更好地恢复图像的边缘和纹理.同时,为了充分利用图像的内容信息和梯度信息,本文还设计了一个交互式融合模块来有效融合特征信息.此外,本文通过在Transformer块的自注意力机制和前馈网络中引入卷积来解决Transformer对局部信息建模不足的问题.在合成数据集和真实数据集上的大量实验结果表明,提出的算法能有效去除复杂模糊并且恢复清晰的细节,在定量指标和视觉效果上均优于目前的主流去模糊算法.
  • 周扬维,尹震宇,王军,张飞青,徐光远,徐福龙
    2024, 45(1): 224-229.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着信息技术的不断发展,机器视觉技术已被广泛应用于智能产线.智能制造生产过程中工件种类多、外观相似性高,而传统分拣方式速度慢、准确率低,已无法满足智能化生产的要求.采用机器视觉技术来解决智能产线中的工件分类问题已成为当前智能制造领域的热点.为提高智能产线中工件分类的效率,本文设计并实现了一种基于ZYNQ平台的图像分类加速器.针对现有的卷积神经网络模型参数量大、难以部署到资源有限的嵌入式平台的问题,提出一种参数量较少、易于在嵌入式平台部署的图像分类网络SortNet;针对卷积神经网络在嵌入式平台速度慢的问题,设计了一种卷积与激活函数同构化的处理单元(CAFI-PE)以及一种基于流水线的数据调用方法(PDCM),提高了卷积计算的速度.实验结果表明,本文提出的图像分类加速器对224×224大小的灰度图像处理速度可达40.98fps,而功耗仅为2.305W,能够满足智能产线对工件分类速度和功耗的要求.
  • 朱文婧,范媛媛,陈羽中
    2024, 45(1): 230-240.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    立体图像颜色校正方法的目标在于消除立体图像左右视图之间的颜色差异.现有的立体图像颜色校正方法存在校正效果和时间效率不平衡的问题.为了解决这一问题,本文提出一种融合匹配特征的立体图像颜色校正方法.首先,通过视差注意力颜色校正网络得到待校正目标图像的初始校正图.然后,将初始校正图和参考图像输入基于光流的图像匹配网络得到光流匹配目标图.最后,由图像融合网络融合初始校正图、光流匹配目标图、参考图像和目标图像的特征并进行图像重建,得到最终的校正结果.实验结果表明,本文的方法具有先进的性能,能够在保持高时间效率的同时实现高质量的立体图像颜色校正效果.
  • 王军,高放,省海先,张宇
    2024, 45(1): 241-248.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对图像生成算法中生成对抗网络训练效率低且不稳定的问题,本文提出了一种改进生成对抗网络的图像生成算法(STGAN),该算法首先在判别器中引入Swin Transformer机制,来增强网络的判别能力;其次改进了生成器,使用自注意力代替卷积神经并且加入谱范数规范化,来达到平衡生成器和判别器的效果;最后使用Wasserstein距离作为损失函数,以提高网络的训练稳定性.实验数据表明,在CelebA和LSUN两种不同数据集上STGAN比自注意力生成对抗网络所生成图像的FID值分别降低了2.5266和5.4476,IS值分别提高了0.0941和0.0343.从实验结果可以看出,STGAN模型生成的图片具有非常高的自然度和逼真度,有效地提升了生成图像的质量和真实性.
  • 冉凌鎛,张雷,刘晓文
    2024, 45(1): 249-256.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对当前的WiFi手势识别技术对手势估计不准确、受噪声影响较大和特征提取不充分等问题,文章提出了一种基于菲涅耳区和深度学习的识别方法.该方法主要分为3个阶段:模型搭建、数据预处理和手势分类.模型搭建阶段通过菲涅耳区定量了手势运动与信号波动模式之间的精确关联,进而确保了对手势的精准估计;数据预处理阶段通过天线之间的商模型、离散傅里叶变换、Hampel滤波器和离散小波变换进行平滑滤波处理,保证了振幅和相位信息的质量;手势分类阶段利用建立的深度神经网络模型,从所有链路的子载波信息中自动提取并筛选出时空域特征,最后用Softmax函数实现手势识别.实验证明,该方法能够达到96%的识别准确率,在不同的实验环境下具有较高的鲁棒性.