过刊目录

  • 2025年, 46卷, 第8期
    刊出日期:2025-08-28
      

  • 全选
    |
  • 邹宗政1,李东胜2 ,张鹏1 ,顾宁1 ,卢暾1
    2025, 46(8): 1793-1800.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    序列推荐根据用户的历史交互物品,预测用户的下一个交互物品.现有基于物品序列的自注意力序列推荐模型,在进行物品预测时并没有充分考虑到用户在类型维度上的复杂偏好.为了解决这一局限性,本文提出了类型偏好注意的序列推荐算法CASRec.该算法首先设计了类型兴趣编码器模块以预测编码用户的综合类型偏好,然后设计类型信息感知的预测器模块来根据此类型偏好构建物品依赖关系,并利用集成嵌入的物品表示生成对于用户下一个交互物品的预测.此外,为了更深入地利用物品类型信息来帮助物品预测,额外的物品类型预测任务被引入以激活物品与类型的关系.在3个公开数据集上的广泛实验验证了CASRec 性能的优越性和各个模块设计的有效性.
  • 毕可骏1,孙鹏钊2,王瑞锦2,李冬芬3,应时4
    2025, 46(8): 1801-1808.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    产业链风险评估是促进经济健康发展的重要途径,然而由于数据隐私等问题,产业链数据往往存在缺失,导致现有风险评估效果存在偏差.针对上述问题,本文提出了结合图融合和属性补全的产业链风险评估模型.首先针对链内关系的复杂多样,设计了基于语义转换和图加权融合的关系图生成模块,实现对企业关系的高效转化;其次,针对企业节点特征缺失的问题,设计了基于节点拓扑和注意力机制的图嵌入补全模块,对缺失节点风险嵌入进行补全.最后基于图注意力网络,设计了风险评估模块,结合节点网络结构和风险特征,准确实现了节点风险评估.实验表明,文中提出的风险评估模型在准确率,F1分数等方面均优于现有模型,能够对产业链节点进行准确评估.
  • 毕盛,杨礼铭,董敏,沈煜
    2025, 46(8): 1809-1817.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对在移动机器人室内导航过程中,单一使用视觉语言导航算法无法充分利用语义中的方位和环境中的感知信息、无法导航至目标半米内的问题,提出了一种语言视觉激光多模态融合的机器人导航方法.首先,在全局路径规划中,标记地图中的导航点,保留其位姿、图像、点云图和各点之间的拓扑信息,通过多模态融合网络得到各导航点与目标的匹配权值,结合dijkstra算法和方位优化算法,规划出全局路径导航点序列.然后,在局部路径规划中,将多线激光与单目相机进行联合标定,结合目标检测、点云聚类和坐标变换方法得到目标具体位姿,发布导航任务,完成局部路径的规划.最后,通过仿真实验和真实环境实验,验证所提出的导航方法的有效性和可行性.
  • 李宇杰,孙奕,林玮
    2025, 46(8): 1818-1828.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,联邦学习作为一种突破性的方法,打破了传统集中式数据训练的限制,使得分布在各处的数据能够被有效利用,解决了数据孤岛和数据合规性使用问题.然而,随之而来的是日益严重的模型隐私泄露安全威胁,以及现有联邦学习隐私保护方案效率低下的挑战.针对这一问题,本文将掩码技术和差分隐私巧妙结合,提出一种基于成对掩码和弹性差分隐私的高效全流程隐私保护联邦学习方案.该方案基于噪声弹性机制,构建根据运行情况动态调整噪声规模的弹性噪声添加方法,在保护模型隐私的同时可有效降低噪声对模型性能的影响;另外,通过改进掩码添加方法,不仅可以提高模型聚合效率,还能提升方案对于掉线客户端的鲁棒性.最后,本文对方案的全流程隐私性和效率进行了分析,在MNIST、FashionMNIST数据集上验证算法有效性和可行性,并进一步探讨了隐私预算和松弛项对模型性能的影响.
  • 李想1,麻斯亮1,施晨2,龚芷仪3,黄俊2,许勇1
    2025, 46(8): 1829-1837.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    机器阅读理解是自然语言处理中的重要任务,不仅需要理解文本,而且需要依据复杂的逻辑结构进行推理.现有的逻辑推理模型通常通过构建文本的图结构并提取隐性或显性特征,但这些方法常因关注单一特征类型而受限,同时传统图卷积网络易导致节点特征平滑和收敛速度慢等问题.针对这些挑战,本文提出了一种融合对比学习与轻量化图网络模型.该模型在训练初期通过融入提示词工程思想加速文本理解;对文本构建语篇图与结构图,利用轻量化图卷积网络和图注意力转换器网络对各图进行特征提取,并通过动态注意力机制融合不同图的节点特征.此外,本文结合对比学习增强模型识别错误逻辑关系的能力.最后,本文在ReClor与LogiQA数据集上的大量实验表明,本文的模型性能优于基线模型.
  • 李彩云1,韩京宇1,2,缪祝青1,王彦之1,毛毅1,张怡婷1
    2025, 46(8): 1838-1846.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了支持历史轨迹数据的查询,通过学习型索引取代传统索引以减小索引存储代价和提升查询效率受到广泛关注.时空轨迹数据的分布不均匀,单粒度的模型不能兼容疏密不一致的轨迹数据;如果为每个周期数据分别构建一个模型,模型总存储大小线性增长;如果只维护一个模型,模型性能通常会随着历史轨迹的增多而恶化.因此,提出一种双粒度空间存储位置调整的历史轨迹索引,包括嵌入空间识别、初始周期模型构建和后期存储位置调整3个阶段:首先,利用密度峰值聚类算法将所有轨迹数据根据其稀疏性划分到粗细粒度层,在每个粒度层上,利用希尔伯特曲线获取轨迹点的一维排序,保证时空邻近的轨迹点排序值也接近;接着,在初始周期数据上构建分段线性模型;最后,后期数据利用初始周期构建的分段线性模型预测存储位置,采用KuhnMunkres算法解决模型预测存储位置产生位置冲突的问题.模拟和真实数据集上的实验表明,与其它的学习型索引相比,不仅提升了查询性能,而且显著降低了索引大小和模型维护成本,有效地支持以读为主的历史轨迹数据查询.
  • 赵学健1,2,叶昊1,2,3,江宇航1,袁凯4,孙知信1,2
    2025, 46(8): 1847-1860.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本研究针对单自动导引车(AGV)的路径规划问题,深入剖析了现有多阶段路径规划方法的局限性,并提出了一种融合改进D*与快速探索随机树(RRT)算法的路径规划算法.该算法结合了改进D*算法的高效性与RRT算法的灵活性,通过动态避障策略和目标约束优化,显著提升了路径规划性能.引入自适应视野、步长、威胁因子及目标点采样率等参数,以适应多变环境需求.利用Rich_Moore元胞自动机方法扩展可行区域并确定最短路径,并通过高阶贝塞尔曲线平滑路径,减少转向,提高路径平滑度.实验结果证明,该算法在精度和效率上均优于传统方法,对提升AGV作业实时性和准确性,推动自动化物流系统发展具有显著意义.
  • 李姝,谢睿,冯永新
    2025, 46(8): 1861-1868.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    飞行自组织网络FANET的高度动态性和不稳定性,导致通讯节点易失效、易受到攻击、欺骗等,为飞行自组织网络的可靠通信带来了巨大挑战.针对飞行自组织网络的高动态性以及链路不可靠问题,提出了一种基于强化学习动态特征驱动的可靠路由发现算法,并设计了一种基于强化学习的可靠路由协议RRAODV(Reliable Reinforcement AODV).首先,通过距离和相对运动速度矢量双约束条件进行可靠节点预筛选,预判并规避短期链路中断风险,有效避免因节点高速移动导致的频繁路径重建.其次,通过时间、质量、能量、空间四维联合链路评估方法,建立可靠邻居链路,改善了动态网络中节点易失效、链路易中断等问题.最后,通过Qlearning算法构建拓扑感知的智能决策引擎,将洪泛式路由发现改进为动态链路特征驱动的精准单播探索,解决了AODV协议洪泛广播的资源浪费、链路不可靠的问题.经实验表明,相较于AODV、AODVETX和PAODV协议,该协议在投递率和路由开销性能上均有改善,能够更好地适应飞行自组织网络.
  • 罗文涛,钱谦,潘家文,张晓丽,冯勇,李英娜
    2025, 46(8): 1869-1877.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了克服沙猫优化算法(SCSO)在高维优化问题上,易陷入局部最优和收敛精度差的问题,提出了一种单纯形法引导的自适应沙猫群优化算法(SASCSO).首先,采用了一种自适应围捕策略,使沙猫个体随机出现在自适应控制的算法搜索边界内,帮助算法逃逸局部陷阱.其次,利用单纯形法引导较差个体构建几何搜索路径以提升算法的搜索能力.与其他对比算法相比,SASCSO在100维度的CEC2017基准函数测试集的综合优胜率为75.86%,结合非参数分析表明该算法是解决高维复杂优化问题的可行方法.此外,将SASCSO应用于三维无线传感器网络覆盖和复杂环境下无人机航径优化问题,结果显示SASCSO在两个实际问题上均提供了最优的方案,验证了SASCSO在实际优化中的适用性和优越性.
  • 郑诚,纪子威
    2025, 46(8): 1878-1885.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和微调阶段的不同策略也限制了模型挖掘预训练模型的知识.本文提出一种结合对比学习和提示调优的层次文本分类方法,将层次标签信息嵌入到文本编码过程,同时设计提示模板整合标签信息,捕获文本与标签的关联性,弥合预训练模型与下游任务间的差距.借助对比学习,根据标签信息生成正样本,强化模型对关键特征的学习与保留,使模型有效指导文本特征表示的学习.在两个公开数据集上的大量实验表明了方法的有效性.
  • 董嘉巍1,2,刘娜1,2,袁野1,2,李磊1,2,胡云鑫1,2,任钦泽1,2,李清都1
    2025, 46(8): 1886-1892.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    会话是一种时序性与内部关联性极强的数据类型,不合理的建模方式往往会对会话情感识别任务的效果产生负面影响.由于会话具有天然的图结构,将会话建模为图,并使用图卷积神经网络(GCN)来提取会话信息是一种常用方法,但是天然获得的图结构往往存在大量噪声或者有缺失连接的情况,这会损害GCN的学习性能,仅使用GCN也很难处理内部关系丰富的会话信息.针对这些问题,本文提出一种自适应学习图结构学习的多模态情感识别方法.该方法使用添加了邻近稀疏自注意力机制的Transformer编码器结构作为上下文信息提取器,将简单级联的会话音频特征、文本特征、视觉特征作为输入.利用多层感知机设计了一种图结构生成器以生成良好的图结构,同时引入一种自监督去噪任务作为先验信息指导图结构生成器更新参数.其次利用关系图卷积网络和图Transformer作为局部信息提取器,有效地捕捉了会话中存在的复杂依赖关系.在数据集IEMOCAP(4way/6way)和MOSEI上与其他基线算法进行了对比实验,实验结果表明该方法在加权F1系数和准确率上都要优于其他基线算法.
  • 张睿琦,汪海涛,贺建峰,陈星
    2025, 46(8): 1893-1900.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    序列推荐算法可以通过对用户的交互序列进行建模来预测用户下一步交互的项目.但是现有的大多数序列推荐算法仅仅简单地将项目的位置嵌入和时间嵌入相加,这并不能体现位置和时间在不同场景下对于项目的重要性.此外,目前已有的研究经常忽视用户的多样化兴趣,未能有效捕捉他们的多种潜在兴趣.因此,该文提出融合胶囊网络的双向自适应序列推荐算法,使用自注意力机制自适应地为每个用户交互项目动态分配位置和时间信息相应的权重,同时使用胶囊网络从项目总嵌入中梳理出用户多变的兴趣爱好,并且抛弃了传统的单向提取项目的隐藏特征表示的方法,改用双向长短期记忆网络捕获用户多种兴趣偏好的上下文信息,更好地理解用户兴趣随时间的变化情况.经过在多个数据集上的实验评估,该算法相较于传统的基线算法,在各种评价指标上均实现了一定水平的提高.
  • 刘昕雨1 ,姜高霞1 ,王文剑2,3
    2025, 46(8): 1901-1909.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    标签噪声可能对监督学习模型的泛化能力产生较大影响.噪声过滤通过删减噪声样本来提升数据质量,是解决标签噪声问题的有效方法.然而,目前大多数标签噪声过滤算法会将一些潜在的有价值样本错误地标记为噪声,这种过度清洗会导致样本信息缺失.针对此问题,本文提出一种基于数据增强的联合标签清洗方法(Combined Label Cleaning Method based on Data Augmentation,CCDA),该方法通过多次在数据集上进行特征加噪增强、特征划分增强和组合增强,使用多次增强后预测结果的信息熵和一致性来评估样本的稳定性.将最不稳定的样本交由专家标注进行主动清洗修正标签值;将最稳定的样本利用模型预测的集成结果自动清洗.通过主动与自动方式联合实施针对性标签清洗,以较小的人工标记代价有效降低了标签噪声对模型性能的影响,提高了模型的泛化能力.实验结果表明,与所比较的方法相比,本文所提CCDA方法在不同噪声环境下都取得了更高的分类准确率,而且人工修正标记代价小.
  • 胡俊1,2,陈开心1
    2025, 46(8): 1910-1917.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    识别蛋白质多肽结合残基对于揭示蛋白质功能机制和探索药物发现至关重要.许多计算方法被提出来用于预测多肽结合残基.然而,由于特征表示质量的限制,预测性能仍有很大的提升空间.本文设计了一种新的深度学习模型PLPep,从蛋白质序列中挖掘出更多判别性信息,从而提高多肽结合残基预测性能.具体地,首先使用预训练的蛋白质语言模型(ESM2)来提取蛋白质序列高潜在判别表示.接着,设计了一个基于卷积的残差神经网络来训练蛋白质多肽结合残基预测模型.此外,改进了对比损失函数以提高模型的性能.两个独立测试集的实验结果表明,与大多数的预测方法相比,PLPep获得更高的马修相关系数(MCC)和AUC值.详细的数据分析表明,PLPep的主要优势在于利用蛋白质语言模型,仅从蛋白质序列中提取更多判别性信息以及利用改进的对比损失函数进一步优化不平衡数据集下的结合残基的特征表示.
  • 江庆南1,2,3,许浩然1,2,3,陈哲毅1,2,3,于正欣4,苗旺5
    2025, 46(8): 1918-1926.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    作为边缘系统中的一项关键技术,负载预测直接影响着资源分配和系统性能.传统的负载预测方法在面对具有明显趋势或规律的负载时可获得令人满意的预测效果.然而,鉴于边缘环境的高动态性以及多维数据的高度复杂性,传统方法往往难以取得精确高效的负载预测.同时,时空信息的引入对边缘负载预测所能带来的潜在价值也尚未得到充分研究.针对这些问题,本文提出了一种新型的基于多变量时空反转Transformer的边缘负载预测方法(Multivariable SpatioTemporal Inverted Transformer,MSTIT).所提出的MSTIT方法设计了一种静态内容感知层用于提取边缘负载时序数据的多维变量特征,并提出一种可学习的位置嵌入提取边缘节点位置的全局信息并以此捕获时序数据中的空间特征.接着,通过引入序列反转从而更好地利用Transformer的自注意力机制来关联多个变量与融合时空信息.因此,MSTIT 方法能够高效地提取边缘负载的关键特征,并充分利用时空信息,从而实现对多维、高动态边缘负载的准确高效预测.基于真实的边缘负载数据集,通过大量的实验验证和分析,证明了所提出的 MSTIT 方法的有效性.实验结果表明,与其他基准方法相比,MSTIT 方法具有更高的预测精度,并且在不同的预测场景下均表现出优异的性能.
  • 景彦迪,康平,侯家振,吕莉
    2025, 46(8): 1927-1934.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提出逆近邻和加权相似性的密度峰值聚类(DPCNWS)算法.算法设置局部密度时,引入逆近邻思想,充分考虑样本k近邻和非k近邻对样本周围环境的影响,能更容易在稀疏类簇找到类簇中心;在剩余样本分配时,使用自然近邻和共享近邻设定样本间的相似性,新定义的样本相似性更加符合样本的实际分布,避免了样本的连续错误分配,达到正确分配的目的.将DPCNWS算法与DPC、FNDPC、DPCCE、DPCDBFN、IDPCFA算法在数据集上进行聚类,对比实验结果表明,DPCNWS算法的聚类效果好.
  • 简献忠1,贺林涛1,郭强1,张武文2
    2025, 46(8): 1935-1941.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有的多模态活产预测模型中,由于输入比例失衡、互补模态间信息融合不足、囊胚图像差异性小以及数据集类不平衡等带来的模型预测性能不高的问题,本文提出了一种双向注意力的多模态Transformer活产预测模型.首先,该模型使用多模态增强模块平衡了各模态输入的比例,并提高了各模态特征的辨识度;其次,通过多模态双向注意力模块挖掘模态内与模态间的内在关联性,有效获取了细粒度的互补模态特征;最后,通过引入焦点损失函数解决数据集类不平衡的问题.在Blastocyst数据集上进行实验,实验结果表明:提出模型的准确率、精确率、召回率、F1值以及AUC指标分别达到了77.11%、74.51%、76.16%、75.33%和75.66%,与现有先进的多模态活产预测模型相比,预测性能更佳.
  • 秦文硕,李智杰,李昌华,张颉,介军
    2025, 46(8): 1942-1949.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    关系抽取(RE)是信息抽取的核心任务.近年来,CasRel模型通过实体映射来解决具有重叠三元组的复杂场景,该模型在关系抽取中的良好表现引发了人们的对相关研究的兴趣.但是该模型具有以下缺点:对文本中句子连续性考虑不充分、输入样本不平衡以及数据噪声对模型影响较为明显.针对以上缺点,本文提出一种基于CasRel的改进模型BACJRE(BiLSTMAttentionCRF Joint Relation Extraction).在数据方面,通过强化学习的手段训练出低噪声的数据样本;在模型方面,通过引入注意力机制使其充分接收句子信息.模型中的头实体联合解码器通过结合BiLSTM+CRF+Attention层,提高模型对于非结构化文本中句子的信息抓取能力;在模型尾端集成的Focal Loss函数优化了在样本分布不均的条件下的关系抽取性能.本文在WebNLG、NYT及NYT11HRL数据集上对BACJRE模型以及相关主流模型进行比对,实验结果表明BACJRE模型优于基线模型.
  • 郑志强1,王怿1,2
    2025, 46(8): 1950-1959.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出了一种基于改进去噪扩散概率模型(DDPM)的图像修复方法,特别适用于人物图像的修复任务.与传统图像修复方法相比,本方法通过引入渐进式采样策略和采样调度机制,提高了修复质量和效率.此外,本文还在模型微调中应用了LoRA技术,通过低秩矩阵分解大幅减少了计算资源的占用并应用缩放梯度下降法改进优化器更好地学习图像风格.实验结果表明,该方法在复杂纹理、非重复性结构及大范围缺失区域的修复方面取得了显著的效果,为图像修复技术的进一步发展提供了新的思路和方法.
  • 余鹰1,2 ,王景辉2 ,危伟2 ,钱进2
    2025, 46(8): 1960-1967.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,随着深度学习技术的飞速发展,研究人员开始尝试将Vision Transformer(ViT)应用于细粒度图像分类.然而,尽管ViT的多头自注意力机制赋予了模型强大的全局信息捕捉能力,但在关注局部微小且判别力强的区域上仍显不足,这在一定程度上限制了其在细粒度图像分类任务中的表现.为了解决这一问题,本文提出了一种高效且平滑地融合多层自注意力权重的方法,以深入挖掘图像的局部判别特征,从而弥补传统ViT模型在细节信息捕捉上的不足,增强模型对图像细微特征的敏感性.此外,本文构建了助理教师网络来指导学生网络学习多种粒度的特征信息,进一步提升其捕捉细微特征的能力.为了验证所提出模型的有效性,本文在多个基准数据集上进行了实验.结果表明,该模型显著优于传统ViT模型,展现了强大的局部特征捕捉能力和优异的分类性能.
  • 袁晓铭,王松雨,杨佳雨,王舒禹,邓庆绪
    2025, 46(8): 1968-1977.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,随着自动驾驶车联网的发展,单传感器的目标检测方式已经不能满足自动驾驶安全精确检测需求.对此,本文研究了基于FCOS的目标检测方法在毫米波雷达与视觉数据融合中的应用.通过提取融合后的特征,实现了在保证目标识别准确性的前提下,提升了目标检测的回归速度,尤其适用于自动驾驶场景下的目标检测.本文详细阐述了FCOS目标检测方法的网络架构和逐像素预测的思想,在此基础上,本文提出了基于注意力机制的特征融合方法,用于融合毫米波雷达和视觉数据.实验结果表明,该方法在仿真环境中具有良好的性能.最后,文章总结了研究成果,并指出了未来研究的方向.通过本文的研究,为自动驾驶领域中的目标检测问题提供了新的解决方案,为推动自动驾驶技术的发展做出了贡献.同时,也为深度学习在传感器数据融合领域的应用提供了新的思路和方法.
  • 姚志远,桑国明,张益嘉
    2025, 46(8): 1978-1985.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决传统的遥感图像描述算法对图像多尺度信息利用不充分的问题,本文提出了结合多尺度特征增强与记忆引导Transformer的遥感图像描述生成算法(MFEMGT).首先,利用预训练的视觉特征提取器提取图像特征,并将卷积神经网络中浅层与深层的特征进行拼接;其次,通过多尺度特征增强模块获得融合增强后的图像特征,以更好地捕捉多尺度特征;接着,将融合增强后的视觉特征输入记忆引导Transformer的编码器进行编码聚合;最后,通过Transformer记忆解码器生成图像描述.模型采用RSICD数据集进行训练,实验结果表明,MFEMGT在多个评价指标上的表现均优于当前主流的遥感图像描述生成算法,能够准确的描述图像内容.
  • 曹春萍,张迪
    2025, 46(8): 1986-1992.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    微表情运动微弱、短暂和局部化的特点,使得难以从微表情视频序列中相关的局部区域中提取有效特征,进而导致准确识别微表情变得十分困难.针对上述问题,基于残差网络和长短期记忆网络,提出一种结合多区域特征提取模块(Multiregion Feature Extraction Module,MFEM)和多层特征融合模块(Multilevel Feature Fusion Module,MFFM)的微表情识别方法.首先,对微表情视频序列采用欧拉视频放大算法实现运动增强得到灰度序列,并结合TVL1光流法的光流序列作为输入.有效特征提取阶段中,利用MFEM模块提取多个相关的局部区域中的显著特征,增强网络提取有效特征的能力;通过MFFM模块减少信息丢失,产生更综合的特征,提高模型学习微表情特征的能力;然后进行时序建模并分类.在casme2和samm数据集上进行实验,准确率分别达到84.959%、74.265%,UF1分别为0.855和0.604,优于现有方法.
  • 乔羽1,2,范慧杰2,3,付生鹏2,3,王强4,赵庭辉2,3,唐延东2,3
    2025, 46(8): 1993-1999.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前跨场景多目标跟踪算法主要使用目标的外观特征来设计跟踪网络,而无人机在飞行高度较高时跨场景同一目标之间的外观出现较大形变,基于外观的跟踪算法在跨场景同一目标关联表现较差.针对上述问题,设计适用于高空无人机跨场景多目标跟踪算法名为CSMTT,将跨场景多目标跟踪算法分为单摄像头跟踪和跨场景关联两个子问题.单摄像头目标跟踪是指运用局部关联模型得到前后帧目标之间的关系.跨场景目标关联是运用深度学习的图像匹配方法充分挖掘不同场景图像之间的拓扑关系,并设计优化匹配方法将跨场景之间的目标进行匹配.提出的算法在高空无人机数据集MDMT上取得了鲁棒的效果,跨场景关联指标MDA值达到37.4%,单摄像头目标跟踪MOTA和idF1分别达到48.97%和51.63%.
  • 周克伟1,王远军1,刘玉2
    2025, 46(8): 2000-2006.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    锥形束CT(Cone Beam CT,CBCT)对诊断成釉细胞瘤与牙源性角化囊肿至关重要,两种疾病在影像学上的表现较为相似,在鉴别诊断上非常困难.针对这一问题,本文提出了一种基于三通道输入和混合注意力机制的残差颌骨囊肿分类网络(THRNet).该方法以ResNet50作为基线网络,结合迁移学习策略使模型在小数量数据集上能有更好的表现;通过采用三输入结构以充分利用CBCT影像数据的上下文信息;引入混合注意力机制以加强模型对局部特征信息的学习能力.最后,在4314张三通道数据中,所提出的模型的平均准确率、特异性、灵敏度和F1指数分别为82.42%、84.03%、82.70%、和83.59%,相较于基线网络,分别提升了6.45%、3.88%、9.07%、4.43%.实验结果表明,所提出模型可以有效实现成釉细胞瘤与牙源性角化囊肿的分类.
  • 陈晋音1,2,严云杰2,郑海斌1,2
    2025, 46(8): 2007-2015.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    红外目标检测是指在红外图像中确定目标对象的位置和类别,在自动驾驶、安防监控和电气设备检修等领域应用广泛.然而,由于深度模型存在脆弱性,红外目标检测模型容易受到对抗样本的攻击,因此对其展开安全性测试至关重要.测试样本优先级排序方法可通过对待测样本的优先级排序实现高效测试,并通过样本重训练提高模型的鲁棒性.针对现有的优先级排序测试方法存在无法适用红外目标图像的目标检测任务的问题,本文提出了一种基于显著特征的红外目标检测模型的测试样本优先级排序方法,简称SigPri,使用傅里叶变换和模型反向传播梯度筛选红外目标的关键轮廓像素特征,通过原样本与变异样本输入深度模型时激活神经元值的变化筛选关键神经元,对筛选出的关键像素特征和关键神经元实现模型变异,最后将待测样本分别输入原始模型和变异模型,通过其输出差异判定样本优先级,从而实现测试样本优先级排序.最后在不同模型和数据集上展开实验,验证了提出SigPri方法的平均排序效果(RAUC)比现有最优算法提高了9.39%.本文相关的数据集和代码公开在连接:https://github.com/TDYraedae/infraprio.
  • 杨超荣,张朝晖
    2025, 46(8): 2016-2026.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为有效利用医学输入图像的局部特征与全局语义信息,从而获得边界更清晰、语义结构更完整的图像分割结果,提出一种结合CNN与Transformer的双流U型医学图像分割网络(DSUNet).首先,双流U型结构由用于局部特征提取的CNN分支和进行全局特征提取的Swin Transformer分支构成;之后,为实现局部特征与全局特征的优势互补,以通道注意力和空间注意力为基础,提出了CNN和Transformer的融合模块(CTFB),并将其作为DSUNet的重要组件,用于特征处理3个关键阶段双分支的信息交互与特征融合;此外,还提出一种用于双分支特征图与浅层多尺度特征图融合的跨分支信息增强模块(CBIE),为后续分割结果的生成做进一步的全局语义信息增强与浅层细节补充.以Dice相似系数与IoU值为评价指标,在GlaS、MoNuSeg、QaTaCOV19以及Synapse 4个公开数据集的对比实验表明,DSUNet优于其他大部分竞争算法,并在GlaS、MoNuSeg以及Synapse数据集上性能最优.
  • 李贵勇,刘兴康,谭衡祁
    2025, 46(8): 2027-2032.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了有效应对严重的路径损耗问题,可重构智能表面(Reconfigurable Intelligent Surface,RIS)将进化为超大规模RIS(Extremely LargeScale RIS,XLRIS).由于XLRIS的恒模约束,在多用户场景下,波束增益将面临严重损失,进而导致了用户传输速率的下降.针对这一问题,提出了一种近场波束设计方案.首先,改进一种近场分层波束训练方法,使其能够有效减小传播误差,从而得到最佳的码字.其次,分析XLRIS辅助通信系统的非凸优化问题,提出了一种多波束优化的的方案,并结合连续凸近似(Successive Convex Approximation,SCA)算法将这个问题转换为多个易于解决的迭代子问题.仿真结果表明,所提方案与现有方案相比能够实现更高的用户最小速率性能.
  • 罗文华,杨立圣,张鹏
    2025, 46(8): 2033-2040.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    流量分类模型更新易受数据投毒攻击,现有模型偏斜式投毒攻击防御方法聚焦特征固定的图像分类任务,面对特征复杂的流量分类问题适用性有限.针对上述问题,设计少特征攻击的投影梯度下降法,生成对抗样本进行偏斜式投毒攻击;提出特征感知变换自编码器的模型偏斜式投毒防御方法,在自编码器训练阶段引入特征感知噪声扰动,以限制扰动范围并增强自编码器对抗样本噪声过滤能力.通过构建流量数据变换自编码器重构并消除对抗样本的对抗性,利用变换后的样本数据与原始数据进行预测差异性判定,实现对抗样本判别过滤.实验结果表明,该方法能够有效识别新增训练样本中的对抗样本,降低偏斜式数据投毒攻击对流量分类模型的负面影响.
  • 任正伟1,2,孙敏1,刘竟诚1,余荣威3,王丽娜3
    2025, 46(8): 2041-2048.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    AFL因执行速度快而被广泛应用于软件漏洞的测试与发现,但由于依赖于源代码,其应用范围受到了限制.为此,研究人员研制了Linux系统下的无源码模糊测试工具drAFL,但drAFL的开销较大、测试效率偏低.本文在drAFL的基础上,设计并实现了drAFL++,以在Linux系统下实现对无源码二进制程序的模糊测试.相较于drAFL,drAFL++在启动方式和路径记录方式上进行了改进.在启动方式上,drAFL++通过动态二进制插桩工具DynamoRIO实现了Forkserver,并通过Forkserver启动子进程,以执行待测程序,从而提高了模糊测试的启动速度和执行速度.在路径记录方式上,drAFL++通过DynamoRIO对待测程序插桩以获取待测程序的执行路径,同时通过“寄存器+栈”的方式将待测程序的执行路径记录到共享内存中,从而减少了运行时的开销.实验结果表明,drAFL++能比drAFL更快触发崩溃,其平均执行速度是drAFL的1.5~3.7倍,并且能够在某些特定场景下触发AFL无法触发的崩溃.此外,drAFL++还能够与一些现有的工具结合使用,具有较好的可移植性.