过刊目录

  • 2024年, 45卷, 第6期
    刊出日期:2024-05-31
      

  • 全选
    |
  • 李炜卓,周文博,卢冰洁,高辉,边宇阳,张浩魏,那崇宁,许文杰
    2024, 45(6): 1281-1291.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    海量电子公文的高效管理一直是社会服务研究的热门话题.现有的研究工作主要聚焦在公文归档与要素抽取上,但并未提供开源的公文数据集,同时对于公文之间的关联性与时效性缺乏深入分析.文中的工作致力于从多个领域收集公文,构建一个高质量、开源的公文知识图谱,以此来填补上述研究工作存在的鸿沟.文中详细地展示了公文知识图谱的构建框架,包括轻量级本体的设计、面向小样本场景的要素抽取算法以及面向实体对齐的知识融合算法,以此让不同来源的公文能够共享更多的链接.此外,文中进一步讨论了公文知识图谱的潜在应用,并面向公文关联发现场景提出了一种基于要素抽取增强的网络表示学习公文推荐算法.实验表明,所提方法在评估指标Rankmin与MAP上整体效果均好于已有方法.
  • 张腾勋,许鸿飞,约瑟夫·范·吉纳比斯,熊德意,昝红英
    2024, 45(6): 1292-1300.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    表格-文本混合问答需要从异质数据中进行数值推理得到答案,当前的研究将问题、表格、文本拼接作为输入,但其中包含太多不相关的数值和文本会降低模型的性能.使用硬掩码机制将噪音去除以增强正确的数值表示会产生错误传播问题,本文提出一种新的软掩码机制对原始输入表示进行缩放,从而增强正确的数值表示,同时减轻错误传播问题,并且该机制可以灵活地运用到各种模型以及任务中.本文在FinQA、ConvFinQA和MultiHiertt数据集上进行实验,结果表明通过软掩码机制增强数值表示可显著提升模型的性能(+1.27/+1.65 Exe/Prog Acc、+3.09/+2.96 Exe/Prog Acc和+5.29/+3.45 EM/F1).本文还通过消融实验分析软掩码相对于硬掩码的优势,以及不同软掩码向量的影响,并讨论了当前表格-文本混合问答的局限性与未来方向.
  • 代劲,王银宗
    2024, 45(6): 1301-1310.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深度自编码器是异常检测的重要工具,通过异常样本由于分布的差异,无法在编码器中进行重构这一假设实现对异常的检测.而实际应用中,由于深度自编码器的泛化性较强,异常输入后也能实现较好重构,导致漏检情况发生.本文在改进注意力机制基础上,构建了一个散列记忆网络增强的自编码器异常检测方法,较好解决了这一问题.首先,模型将输入编码为编码信息,根据编码信息获取子查询向量,然后通过子查询向量获取子注意力权重及对应子索引,再将子权重交叉求和获得散列权重及索引并从记忆网络单元检索出解码信息,最后利用解码信息进行重构输出.重构的输出总是与正常数据相似,使得异常输入与重构输出之间的重构误差将被放大,从而让异常更容易被识别.仿真实验表明,本文提出方法在图像、视频监控、通用异常检测任务中,均取得了较好的检测效果.
  • 牙韩耀,万海斌,覃团发
    2024, 45(6): 1311-1317.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    可重构智能表面(Reconfigurable Intelligent Surface,RIS)技术是一种新兴的、绿色的技术,可以有效地实现频谱和能量的高效无线通信.本文研究基站(Base Stations,BSs)与RIS的联合波束形成中总发射功率最小化问题.由于人工智能(Artificial Intelligence,AI)在处理高维数据问题和非凸模型方面的优势,本文基于深度强化学习(Deep Reinforcement Learning,DRL)中的双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient,TD3),设计一种新颖的联合波束成形算法来处理RIS辅助无线通信系统的基站总发射功率最小化问题.仿真结果表明,本文所提算法的性能优于经典的交替优化算法,并且通过本文所提算法训练得到的模型可以直接部署和调用,不需要再次重复计算.
  • 吕维,钱宇华,王婕婷,李飞江,胡深
    2024, 45(6): 1318-1324.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类分析作为无监督学习领域的一个重要研究方向,是许多数据驱动应用的核心.但是高维数据特有的高维距离趋同特性,使得高维空间样本近邻结构遭到破坏,从而使得大量基于距离(基于近邻)的聚类算法性能急剧下降.目前,大量研究者认为,高维数据往往包含大量与任务不相关特征及相互关联的特征,其真实特征维度往往要比原始特征维度低很多.在学习样本低维等价表示上,基于深度自编码器的深度嵌入学习尽可能地保留重构信息.然而,现有此类方法往往需要聚类损失引导聚类,这虽然提高了聚类性能,但聚类损失与重构损失间的内在矛盾,限制了聚类性能的进一步提高.基于力导向图分布算法的降维算法则是尽可能保留近邻结构信息的基础上学习样本低维表示,但是高维距离趋同的特性使得此类算法较难准确获取样本高维近邻结构信息.本文在深度自编码器与力导向图分布算法的基础上引入特征加权思想,使模型在具有强大的低维等价表示能力及根据数据近邻结构凸显簇结构能力的同时考虑特征对聚类任务的适合程度.5个数据集上与最新高维聚类算法的对比实验充分证明了本文算法的合理性与优越性.
  • 占文韬,吴晓鸰,凌捷
    2024, 45(6): 1325-1330.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,由于Transformer模型中应用的多头注意力机制能够有效地捕获较长的上下文信息,基于Transformer的模型已经成为主流方法.尽管这些模型能够有效捕获全局上下文信息,它们在局部特征和位置信息提取方面仍然有限.因此,本文提出了一种基于多窗口注意力机制的中文命名实体识别模型.首先,通过基于Transformer的预训练语言模型RoBERTa把文本表征为字符级嵌入向量,捕捉深度上下文信息,得到全局上下文信息;其次,局部特征提取模块利用多窗口循环机制,在全局特征提取模块的引导下提取局部特征和位置信息;最后,所提出的多窗口注意力机制有效地融合全局特征和多个局部特征来预测实体标签.在CMeEE和MSRA数据集上进行了实验验证;结果表明,本文所提出的模型分别获得了64.31%和94.14%的F1值,性能优于其他同类模型,验证了其在中文命名实体识别的有效性.
  • 曹磊亮,谢瑾奎,郭天晟
    2024, 45(6): 1331-1338.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    图卷积网络(GCNs)通过迭代堆叠多层卷积聚合操作来学习节点的表示,在许多图学习的任务中显现出强大的潜力.但是,由于图卷积运算的过度平滑效应,大多数基于GCN的模型无法对深层进行建模.此外,实际应用中往往会有许多噪声数据,在深层建模时会极大地干扰GCN的节点分类性能.为了解决上述问题,本文提出了一种结合残差网络和噪声处理的节点分类模型(NHGCN).针对噪声节点,模型使用自适应的残差处理方法并修改了范数约束,提高了对噪声节点的修正能力.针对过度平滑问题,模型利用残差映射优化图卷积的信息传播,缓解了图卷积聚合操作中的梯度消失问题,保留了节点独特性,增强了节点分类效果.在Cora,Citeseer,Pubmed这3个公开数据集上进行了训练和测试,实验结果表明:相较于现有的节点分类模型,本文模型实现了更优的处理过平滑效果和抗噪性能.
  • 高典,张菁
    2024, 45(6): 1339-1346.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对被囊群算法(TSA)收敛速度慢,寻优精度低,易陷入局部极值等问题,提出了基于柯西变异的混沌自适应被囊群算法(KZCTSA).首先,采用Circle混沌初始化整个被囊种群,提高种群多样性,提升算法全局搜索能力;其次,引入自适应权重调整算法参数分配,平衡算法全局寻优和局部开拓能力;最后,使用柯西变异协调算法跳出局部最优能力.通过在10个基准测试函数上与其他算法比较寻优结果,并进行Wilcoxon、Fiedeman秩和检验评价算法性能,结果表明KZCTSA具有更好的求解精度和收敛速度.
  • 高旭章,凌书扬,陈壮志,宣琦
    2024, 45(6): 1347-1355.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了提高智能化信号调制识别任务的实时性,本文对用于信号调制识别的深度学习模型进行了轻量化研究.通道剪枝是减小模型复杂度的有效方法,但现有的方法受原始模型深度的限制,虽然剪枝后的计算量减少,但是加速效果并不明显.针对上述问题,本文提出一种面向信号调制识别的神经网络模型轻量化方法,以卷积层作为最小剪枝单元,为每个卷积层生成代理分类器,根据代理分类器的分类精度评估卷积层的重要性,移除重要性较小的模块从而实现剪枝,对剪枝后的模型进行微调,以恢复模型的准确率.在公开数据集上,对多种信号分类模型进行实验,与通道剪枝方法相比,可以更有效地加速模型推理,模型参数量和浮点计算量下降80%以上,推理时间下降70%以上.而针对在高压缩率下模型性能损失问题,本文提出以知识蒸馏代替微调过程,将“知识”直接从原模型转移到剪枝后的紧凑模型,相比于微调,准确率提升可达2%.
  • 陈胤杰,裴颂文
    2024, 45(6): 1356-1362.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对卷积神经网络在正向推理时的高计算复杂度与空间复杂度问题,提出了一种基于二值神经网络(Binary Neural Network,BNN)的过滤器剪枝算法(Binary Filter Pruning:BFP).BFP算法通过剪除L2范数较小的过滤器,构建剪枝压缩后的二值神经网络模型.进一步面向FPGA(Field Programmable Gate Array)平台,设计并实现了基于二值复值神经网络(Binary Complex Neural Network,BCNN)的ResNet-18加速计算模型.对二值复值卷积层与预处理过程中的卷积层,分别设计了数据预处理合并优化与数据重排序.实验结果显示,BFP算法在CIFAR10数据集上的分类精度,比基于SLR(Surrogate Lagrangian Relaxation)的通道剪枝方法平均提高了1%.与CPU平台相比,设计的加速器在PYNQ-Z1平台上的计算性能提高了23倍.
  • 鲜永菊,陈万琼,左维昊,汪帅鸽
    2024, 45(6): 1363-1369.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    移动边缘计算(MEC)与能量收集(EH)技术相结合,可以有效缓解终端设备计算资源与电池电量不足问题.然而,能量收集的动态性、任务到达的随机性以及网络信道状态的实时变化对MEC系统的任务卸载和资源分配带来极大的挑战.为了满足队列长期稳定,最小化终端设备完成任务的执行时间和能量消耗总成本,文章设计了一种基于深度强化学习(DRL)和改进差分进化的任务卸载和资源分配方案,首先通过Lyapunov随机优化理论,将随机优化问题解耦成每个确定时隙内的卸载决策子问题和资源分配子问题,然后通过DRL算法和改进的差分进化算法分别求解两个子问题.最后仿真结果表明,所提方案可以有效降低终端设备完成任务的总成本,并保证队列长期稳定.
  • 倪骥,王宇嘉,赵博
    2024, 45(6): 1370-1375.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合BERT预训练模型生成的动态字向量从而得到联合字向量;然后将联合字向量输入到双向长短期记忆(bidirectional long-short term memory,BiLSTM)进行双向编码,获得长序列语义特征;最后通过条件随机场(conditional random field,CRF)进行序列解码,学习标签之间的依赖关系,得到全局最优序列.将该方法在真实汽车生产设备故障领域数据集上进行实验,得到的精确率、召回率、F1值分别为88.4%、90.2%、89.3%.
  • 翟海霞,蔡文达,刘小燕,罗军伟
    2024, 45(6): 1376-1383.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    序列组装是利用测序技术得到的读数(read/序列片段) 恢复完整基因组序列的方法.当前,第三代测序技术,如单分子实时(SMRT) 测序技术和牛津纳米孔技术(ONT),能够产生长度超过10 kbp的读数,从而可以解决序列组装中的重复区问题.但是,其测序错误率高达10~15%,使获得完整和准确的基因组序列仍然是一项具有挑战性的工作.最近出现的PacBio HiFi 测序技术可以产生长度长(>10 kbp)并且准确性高(>99.9%)的读数,促进了序列组装领域的研究发展.但是,如何充分利用HiFi读数的优势,开发设计高效的序列组装方法是当前的研究热点.alphaHiASM是一种新的基于HiFi读数和k-mer分布特征的序列组装方法,该方法首先针对HiFi读数长度长和准确性高的优势,设计了一种基于k-mer分布特征的HiFi读数重叠区检测策略.然后,根据上一步检测到的HiFi读数之间的重叠区,以HiFi读数为节点,构建读数重叠图,并提出一种可以衡量重叠区可信程度的边权重计算方法.接着,在该读数重叠图中,抽取路径,形成初始组装结果.最后对初始组装结果进行优化纠错,形成最终结果.该方法在4组不同的真实数据集上和当前流行的组装方法Flye,HiCanu和miniasm进行了性能比较.实验结果表明,alphaHiASM在组装完整性和正确性具有一定的优势.
  • 王珍,武优西,孟玉飞,李艳
    2024, 45(6): 1384-1391.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    作为数据挖掘的一个新兴方向,研究人员在时间序列领域提出了用于挖掘相对次序相同的保序模式.尽管现有的保序模式挖掘算法可以有效地找出全部的频繁模式,但在当用户仅对某个特定的模式及其为前缀的模式较为感兴趣时,现有的挖掘算法效率过于低下.为了解决上述问题,本文提出了一种共生保序模式挖掘算法,用于挖掘出以给定模式为前缀的共生保序模式.该算法包括融合准备和计算超模式的支持度两个主要部分,其中,融合准备分为4个步骤:获取模式p的后缀保序模式,计算后缀保序模式的出现,前向验证模式p的出现,后向查找所有可融合模式的出现;在计算超模式的支持度时,提出一种剪枝策略,使得候选模式的个数进一步减少.在真实数据集上,实验结果验证了本文算法的高效性.
  • 王誉熹,彭敦陆
    2024, 45(6): 1392-1397.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    会话推荐是根据匿名用户的交互序列去推荐该用户下一个最有可能交互的项目.在现有的会话推荐模型中,大多数模型只学习了图的单层信息,这种学习方式会导致对交互序列的信息提取不完整.本文提出了一种结合项目的图级信息与序列级信息的推荐算法.图级信息是将用户的交互序列映射为一个高维空间超图,通过超图神经网络去学习图中每个节点的信息;会话中项目的序列级信息采用深度序列提取器和注意力网络去获取,最终将两组信息融合并通过自注意力网络进行下一项推荐.通过这种方法可以获得会话序列中每个项目更完整的信息.本文在真实数据集Diginetica,Tmall,Nowplaying上设置对比实验验证了算法的有效性,该算法在MRR@N和P@N上有明显提升,有效地证明了本文算法的推荐性能.
  • 王勇,陈秋怡,苗夺谦,杨宁创
    2024, 45(6): 1398-1404.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在机器阅读理解任务中,如何在包含不可回答问题的情况下提高答案的准确性是自然语言处理领域的一项重要挑战.虽然基于深度学习的机器阅读理解模型展现出很好的性能,但是这些模型仍然存在抽取特征冗余、语义信息不全面、问题分类任务和答案抽取任务耦合性不强的问题.为了解决以上问题,本文提出一种结合门控机制和多级残差结构的多任务联合训练模型GMRT(Gated Mechanism and Multi-level Residual Structure for Multi-task Joint Training),以提升机器阅读理解任务中答案预测的准确性.GMRT构建门控机制来筛选交互后的关联特征,从而控制信息的流动.采用多级残差结构分别连接注意力机制和门控机制,保证每个阶段都保留原始语义信息.同时,通过边缘损失函数对问题分类任务和答案抽取任务联合训练,确保预测答案过程中任务之间的强耦合性.在SQuAD 2.0数据集上的实验结果表明,GMRT模型的EM值和F1值均优于对比模型.
  • 刘政,李勇,胡立坤
    2024, 45(6): 1405-1412.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前人工智能技术在康复领域大多用于严重运动障碍群体,而中国现阶段人口老龄化加剧,会导致轻型运动障碍人群的大量增加,亟需更加智能化的运动训练与康复系统.针对轻型运动损伤患者以及普通老年群体,本文提出了一种基于视觉的运动信号感知与虚拟现实的康复辅助系统,该系统通过实时推断人体骨骼模型,利用虚拟现实游戏与骨骼点运动进行交互,实现引导康复动作,最终对康复动作进行评价并给出交互界面提示.本文招募受试者参加实验,在闭环训练中受试者通过本文系统在虚拟康复游戏的引导反馈下复现标准康复动作,对比分析受试者实验结果,验证了所提出方法的有效性与可行性.
  • 王军,林宇航,贾玉彤,张华良
    2024, 45(6): 1413-1417.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在移动机器人自主作业时,环境中往往存在障碍物,路径规划避障时要进行动态目标检测.Canny边缘检测算法可以与众多动态目标检测算法相结合,提高目标检测的效果.但是传统Canny边缘检测存在着自适应性不强,边缘检测可能不连续,或者检测虚假边缘的现象.本文提出了一种优化Canny边缘检测算法,通过改进的自适应中值滤波来预处理图像,对算法效率及对噪声点的处理做出了优化,紧接着增加梯度计算方向,最后结合改进的大津阈值分割法,提出了三阈值分割法代替原始的阈值分割法使图像边缘信息更加完整准确.仿真结果表明,该算法在边缘检测准确率上对比传统Canny边缘检测,Sobel算子与较新改进算法均有20%左右的提升,该算法优化了传统算法检测的连续性和准确率.
  • 王思超,汤颖
    2024, 45(6): 1418-1425.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    交通流量预测作为智能交通系统(ITS)的重要任务之一,受到极大关注,其常被建模为时空序列预测问题,准确把握交通数据的时间-空间相关性成为了解决此问题的关键,现有的工作往往采用循环神经网络以捕获时间依赖性,采用图卷积网络以捕获空间依赖性,两者尚未有机的结合且捕获时空依赖的能力有限,导致预测精度不佳.本文提出了用于交通预测的基于自相关注意力和动态卷积的时空网络(AADCSN),设计采用类Transformer架构,结合自相关注意力与动态学习图卷积有效捕获交通数据的时间特征与空间特征,并引入数据蒸馏技术和多种嵌入表示有效提升预测性能.论文选用4个真实数据集和9个先进的基线方法进行比较,实验结果表明,本文提出的模型在几乎所有对比指标上都优于基线模型.
  • 王海鹏,丁卫平,黄嘉爽,鞠恒荣,曹金鑫,刘传升
    2024, 45(6): 1426-1435.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    准确的医学图像分割对于疾病的诊断和治疗至关重要,将多个模型提取的分割特征进行联合使用时存在异质性、不确定性等问题,针对这一问题,本文提出了一种基于模糊融合策略的Transformer-CNN模型(FTransCNN).首先以CNN和Transformer作为骨干网络,并行提取图片的特征信息;其次使用通道注意力促进Transformer全局关键信息,使用空间注意力增强CNN特征局部细节;接着应用Hadamard乘积对来自两个分支特征之间的细粒度交互进行建模,用Choquet模糊积分抑制融合特征的异质性以及融合特征的不确定性;然后使用Fuzzy Attention Fusion Module(FAFM)分级上采样,有效地捕获低级空间特征和高级语义上下文;最后反卷积得到最终的分割结果.在Chest X-ray数据集、Kvasir-SEG数据集和DRIVE数据集上的实验效果表明,FTransCNN与其它深度分割模型相比,在分割任务上有更好的效果.
  • 冯博,刘万平,南海
    2024, 45(6): 1436-1443.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深度学习算法已经广泛应用于对抗样本领域.针对图像领域模型生成对抗样本,是发掘图像领域模型的弱点并完善对抗样本检测方法的关键.本文提出一种结合最大内接圆的图像对抗样本生成算法,通过作决策边界的最大内接圆计算出最近决策边界与该圆的切点即为对抗样本点,有效提升了生成对抗样本的成功率和欺骗性.实验使用ImageNet和Cifar10数据集对ResNet18,GoogLeNet,VGG16,MobileNetV2模型生成对抗样本.在本文选取的样本中,ImageNet数据集对这4个模型生成的平均对抗扰动量分别降低了0.1093、0.1697、0.0952、0.0905,Cifar10数据集对这4个模型分别降低了0.0045、0.0049、0.0072、0.0041.这体现了本文方法的优越性与普遍适用性.
  • 张栩嘉,白淼源,郭继峰
    2024, 45(6): 1444-1450.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对跨域行人重识别任务中域间差距和噪声标签导致的模型识别准确率低、稳定性差的问题,本文提出一种结合域间一致性与抗噪学习的跨域行人重识别方法(SZTR).该方法将生成对抗网络应用到预训练中,并且设计一个预训练中的一致性正则化损失,用来保持行人图片风格迁移前后预测概率的一致性,以减小域间差距.在目标域的训练中引入更稳定的动量对比模型来提取样本特征,加入鲁棒性更强的自适应权重损失微调模型,以减小聚类过程中噪声标签带来的负面影响.实验结果及分析表明,所提方法有助于提升模型在跨域行人重识别任务上的准确度,取得了更稳定的识别效果.
  • 郑义林,缪君,罗超,储珺
    2024, 45(6): 1451-1459.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于深度学习的多视图三维物体重建各个视角之间的特征往往相互独立、缺乏关联性.并且可用的三维信息难以融合,导致无法重建出具有细节特征和结构完整性的单个物体,为此,提出一种端到端的结合跨视角特征关联的三维物体重建算法.首先,在重建的编码部分构造跨视角关联模块,通过计算不同视角像素点之间的相关性,使每个视角都携带其它视角的特征信息,同时利用多尺度信息有效地聚合具有不同感受域和全局上下文特征,再构造视角信息注意力增强模块,增强视角内目标物体各部分特征的关联;其次,在三维解码部分,提出三维体素融合模块,通过选择性融合各视角中目标物体的高精度部分,使重建物体具有更多的细节.本文方法在合成数据集ShapeNet上和真实世界数据集Pix3D上的实验结果表明,与当前最先进的方法相比,重建效果有较明显提升.
  • 孙红,陈玉娟,宋冬豪
    2024, 45(6): 1460-1465.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    常用的细粒度分类方法通过提取局部信息学习细粒度特征,容易忽视周围环境因素影响问题,造成分类精度下降.针对这一问题提出了一个简单有效的框架,称为选择性稀疏采样.通过类峰值响应产生稀疏注意定位有信息的对象部分,根据图像内容选择动态数量的稀疏注意,生成判别性和补充性两个分支进行视觉表示,使得特征部分和全局信息相辅相成.对于容易产生混淆的部分,引入了一个“梯度增强”损失,只关注每个样本的混淆类,为补充性分支提供更多的细节特征.通过实验结果表明,该方法在常用数据集的基准测试中分别达到了88.6%,92.8%和94.8%的精确度,验证了该方法的有效性.
  • 李嘉坤,王瑞锦,张凤荔,李冬芬,孙永佼,应时
    2024, 45(6): 1466-1473.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    图(网络)是一种常用于抽象现实世界实体之间关系的数据结构,网络嵌入广泛应用于图数据的表征.目前大部分异质网络嵌入方法未考虑网络节点之间的多种边类型和边属性,无法完整刻画网络的结构和语义信息,导致原始网络特征信息丢失和下游任务效果差的问题.为解决该问题,基于注意力机制设计了一种多边属性异质网络嵌入方法,其将注意力机制应用于学习不同边类型下嵌入向量的重要系数,通过有偏序列采样、邻居向量聚合和模型参数更新3个阶段的嵌入学习,将网络节点表示成固定长度的稠密向量.实验表明,提出的嵌入方法能够更好地嵌入网络的特征信息,使之在下游的机器学习任务上有一定的效果提升.
  • 张晓龙,罗文华
    2024, 45(6): 1474-1481.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络入侵检测任务中应用联邦学习技术可以在参与方数据本地化的同时扩充标签数据数量,以此得到性能更优的检测模型.然而,联邦学习训练过程通常涉及服务器与参与方之间的多次交互,而在交互过程中,参与方上传的参数容易受到攻击者的恶意窃取,造成数据隐私泄漏.针对此问题,提出了一种基于动态梯度裁剪的差分隐私保护方法DCDP,DCDP选取训练过程中梯度的L2范数分位数作为裁剪阈值,之后通过参数噪声传递实现参与方数据隐私保护,保证了噪声添加合理性,从而避免手动设置阈值造成的性能受损.改进联邦平均算法FedAvg,添加Macro-F1指标进行加权聚合,得到新的网络入侵检测算法DCDP-FedF1.通过在CICIDS2017数据集上进行对比实验,证明了DCDP-FedF1的有效性和先进性.
  • 刘旭冉,任智,舒俊辅,张关鑫
    2024, 45(6): 1482-1488.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在短波令牌环组网过程中,由于节点入环的随机性,形成的令牌传递顺序存在多余的中继,导致令牌控制开销过大,网络时延增加,从而影响到整个网络的性能.为了解决上述问题,本文提出了一种自适应蚁群算法优化的短波令牌环协议.首先,由一轮令牌传递得到网络全部节点的距离矩阵,用来构建初始解空间.其次,通过蚁群算法求解每轮周游的最短路径并对各节点的信息素强度进行更新.最终,经过多次迭代比较后,即可得到最优传输路线.实验表明,优化后的协议重组了相邻节点间前驱后继的关系,省去冗余的令牌转发过程,最大化减少了整个环周期长度,从而节省了令牌绕环的时间.同时在网络平均时延和总控制开销方面明显优于现有协议,验证了该协议的可用性和优越性.
  • 陶洋, 杜黎明, 申婷婷
    2024, 45(6): 1489-1495.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对当前加密流量识别分类研究对时空特征提取不充分以及网络架构引起特征信息损失的情况,该文提出了一种基于双分支多阶段时空特征融合(DBMS-SFF)的加密流量识别分类方法.本方法聚焦于加密流量的“字节-数据包-会话流”层次结构特点,设计两个并行的网络分支进行特征提取,分支一采用门控循环神经网络(GRU)及其变种BiGRU分别提取数据包内部相邻字节、相邻数据包之间的时序特征,并在此基础上利用多头注意力机制赋予关键特征更大的权重.分支二使用异于常规感受野的方式,利用不规则大小卷积核组成的多尺度卷积神经网络(CNN)作用于流的“字节-数据包”两个阶段对空间信息进行表征.在公开数据集上ISCXVPN-nonVPN2016实验表明,本方法的模型总体准确率为97.6%,平均F1得分值97.5%,均显著高于对比的模型.
  • 韩美灵,孙施宁,金曦,邓庆绪,郑彬双,夏长清,宋波
    2024, 45(6): 1496-1503.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    异构多核平台的发展,导致并行任务需要执行在具有多样性资源的多核平台上.虽然,并行任务的某个程序片段只能在规定的资源上执行,但是这样操作可以充分利用各类不同资源的特性,达到更加快速节能处理任务的目的.同时,具有资源限制任务的可调度性研究在实时嵌入式系统领域已有一定的研究成果,但是采用的任务模型相对简单,分析方法不够精确.鉴于此,本文对具有资源限制性的并行任务在全局固定优先级调度策略下的可调度性问题进行了研究,基于单并行任务的分析方法提出了基于全局固定优先级调度策略的分析方法.首先,基于分解策略提出了高优先级任务干涉的分析方法.然后,将高优先级任务干涉分析方法和单并行任务提出的路径抽象技术相结合,推导出并行任务的最差响应时间算法.最后,通过仿真实验进行验证所提出的算法在可调度性、精确度层面的性能.实验结果表明,提出的算法在各个参数下的接受率实验符合实验预期,分析时间相对降低,但平均分析时间仍然在离线分析的可接受范围内,提出的算法能够对实时系统并行软件设计提供一定的指导价值.
  • 钟唯磊,杜扬,孙玉娥,黄河
    2024, 45(6): 1504-1511.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对网络流的频数进行测量能够为现代高速网络管理提供极为重要的决策依据.现有的测量模型往往为每个计数器分配较大的长度,从而避免大流的计数值溢出计数范围.但是真实网络流存在偏斜分布的特性,绝大部分网络流都是小流,仅有少部分流是大流.由于占用了大量存储资源的计数器在大部分情况下只存储了小流,导致现有策略存在内存浪费、不适应分布不均匀的真实数据的弊端.为此本文提出了一种基于“双向计数器”的网络流频数测量模型 AS(Arena Sketch).AS 将内存空间划分为块,并引入“竞争机制”为网络流自适应地分配内存块.具体而言,双向计数器由两个指纹域和一个计数域构成,大流能够在指纹域保留自己的流标签信息,而越大的流能够竞争到越多的内存块用于记录其频数.一旦在指纹域保留签失败,就将所有内存块视作独立的计数器,重新构建二维计数器数组,组成经典紧凑数据摘要 Count-Min Sketch,该流则被作为小流在 Count-Min Sketch 近似记录.AS 既消除了大流的溢出风险,也尽可能多地记录了小流,仿真实验表明,该测量模型在逐流频数测量任务和过阈值流频数测量任务中均达到了比先前工作更高的精度和更低的存储消耗.
  • 唐成华,杜征,关晓龙,强保华
    2024, 45(6): 1512-1520.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    污点分析中的隐式信息流由于其通过控制流传播污点的特性导致许多基于数据流的污点分析技术无效或分析效率低.本文提出了一种简洁有效的基于重组粒度的隐式信息流污点传播能力判别方法.通过预定义重组链构建规则,并基于程序切片和控制依赖关系给出了隐式信息重组链构建算法,在重组链各端点的信息重组粒度计算的基础上,获得隐式信息流的重组粒度及重组比值,能判别其污点传播能力.此外,实验开发了一个包含15个隐式信息流代码段的隐式信息流测试集IIF-Bench,并用来验证了判别方法的有效性和良好独立性,使其易于作为扩展添加至其它静态污点分析方法中从而实现隐式信息流分析的能力.
  • 张小梅,陈建伟,谢金宏,王姝妤
    2024, 45(6): 1521-1528.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统密文策略的属性基加密(CP-ABE)方案中存在非即时的属性撤销以及不可靠的恶意用户追踪问题,提出了一种支持高效的属性间接撤销和白盒追踪的细粒度CP-ABE方案.首先,以有序二元决策图作为访问控制结构,基于椭圆曲线加密算法设计密文策略的属性基加密方案,并将变色龙哈希算法集成到区块链中,实现即时属性间接撤销.进一步,将关联用户身份ID和密钥的参数存储在追踪列表中,构建新的追踪算法,并将追踪列表上传至区块链,确保恶意用户无法抵赖其非法行为.特别地,采用云服务器存储不变密文和区块链存储策略密文这一双重密文存储模式,有效实现数据存储和用户细粒度访问控制管理之间的解耦.安全性分析证明所提方案在IND-CPA安全模型下是安全的,并能够抗合谋攻击;性能分析表明所提方案相比于其他方案在计算性能上更适合资源受限的终端设备.
  • 嵇友晴,卢跃,潘世文,张迎周,谢金言
    2024, 45(6): 1529-1536.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前大部分基于深度学习的漏洞检测模型,通常以整个文件或函数作为输入,检测粒度较粗,存在准确率低下、可扩展性差等挑战.为了应对这些挑战并提升漏洞检测技术的性能,同时针对静态切片方法在发现特定执行条件下的漏洞存在不足的问题,提出了一种基于动态切片与预训练模型的代码漏洞检测方法.通过动态切片获取包含路径特征的语句块,借助CodeBERT预训练模型的语义提取能力将具有语义特征和路径特征的动态切片结果表示成二维张量;将代码结构和语义特征编码成灰度图像中的像素值,借助Swin Transformer的特征提取能力,以此更准确地进行漏洞检测.实验数据表明本文的方法取得了较好的效果,可降低误报率和漏报率,同时提高漏洞检测的准确性和可靠性.