过刊目录

  • 2025年, 46卷, 第2期
    刊出日期:2025-02-08
      

  • 全选
    |
  • 陶蔚1,2,陇盛2,刘鑫3,胡亚豪3,黄金才2
    2025, 46(2): 257-265.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前,以深度神经网络和预训练模型为基础的生成式人工智能受到学术界和工业界的普遍关注.深度学习的研究达到前所未有的高度.自2015年提出以来,无论是图像、语音还是文本等领域,以Adam为代表的自适应动量优化方法,因其快速的收敛速度、适应各种梯度和参数变化的能力,已经成为深度学习训练的首选方法,但是仍然存在:1)算法的全局收敛性较差;2)参数选择策略与理论分析不一致;3)针对不同任务的泛化性能有待进一步提升.为分析并解决以上挑战,研究者们分别使用自适应步长和动量两种优化技巧对自适应动量方法进行了大量研究.本文是这一类方法的研究综述,首先回顾了深度学习优化的发展背景与面临的挑战,重点介绍了一阶梯度条件下的自适应步长方法、动量算法、步长自适应动量算法、大模型中的应用等,尤其是针对凸情形下收敛性研究进展进行了系统梳理,最后展望了步长自适应动量算法未来发展方向.
  • 戎小玉1,赵海燕1,曹健2,陈庆奎1
    2025, 46(2): 266-273.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    企业内部存在着大量的业务过程,这些业务过程的模型可能会发生变化从而使得一些数据分析的算法失效.检测过程模型变化这一“概念漂移”现象对业务过程管理具有突出的意义.目前的过程模型概念漂移检测存在参数过多,特征抽取复杂等问题.本文中从过程模型的变化伴有新活动对的出现、旧活动对的消失以及活动对出现频率的变化这一基本现象出发,设计了一种简洁高效的检测框架.在该框架中,针对活动对的出现和消失设计了对活动对出现的轨迹索引进行差分的检测方法;针对活动对频率的变化,在轨迹索引差分的基础上首次运用统计过程控制的工具来检测概念漂移.为了验证本文提出方法的性能,使用合成日志和真实生活日志进行评估,并将本文方法与2种相似方法和4中不同方法进行了实验对比,实验结果表明,本文的方法有效且有更高的精度.
  • 刘玉婷1,2,3,丁鲲1,3,刘茗1,3 ,王保卫2
    2025, 46(2): 274-279.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    脚本事件预测旨在根据脚本中的历史事件预测最有可能发生的后续事件,这需要有充足的事件样本并拥有学习到更多的上下文信息的能力.以往的方法主要关注局部信息,因而对事件的表征不充分.该文提出了一种基于预训练和微调的方法,通过对抗训练增强样本和联合损失微调来获得更全面的语义信息.首先利用MLM任务和FGM的方法,使模型利用少量信息完成信息间的交互并获取到更多的事件信息.为确保有相同输入的文本能够有一致分布的输出,在微调阶段进行RDrop调优,进一步提高模型的性能.在广泛使用的《纽约时报》语料库上的实验结果表明,该文提出的方法提升了脚本事件预测的预测性能.
  • 李英豪1,刘盼盼1,王文猛1 ,刘晓亮2,韩志勇1,刘成明1
    2025, 46(2): 280-288.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有部分任务卸载方法未考虑排队时延及训练过程采样效率低等问题,提出了一种基于多智能体深度强化学习的任务卸载方法.首先,综合考虑任务量、服务资源、队列的负载情况等因素建立面向时延和能耗联合优化的边端协同卸载模型,其次,将该模型表述为马尔可夫决策过程,目标为最小化系统的总成本.然后引入优先经验回放机制和重要性采样对多智能体深度确定性策略梯度算法进行改进,利用长期环境信息高效探索任务卸载的最优解决方案.最后,将本文算法与基于MADDPG、D3QN、DQN和随机卸载算法的性能进行了比较,仿真结果表明,所提出的算法在各项指标上表现更优.
  • 刘芳1,3,陈子煜2,马昆2,彭敏1,何炎祥1,胡威2
    2025, 46(2): 289-296.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在嵌入式实时系统中,边缘智能技术显著提升了计算性能.然而,确保任务时效性、提高效率、降低能耗和系统阻塞仍然是关键研究领域.本研究专注于同质多核系统的任务调度问题,提出了一种名为“基于相关性的任务分区节能调度策略”(CBTP)的节能调度策略.CBTP通过深度分析任务之间的依赖关系,为它们分配最优处理器,减少资源争用和阻塞.为了实现高效的并发访问,采用了多处理器堆栈资源协议(MSRP)和高性能的分区最早截止优先调度算法(PEDF).同时,CBTP引入了双速节能机制,结合动态电压和频率调整(DVFS)来灵活调整任务的执行速度.实验结果表明,CBTP策略明显优于传统方法,显著降低了系统阻塞和能耗,验证了其在同质多核系统中的卓越性和有效性.这项研究提供了一种新的视角,旨在边缘计算环境下来提升实时系统的调度性能,同时提高调度的能源效率.
  • 郭锐锋1,3,常志军1,2,3,董美2,3,张建勇2,3,钱力2,3,董智鹏2
    2025, 46(2): 297-304.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大规模科技文献知识库的全量引文耦合关系因计算量巨大的难题,阻碍了引文耦合知识服务在诸多业务场景的应用.本文提出了一种适用于大规模文献知识库的全量引文耦合度计算算法,根据施引特征过滤没有耦合关系的无效组合,避免计算过程中稀疏矩阵的产生,并引入多模式匹配技术,优化算法的整体时间复杂度为O(n log z).本算法在生产环境中依赖分布式搜索引擎集群完成工程化实施.在国家科技图书文献中心的3600万篇科技文献数据库上,对该方法与传统引文耦合方法进行了多组实验对比,并生成了6.59亿论文对的耦合度数据,为国家科技图书文献中心的引文耦合知识服务提供了数据支持,验证了该方法的准确性和实用性.
  • 路垚1,段红军2 ,张利莹1,王振飞1
    2025, 46(2): 305-313.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    元数据的存取性能对于分布式文件系统至关重要,近年来已成为学术界和工业界研究的热点.早期的分布式文件系统未严格区分元数据和数据管理,导致可扩展性和性能优化方面的挑战.针对此问题,主流分布式文件系统采用元数据和文件数据分离的架构,以提高系统的可扩展性和效率.然而,随着数据量的进一步增长和对系统性能的不断追求,最新的文件系统开始提出将元数据进一步细化管理的概念.这一趋势意味着系统对元数据的管理将更加精细化和灵活,能够更好地适应不断变化的需求和数据规模.对国内外分布式文件系统元数据管理方案的最新进展进行归纳、比较和分析,并结合国家发展战略和重大应用需求,选取与我国国计民生密切相关的领域,从典型应用分析总结元数据相关技术的行业进展.最后,就未来的技术挑战和研究方向进行展望.
  • 邓福康1,4,许英豪2,张建山3,4,陈星1,4
    2025, 46(2): 314-320.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着物联网和5G的不断发展,用户对流畅体验感的需求日益迫切,对于数据传输速率、响应延迟和服务质量的要求不断提高.边缘计算范式能够使服务器更加接近用户和设备,更快地响应数据请求,提高网络的效率和可扩展性,从而提供更好的用户体验.在此基础上了,本文提出了一种多边缘计算服务器协同提供计算服务的网络系统模型,并定义了服务部署和计算任务卸载联合优化问题.针对该问题,提出了一种基于蚁群优化算法(Ant Colony Optimization,ACO)的服务部署和计算任务卸载联合优化问题解决策略.实验结果表明,相较于基准策略,所提出的策略能够显著降低任务完成时延和能耗,并有效提高网络的效率和可扩展性.
  • 赵敬华,李澳,张景彦
    2025, 46(2): 321-329.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在线社交网络用户的人格与其行为模式、需求偏好和心理健康密切相关.本文提出了一种融合多特征的在线社交网络用户人格预测方法.该方法构建了一个在线社交网络用户人格特征体系,通过提取数字信息中的文本特征、行为特征、语言特征和情感特征,采用早期特征融合策略,使用微博平台数据,对用户的MyersBriggs Type Indicator(MBTI)人格类型进行预测.实验证明,本文提出的融合多特征的方法相较于简单基于文本特征的方法在分类的效果上更为出色,准确率和F1值分别提升了2.44%、2.59%.同时也表明,CNN在融合多特征的在线社交网络用户人格预测任务上展现出卓越的性能,而BERT结合BiLSTM在人格的信息收集方式和决策方式维度上表现出明显优势.
  • 陆鑫涛1,2,孙丽萍1,3,凌晨1,童子龙1,2 ,刘佳霖1,2,汤其宇4
    2025, 46(2): 330-338.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    中文电子病历结构复杂,且相较英文具有更多的一字多音与一音多义现象,给命名实体识别任务带来了挑战.随着技术的成熟,当前主流的基于字形特征的命名实体识别方法难以获得较大提升,因此本文提出一种融入拼音与词性特征的中文电子病历命名实体识别方法,利用BERT预训练模型获取医学文本的动态向量表示,借助中文拼音特征对电子病历文本进行深度挖掘,并提取词性特征对拼音特征的不确定性加以约束.此外,对于这3种类型的特征,本文采用缩放点积注意力模块进行融合.在医疗领域数据集CCKS2018、CCKS2019,通用领域数据集Weibo上,F1 值分别达到了 98.66 、87.25、73.41,相较基准模型BERTBiLSTMCRF分别提升了1.01、2.10、6.51.实验结果表明,与当前众多现有模型相比,本文方法展现出了更优越的性能,本研究为中文电子病历命名实体识别提供了新的思路.
  • 陈奕全1,吴晓鸰1,占文韬1,HEO Hoon2
    2025, 46(2): 339-345.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征融合模型,首先将输入中文语句转换为字词对序列,通过RoBERTawwm预训练语言模型将字词对序列中的字符序列表征为字符向量,获得全局语义特征;然后把词序列转化为词向量,再将字符向量和词向量输入到基于双线性注意力机制的词汇适配器获得字词融合特征;同时将字符向量送入到双向长短时记忆网络(BiLSTM)获得包含字符方向信息的上下文特征;最后将词汇适配器的输出和BiLSTM的输出进行动态特征融合获得包含全局语义信息、词汇信息和方向信息的上下文特征,再通过CRF解码获得最优预测序列.在多个公共数据集的实验结果验证了该模型能提取到更充分的特征信息,提高了识别性能.
  • 赵卫东,黄见,张睿,吴乾奕
    2025, 46(2): 346-352.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着金融线上业务的迅猛发展,篡改图像信息的问题在风控环节频繁出现.然而,现有的篡改检测模型在处理证件图片的准确性和应对环境干扰方面亟需加强.为解决这一问题,本文提出了一种二阶段篡改检测模型:在第1阶段中,通过将简单堆叠长短期记忆网络改进为多方向堆叠记忆网络,弥补了篡改特征对比方向单一的问题,并且兼顾了图像的位置信息,从而提高篡改鉴别准确率.第2阶段是在初步确定篡改区域后,基于篡改区域外围多层邻域的纹理特征,以注意力机制为核心推测中心区域纹理特征值,再与原中心区域纹理特征值对比筛选假阳性区域.实验表明,本文的改进方法是有效的.
  • 江奎1,2,王中元4,黄文心3,贾雪梅4,王正4,胡瑞敏4
    2025, 46(2): 353-364.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    低光照图像增强任务旨在提高图像的可见性,同时保持其视觉自然度.针对训练数据缺乏多样性以及恢复图像中细节丢失和颜色失真这两方面问题,基于分布一致性约束,本文提出一种无监督降质学习和数据增广方法用于低光照图像增强,其中包括设计两阶段的网络来学习低光降质的内在特性以及重新恢复低光图像的亮度和纹理细节.受彩色图像成像原理的启发,本文将低光图像增强任务分解为降质学习环境干扰去除,和图像本体细节和颜色细化表达.具体来讲,本文首先从低光输入中估计降质以模拟环境关照因素导致的失真,然后细化内容以恢复漫射导致的内容和对比度损失,并设计一种新颖的降质学习和内容细化网络.在低光图像增强和联合检测任务上的大量实验验证了本文算法的有效性和效率.
  • 迟孟贤1,安 虹1,金旭1,许延杰2,聂振国2
    2025, 46(2): 365-372.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的U型神经网络网络在脑肿瘤分割任务中存在高层信息表征能力不足和分割标签不平衡等问题.本文提出了一种新型脑肿瘤分割模型NNet,能够有效融合多尺度信息,综合考虑全局语义与局部细节,提高了对不同大小肿瘤的分割性能.模型引入特征金字塔进行多尺度语义特征的传递,并且采用通道空间融合注意力机制自适应地关注与肿瘤相关区域,此外,本文增加了模型层级并利用残差卷积模块解决梯度消失问题.最后,本文采用改进的混合损失函数应对标签不平衡问题,提高了分割结果的准确性和鲁棒性.在MSD数据集上的实验结果表明,本文提出的方法在多个评估指标上显著优于其他先进模型,展示了其在脑肿瘤分割任务上的有效性.
  • 刘丛,梅海闽
    2025, 46(2): 373-380.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有的基于深度学习的高光谱图像超分辨率重建方法无法通用于不同波段的高光谱图像以及缺乏可解释性等问题.提出一种融合光谱子空间映射和模型引导的高光谱图像超分辨率算法.首先,使用光谱子空间分解将原始图像映射到低维空间中,既可以增加光谱间的相关性又可以去除不同波段高光谱图像对网络的限制.其次,使用小波变换将稀疏矩阵分解为高频特征和低频特征,挖掘图像中的纹理和结构等高频信息.再者,以超分辨率重建模型为指导,将ADMM分解后的子模型优化展开为深度网络的形式,增加了深度网络设计的可解释性.最终,使用逆小波变换后将重建的系数矩阵映射到原始的全谱空间中.实验表明,提出的方法在定量指标和主观视觉方面均表现优异.
  • 滕少华1,盛文涛1,滕璐瑶2,张巍1,曾莹1
    2025, 46(2): 381-388.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    图学习是一种广泛应用于多视图聚类的技术,它可以从多视图中学习出统一的相似图.现有的图学习方法大多只能发掘多视图的一致性,忽视了不一致的信息,这使得它们可能在学习过程中丢失视图独有的信息.为了解决这个问题,本文提出了一种融合一致性和不一致性,面向图的多视图低秩聚类框架.该方法首先将多视图分解为一致性和不一致性两个部分,然后利用自适应加权融合多视图的一致性图,并在此过程中防止权重出现平凡解;进而,提出了一种新颖的低秩融合策略,用一个统一的目标函数融合多视图一致性和不一致性,并通过谱聚类获得结果.本文还设计并实现了一种迭代优化方法来求解目标函数.最后,7个多视图数据集的对比实验验证了该方法的有效性.
  • 姜宝石1,谭小波1,张文波1,朱宏博1,2,尹震宇1,3
    2025, 46(2): 389-395.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,基于深度学习的人像图像抠图技术已经成为研究热点.相比传统的抠图方法,深度学习抠图技术通过使用深度神经网络来学习和识别图像中的各种特征,从而进行精确的人像抠图,具有更高的精细度和稳定性.为了获得更精细的前景蒙版,Trimap常作为网络的额外的输入.然而,当前许多方法在利用Trimap的特征方面效率不高,并且都倾向于设计更深更复杂的模型网络,这可能会导致模型计算资源占用较大增加以及减缓模型的计算速度.针对以上情况,本文提出了一种以Trimap作为额外输入的简单架构抠图模型,具体来说,本文通过将Trimap图像与原始图像进行特征融合,使得抠图网络能够更好地关注到Trimap中的特征线索.此外,本文还设计了一种新型的归一化方式,以适应模型的训练过程.与近年流行的抠图模型相比,该模型在公开的人像数据集上显示出更低的量化损失(mse:0.0003,mad:0.0019,grad:6.0,conn:3.3),并且具有更精细的边界效果.
  • 马元一1,周桐2,3,赵赫2,王硕1,李京1
    2025, 46(2): 396-402.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    区块链按照记账模型可分为账户模型和UTXO模型.账户模型由于智能合约串行导致吞吐量低下.尽管尝试对合约进行并行处理,也会由于合约模型本身存在的状态冲突问题,导致并行度有限.相对而言,UTXO模型凭借其无状态的特性,可以并行处理交易,然而UTXO模型的功能性相对较弱.本文基于以太坊区块链系统,尝试整合以上两种记账模型,通过扩展以太坊的账户、交易及智能合约的操作方法,建立UTXOAccount混合区块链系统FusionChain,充分利用两种模型的优点,同时避免它们的缺点.在此系统的基础上,提出了一种高效的代币交易实现方法.通过对以太坊历史数据的理论分析,本系统的区块内交易冲突率显著低于以太坊.同时与其它基于UTXO模型的代币交易实现方式相比,基于本系统构建的代币交易具有更高的性能.
  • 颜晨1,2,张翼1,2,龚汉文1,2,薛吟兴1,3,郭燕1,2
    2025, 46(2): 403-409.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协议安全是保证互联网应用安全的基础,而模糊测试是验证协议安全的重要手段.协议测试的难点在于必须严格按照协议RFC中规定的结构和顺序生成数据包.为了生成能够满足协议需要的数据包,现有方法通常将一组记录的数据序列作为种子,但所记录的数据序列往往存在数量和多样性不足等问题,难以覆盖协议状态,而种子随机变异后的数据极有可能再次失效.为解决这一难题,本文探索了基于大语言模型(LLMs)进行网络协议模糊测试的方法,大语言模型充分理解了包括RFC协议在内的大量协议文本信息,从而获得了理解协议和生成测试所需的用例的能力.本文从状态获取、基于状态的种子生成和定向策略变异三方面,基于AFLNET探索了使用LLM进行网络协议模糊测试的方法LLMAFL.为测试LLMAFL的效果,本文在ProfuzzBench中针对多项协议的测试,从代码覆盖和状态覆盖两方面,与当前领先的AFLNET和CHATAFL进行了对比,结果表明,相同测试时间内,LLMAFL的代码覆盖和状态覆盖相比AFLNET均有提升,部分协议中的效果也大幅超过了CHATAFL.
  • 张志敏1,赵国生1,王健2
    2025, 46(2): 410-416.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    隐私保护真值发现技术在移动群智感知网络领域中受到了广泛关注.然而在实际应用中,恶意用户上传的异常值对真值发现结果的可靠性带来了较大影响.为此,提出了一种基于区间验证的隐私保护真值发现算法IVPPTD (Interval Verification based PrivacyPreserving Truth Discovery).首先,采用Paillier同态加密方法实现用户感知数据的安全上传和真值发现,保护用户的感知数据、权重信息以及估算真值的隐私不被泄露.其次,提出一种密文域中的异常数据过滤算法,对数据约束区间外的异常值进行数据清洗,从而在保护用户敏感信息不被泄露的前提下,提高真值发现结果的可靠性.最后,基于感知平台和密钥生成中心协作完成真值发现过程,减少了用户与云服务器之间的通信开销.仿真实验结果表明,所提方法具有高准确率、对异常值的鲁棒性以及较低的计算开销.
  • 习延鹏1,刘剑1,张琦2
    2025, 46(2): 417-423.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对均匀线性卫星通信地球站阵列在部分角度抗干扰性能不佳,且传统MVDR算法对各类误差非常敏感的问题,本文提出一种阵元布设逼近最小冗余阵且阵元位置互质的线性阵列,并采用导向矢量双层估计与干扰加噪声协方差矩阵重构的稳健MVDR算法.首先给出卫星通信地球站反射面天线增益表达式,推导出以反射面天线为阵元的传统MVDR算法;然后利用不确定集约束的方法,将导向矢量在规定的范围内进行修正,并根据噪声在空间内均匀分布的特点得到噪声功率,进而重构干扰加噪声协方差矩阵,获得阵列的最优权矢量;最后计算移相器和衰减器与最优权矢量的量化误差,并通过理论推导分析量化误差对阵列输出信干噪比的影响.通过计算机仿真,验证了所提方法可有效提升卫星通信地球站阵列的干扰抑制能力,增大阵列输出信干噪比,且算法具有较高的稳健性.所提方法解决了均匀线阵在部分角度抗干扰性能不佳的问题,可利用现有设备实现,为提升卫星通信地球站抗干扰能力提供了一种新思路.
  • 雷芳,侯康宁,莫刘燕
    2025, 46(2): 424-429.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文利用非地面网络抽头延迟线(NTNTDL)模型建立低轨 (LEO) 卫星通信系统并引入了大规模MIMO技术,信道模型由确定性视距路径 (LoS) 和空间相关的随机非视距路径 (NLoS) 组成,使其信道服从空间相关的莱斯衰落.通过推导出该模型的最小均方误差 (MMSE)、线性最小均方误差 (LMMSE) 和最小二乘 (LS) 信道估计的统计特性及其估计值,并使用这些估计值进行最大比合并(MRC)和预编码来补偿衰落的影响,计算出具有严格封闭形式的上行频谱效率表达式并评估了系统性能.仿真结果显示在具有空间相关的莱斯衰落环境下的低轨卫星系统比瑞利衰落环境下的低轨卫星系统的频谱效率更高并且使用 MMSE 估计器时的频谱效率最高,随着天线数量的增加系统性能的差距也更明显.
  • 伏树林,冯勇
    2025, 46(2): 430-442.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对海量的电信运营商数据跨行业共享存在的隐私泄露、数据安全、监管困难等问题,本文提出一种基于区块链的电信运营商数据隐私保护与共享方案.该方案将电信运营商数据密文存储在星际文件系统,仅将数据指纹上传至区块链,通过链上和链下协同提高数据存储效率;使用同态加密机制加密原始数据保障共享数据的隐私,结合基于属性的加密方法实现用户数据的访问控制,采用改进的实用拜占庭容错机制提高区块链节点的共识效率,建立基于交互和访问日志上链存证的监管机制,实现对数据共享过程的有效监督.通过安全性分析,并以电信运营商数据在征信领域的跨行业共享为例进行仿真实验和性能评估,结果表明该方案能够实现电信运营商数据的隐私保护和安全共享.
  • 王丹,李峰,夏麒煜
    2025, 46(2): 443-448.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了解决高速多径信道难以实现可靠传输的问题,移动通信系统中引入了正交时频空(OTFS)调制技术.针对接收端信号检测算法复杂度高的问题,本文提出了一种基于阻尼因子的逐bit消息传递(MP)检测方案,利用信道矩阵的稀疏性来简化消息传递中的因子图.相较于传统逐符号消息传递算法,添加对数似然比(LLR)将算法精度提高至bit级,同时对节点间传递的消息添加阻尼因子加快收敛,在此基础上改进消息传递的规则,进一步降低算法的计算次数.仿真结果表明,改进型的信号检测算法加快了算法收敛,在保证接收端误码性能的同时降低了算法的复杂度.
  • 王秀玉,吴晓鸰,冯永晋
    2025, 46(2): 449-455.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着互联网技术的发展,网络数据流量每秒激增,伴随而来更多的安全问题.针对网络入侵数据集类不平衡和数据维度高导致的分类不准确问题,本文提出一种融合过欠采样和GAN的网络入侵检测方法.采用随机欠采样减少多数类样本数量,以避免欠拟合问题.同时,通过合成少数类过采样技术合成少数类样本,以降低类不平衡所带来的影响.此外,结合GAN使合成样本更接近真实样本,以解决SMOTE中新合成样本缺乏合理性的问题.最后,集成自编码器,通过降低数据集的维度来减少内存占用,并加速分类模型的训练.在CICIDS2017数据集上进行对比实验,结果表明本文提出的融合过欠采样和GAN的网络入侵检测方法性能优于其他方法.
  • 李沛衡,林宏刚
    2025, 46(2): 456-464.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目前物联网僵尸网络多分类检测方法存在表征能力弱、难以剔除特征冗余和噪声、识别准确率低等问题,本文提出一种融合图结构学习的多分类检测方法.该方法利用阻尼增量统计多个时间片网络流量的特征对网络流量样本进行重构,设计自适应图结构学习方法获取网络流量特征的时空关系表示,结合图正则化剔除特征冗余和噪声;基于时空图卷积神经网络在时空两个层面提取特征,实现对物联网僵尸网络攻击的多分类检测.在多个数据集上的实验结果表明,本文提出的方法具有良好的表征能力,能有效剔除特征中的冗余及噪声,提升检测的准确率,在多分类效果上优于其他模型.
  • 杨毅铭1,陈世平2
    2025, 46(2): 465-473.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络入侵检测是一种重要的网络安全方案.目前网络入侵检测模型都有较高精确度,但是模型复杂,参数量和计算量较大.针对该问题,设计了一种新的基于包粒度应用层负载的网络入侵检测一维卷积轻量模型.本文首先对UNSWNB15数据集的原始流量文件进行包粒度应用层负载数据提取,构造一维灰度特征向量.在此基础上,本文提出一种由新的一维深度可分离卷积残差模块组成,融入了全局上下文注意力机制(Global Context Attention Module)的一维卷积轻量模型Fast Payload,并进行了针对性的模型优化和可行性论证.Fast Payload模型在UNSWNB15数据集上的9分类任务中宏平均准确率达到82.433%,加权平均精确率达到90.820%,均高于对比模型;同时,该模型计算量和参数量均低于对比模型.其次本文提出了二阶段类别平衡损失函数GHM2StageLoss,有效解决了数据集的类别不平衡问题,相比其他类别平衡损失函数,效果更好.为方便后续研究的复现,本研究开源部分源代码,网址为https://github.com/sadantange/FastPayload.
  • 赵建,姜伟
    2025, 46(2): 474-481.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    入侵检测系统已逐步成为物联网安全的重要防护手段.然而,现有物联网入侵检测模型的样本数据存在类别不平衡、特征提取不足等问题,这导致了对于小类别攻击的低识别率与较低的精确率.因此,本文提出了一种融合改进时域卷积网络与深度残差收缩网络的物联网入侵检测模型.首先,利用扩张因果卷积与一维卷积充分提取数据的时空特征,形成深层层次的网络结构;然后引入自我注意的软门槛,能够无需专家经验自动地设置门槛,消除冗余特征;最后,使用焦点损失函数来增强对少数类的识别率.实验在TONIoT数据集上的总体准确率和F1值分别高达99.88%和99.64%,其中小样本类的F1值为100%.实验结果表明,与其他模型相比,所提模型显著提高了对于不平衡入侵数据的检测能力.
  • 李鹏程,黄立波,谭弘兵,杨乾明,刘威,马胜,邓全,王永文
    2025, 46(2): 482-492.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    人工智能(AI)和物联网(IoT)的迅速发展,对能效提出了更高的要求.在后摩尔时代,通过牺牲精度以换取高能效的近似计算成为解决资源开销问题的重要方法,其中近似乘法器在容错应用中发挥了关键作用.为促进近似乘法器的相关研究,本文对相关文献进行了归纳、分析和总结.首先回顾了传统乘法器的发展、近似乘法器常用评估指标和应用测试方法,然后从近似乘法器的架构设计和通用优化两个方面详细阐述乘法器中近似技术的研究和发展.架构设计侧重于在乘法运算的不同阶段进行结构设计,通用优化强调可以在多种架构设计中发挥重要作用的近似优化技术.最后,对未来的研究方向进行展望和总结.
  • 李新1,洪琦格1,程凯杰1,朱良宽2
    2025, 46(2): 493-503.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文研究了一类具有未知有界扰动的离散时间非线性切换系统的基于区间观测器的PID控制问题.基于正系统理论为这类切换系统设计了一种区间观测器用于估计系统状态的上下界,并根据估计的系统状态边界设计了离散时间PID控制律.随后,利用增广技术以及多Lyapunov稳定性分析方法,以线性矩阵不等式的形式给出了保证估计误差系统和闭环系统全局一致渐近稳定的充分条件.此外,通过求解线性矩阵不等式,得到了区间观测器增益和PID控制器增益,进一步保证了闭环系统的H∞性能.最后,通过一个数值仿真验证了所提方法的正确性和有效性.
  • 黄晨峻,高建华
    2025, 46(2): 504-512.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%.