过刊目录

  • 2023年, 44卷, 第6期
    刊出日期:2023-05-23
      

  • 全选
    |
  • 邹敏浩,甘中学
    2023, 44(6): 1121-1127.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在数据非独立分布的情况下,联邦学习每一轮通信中将局部模型聚合成一个全局模型的过程将会导致异质性,并给联邦学习训练带来巨大的挑战.除此之外,由网络带宽不同或者客户端设备的训练速度的不同导致的部分设备参与加剧了这种异质性.仅通过局部模型的简单加权聚合会导致与真正的全局模型的进一步偏差,后者会收敛到局部极值点并在收敛过程中振荡.基于这些发现,本文提出了一种新的聚合算法联邦累积学习算法(FedAcc),该算法在服务端通过聚合延迟的客户端的梯度信息以指导下一轮的服务端梯度更新,从而实现更健壮和更精确的聚合.实验结果表明,与FedAvg、FedAdam和FedAsync等几种优秀的联邦学习算法相比,FedAcc算法具有更好的综合性能.
  • 黄培馨,赵翔,方阳,冉旭东,谭真,肖卫东
    2023, 44(6): 1128-1133.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    事件检测是一项复杂的信息获取任务,在纯文本事件抽取中起着至关重要的作用.实际情况下,由于数据稀疏和自然语言的歧义性,事件检测任务面领着巨大的挑战.针对这些挑战,从先前工作利用一种额外的语言信息作为数据增强之中获得启发,本研究提出从多种自动翻译得到的多语言文本中挖掘互补信息,从而在一定程度上缓解数据稀疏和自然语言歧义的问题.为此,本研究设计实现了一种混合注意力神经网络模型HAN(hybrid attention network),其中的混合注意力模块通过一个上下文注意力机制和一个多语言注意力机制来实现从多种语言的信息中挖掘互补线索.实验在两个基准数据集上进行,结果证明了HAN模型在事件检测任务上的性能明显优于其他现有的模型.
  • 韩兆荣,钱宇华,刘郭庆
    2023, 44(6): 1134-1139.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    利用通信规则的多智能体算法通过智能体间交互信息进行协作,而其中信息质量决定了智能体协作能力与完成任务的能力,是提升智能体表现的关键因素.目前通信规则型算法存在通信信息产生方式单一、信息冗余等问题.针对以上问题本文提出了基于自注意力机制的信息处理模块TDU以及适配的信息产生智能体算法.首先,通过改进适配信息生成的强化学习算法作为智能体网络,通过网络学习生成适配信息,提高了智能体间信息产生的适配性并固定了信息选择的范围,降低了信息处理的难度.之后,利用基于自注意力机制的信息处理模块,对生成的信息进行筛选,提取高价值信息进行传输,提高智能体传递信息质量.本文提出的算法在经典智能体通信规则测试环境Swtich Riddle中进行了大量实验,并与主流通信规则型算法进行对比.实验结果表明,本文提出算法有效提高了智能体信息质量,加快了智能体学习速度,增强了智能体通信能力.
  • 谢玉惠,肖桂荣
    2023, 44(6): 1140-1145.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    突发公共卫生事件极易引起社会恐慌,新冠肺炎更是全球聚焦的重大热点事件,客观了解疫情期间的公众情绪响应,有利于政府及相关部门合理管控舆情.本研究以疫情流行期间网民微博博文为基础,通过文本挖掘的方式探索疫情期间网民情感倾向,提出一种以卷积神经网络和双向长短期记忆网络为基础,并融合注意力机制的多通道情感极性分析方法.该方法首先对微博文本数据进行分词和停用词的预处理,通过Word2Vec模型获取词向量表达式,使用多通道CNNsBiLSTM模型抽取多尺度文本特征,融合注意力机制调整特征权重,以语义相关度进行文本情感倾向判断.通过COVID19微博舆情数据开展实验验证,结果表明,该方法相较于其他基准模型获得了较高的准确率,能够充分利用多维矩阵捕获丰富的文本特征,具有一定的优越性.
  • 叶翰文,欧阳思源,包振强
    2023, 44(6): 1146-1152.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    共识算法作为区块链底层的核心技术之一,对区块链系统的性能优劣有至关重要的影响.文中选取实用拜占庭容错算法作为研究对象,针对实用拜占庭容错算法中通信复杂度高、可扩展性差、安全性不足等问题,提出了一种引入秘密共享的改进实用拜占庭容错算法.该算法利用秘密共享方案将共享的密文碎片在主节点集合里进行合理分配,使得每个参与共识的节点在不知晓完整信息的情况下通过合作共同保管数据信息,从而防止信息被丢失、破坏、篡改.其次,方案中阈值的设定还能够消除单点漏洞,优化了一致性协议,对共识确认阶段进行简化,不再需要客户端参与回复,从而减少通信开销.本文通过理论分析了改进算法的安全性能与通信复杂度,并用实验证明该算法比实用拜占庭容错算法有更好的共识时延与可扩展性.
  • 张帅,王俊杰,李爱莲,全凌翔,崔桂梅
    2023, 44(6): 1153-1161.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对基本哈里斯鹰算法收敛速度慢和易陷入局部寻优等问题,提出一种集成正态云模型和动态扰动策略的改进哈里斯鹰算法.在全局搜索阶段,利用正态云模型的随机性和模糊性和随机反向学习思想对哈里斯鹰位置进行更新,从而丰富种群多样性和提高算法全局搜索能力.在局部开发阶段,引入动态扰动策略更新不同捕食策略下的哈里斯鹰位置,改善算法局部开发能力.选取不同维度的基准测试函数进行仿真,同时利用Wilcoxon秩和检验、Friedman检验、三杆桁架设计问题对改进哈里斯鹰算法和其它优化算法进行对比分析.实验结果表明:提出的改进哈里斯鹰算法收敛速度更快,寻优精度更高,验证了改进策略的有效性.
  • 曾佑仟,王茜,张景波,崔志华
    2023, 44(6): 1162-1169.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着无线充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)的出现,针对延长无线传感器网络(Wireless Sensor Networks,WSNs)的寿命问题,大量的研究者们提出了多种充电方案.然而大多数充电方案都属于离线的,没有考虑充电路径规划会随着新需充电节点的加入而发生动态变化的多时间窗问题.因此,针对上述问题,本文提出了高维多目标动态充电路径方案模型.通过最小化路径距离、死亡节点数量、通信延迟以及最大化无线充电车(Wireless Charging Vehicle,WCV)剩余能量,以减少死节点数量,延长WRSNs的生命周期.同时为求解该动态模型以及适应路径编码方式和响应环境变化,通过引入改进的进化策略和环境响应机制到强帕累托进化算法2(The Strength Pareto Evolutionary Algorithm 2,SPEA2)中,提出了改进的SPEA2.仿真实验结果表明,该动态模型和改进算法能够有效地延长WRSNs的生命周期.
  • 郑诚,倪显虎,张苏航,赵伊研
    2023, 44(6): 1170-1176.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    最近,图神经网络(GNN)通过将文本数据转换为图形数据的方式,来捕捉单词之间的固有拓扑结构和依赖信息,在一些文本分类任务中取得了良好的结果.但是将文本构建成图后,很多基于图结构的文本分类模型面临着全局上下文语义信息和局部特征信息提取不充分的等问题.本文提出了一种将全局上下文语义信息与局部特征信息相融合的图神经网络模型.通过将文档表示为有向、加权的词共现网络,其中有向是为了捕获词排序问题,权重是为了突出单词之间的相互影响程度,利用门控循环单元(GRU)在建模长距离单词交互上的优势,来捕获全局上下文语义信息,接着利用注意力(attention)捕获关键的局部特征信息,最后使用平均池化和最大池化进一步提升了模型对关键特征信息的提取能力,从而丰富了文档节点的全局语义信息,增强了局部特征表达.通过在三个经典英文数据集上的实验结果表明,该模型相比于基线模型有较好的分类效果.
  • 卢菁,陈婉璐,刘丛
    2023, 44(6): 1177-1183.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前知识图谱更新面临着更新知识数量大、频率高且包含大量错误信息的问题,现存的方法为保证更新效率对知识简单分类,判断方法单一且不考虑知识的语义关联,导致知识更新精确度低.本文提出一种基于标准模式挖掘的知识图谱更新方法,该方法与自动抽取并直接插入的方法不同,利用从现有知识图谱中挖掘出的标准模式进行模拟匹配来筛选正确的知识,并对标准模式挖掘算法进行了改进,提升了筛选的准确性.当大量知识同时进行更新时对挖掘出的标准模式和待更新知识同时向不同的领域空间向量化,计算两者间的向量距离,通过控制阈值筛选正确的知识.在真实的数据集上实验结果证明了本方法的准确性和有效性.
  • 吴旭明,米金鹏,刘丹,胡卫兵,唐宋,李清都
    2023, 44(6): 1184-1191.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    工作场景感知是机器人高效实现指定任务的重要前提.得益于深度学习的发展,现有方法可实现高性能的工作场景感知,但是要求较高的计算能力导致这些方法难以部署于低算力的平台上.本文针对移动机器人在非结构化场景中的垃圾拾取任务,构建了一个12类的垃圾识别数据集,并以此提出了一个结合深度学习与传统机器学习的高效感知方法.该方法在YOLOv4目标检测的基础上,设计了一种基于K-means++聚类的深度信息优化方法,并结合图像形态学变化和Canny边缘检测算法实现物体角度估计.实验结果表明了该方法准确率高、实时性强,对于非结构化场景中的干扰信息(如背景、物体材质等)具有一定的鲁棒性.
  • 冯勇,刘洋,王嵘冰,徐红艳,张永刚
    2023, 44(6): 1192-1197.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前电商平台大多注重商品推荐的准确性而忽略了多样性,存在推荐结果高冗余、用户满意度低等问题.考虑用户需求从而实现多样性推荐可以提升商品购买率和用户满意度,为此本文提出了一种面向用户需求的生成对抗网络多样性推荐方法.该方法由生成模型和判别模型组成,其中,生成模型由四层结构组成,结合用户需求生成多样性商品表示.判别模型判定生成商品是否为真实商品,反馈给生成模型.最后,计算各商品与多样性商品表示的相似度,产生推荐列表.对比实验表明本文所提方法切实能够提高商品推荐的多样性,而且能够带来准确性的提升.
  • 谭岩杰,陈玮,尹钟
    2023, 44(6): 1198-1203.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在中文命名实体识别任务中,文本数据存在多种属性实体,传统模型需要在每个实体上进行繁杂的分类任务,工作量大,难以识别,且采用循环结构,模型运算速度较慢.本文在传统模型的基础上,提出门控空洞卷积与级联网络,门控空洞卷积提高模型运算速度,级联结构将中文命名实体识别任务改为多任务学习,将实体的属性与位置分开标注,降低分类计算量,得到的结果再进行拼接,形成完整的标注结果.实验结果表明,本文提出的门控空洞卷积与级联结构的模型,在Resume数据集上,F1达到了95.50%,比baseline模型提高了1.79%,验证该文提出的模型具有良好的有效性与优越性.
  • 张翼,郭燕,周继祥,龚汉文,唐顺成,薛吟兴
    2023, 44(6): 1204-1213.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着网络通信技术和汽车产业的快速发展,车联网内数据交互日益频繁,同时,车联网的安全问题也日益严重.本文首先介绍了针对车联网的多个攻击案例,并引入模糊测试这一解决方案.其次,介绍智能车联网架构,从车载有线网络协议和车载无线通信技术进行分析.之后,介绍模糊测试在车联网中的流程与分类,从测试用例的生成、异常检测手段和测试评估指标三方面分析车联网模糊测试的发展现状.最后展望了车联网模糊测试的未来发展方向.
  • 方海,高媛,赵扬,杨旭
    2023, 44(6): 1214-1219.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    研究了卫星网络边缘计算的多低轨卫星计算卸载问题,每颗低轨卫星可以将计算工作负载卸载到高轨卫星或者地面云计算中心.为了获得无线资源分配和卸载决策的最优策略,研究了联合无线和计算资源分配的低轨卫星能耗和系统时延最小化问题,并提出了低复杂度解决算法.首先将问题分解为计算资源分配和通信资源分配,分别通过拉格朗日乘子法和凸优化方法求解优化问题,最后通过局部寻优给出卸载决策的近似最优解.仿真结果表明,通过有效地卸载决策和功率、带宽及计算资源分配,所提算法能够降低系统开销.同时,与现有启发式方法相比,所提出的卸载算法所需的运行时间显著降低,并且随着用户数的增加优势更加明显.
  • 王嘉诚,陈文龙,徐敏,唐晓岚
    2023, 44(6): 1220-1226.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    隧道机制广泛应用于各种互联网传输场景,多径隧道则可以增大隧道传输带宽,提升隧道传输的可靠性和灵活性.然而,多径隧道网络环境中的传输路径优化控制也给网络管理带来了挑战.本文分析了多径隧道传输特征,基于多种网络性能指标提出了针对用户网络服务质量的隧道调度方法,并进一步设计最小化网关带宽利用率的流量均衡机制.而且,提出了3种针对多径隧道调度的具体实施策略.仿真实验表明本文工作能针对用户网络传输需求提供隧道传输服务,能够均衡多个隧道网关的传输负载.
  • 孙辉,钟诚
    2023, 44(6): 1227-1235.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决现有算法难以有效识别高错误率测序数据中敏感序列的问题,提出一种融合过滤和相似度计算的敏感序列识别算法.首先,分割待识别序列为多条短序列,通过构建双布隆过滤器,对短序列进行动态过滤去重,以避免重复运算;然后,对短序列局部片段进行k-mer编码,改进优化短序列局部片段相似性度量的方法,以准确识别短串联重复序列;其次,对短序列进行k-mer编码并与GWAS Catalog数据库中敏感序列进行计算比对,以准确识别疾病相关序列;最后,依据短序列识别结果,生成待识别序列的两条掩码序列,作为识别测序数据中敏感序列的结果.实验结果表明,与同类算法LRF和SRF相比,本文算法对错误率2%~20%的测序数据中敏感序列的平均识别准确率分别提高1.96%和3.66%,查准率分别提高40.08%和68.36%,有效提升高错误率基因组数据中敏感序列识别的效果.
  • 邓显辉,李斌勇,蒋娜,邓良明
    2023, 44(6): 1236-1247.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前,面向ABAC(Attribute-based Access Control)的访问策略冲突消解机制在消解冲突时,多数存在偏向性和粗粒度的消解结果,且部分机制在利用策略规则中的属性项消解策略冲突时,因对属性项处理不当,进而降低了消解结果的准确性和效率.为了解决上述情况,提出一种面向ABAC的双阶段访问策略冲突消解机制:ATPCRM(ABAC-oriented Twostage Access Policy Conflict Resolution Mechanism,ATPCRM).首先,ATPCRM由系统运行前的访问策略冲突预消解与系统运行时的访问策略冲突消解组成,通过两个阶段的冲突消解,在提高消解粒度的同时,进一步地降低系统运行时用于冲突消解的时间消耗;其次在系统运行前的访问策略冲突预消解阶段,提出策略规则集预处理算法和策略规则权重评估算法,通过改进K-prototypes聚类算法和TF-IDF算法并应用其中,使访问策略以规则权重的形式实现策略冲突预消解;最后在系统运行时的访问策略冲突消解阶段,提出新加载规则缓冲区和自适应访问策略冲突类型的冲突消解策略,通过消解预消解阶段没有完全消解的冲突,进而提高冲突消解的效率、准确性和粒度.实验结果表明,ATPCRM可以达到预期的冲突消解结果,同时在一定程度上提高了冲突消解的效率.
  • 李军祥,蒲万举,黄兰
    2023, 44(6): 1248-1256.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当联络中心负载过大时,顾客在排队等待座席服务的同时会出现放弃服务的情况,另一方面,顾客选择的初始服务渠道有提供不了满意服务的可能.这两种情况的出现会使得联络中心系统整体服务效能低下.为了缓解这些因素对联络中心服务效能的影响,本文在考虑排队过程中顾客行为等限制条件的情况下,以服务完成率最优为目标增加渠道转移系统,并组成预约回呼渠道构建新型联络中心模型.通过ProModel软件对该模型整体性能进行实验,并对各类模型数据指标进行对比.结果显示,渠道转移系统和预约回呼座席的设置将有效减少顾客在联络中心内的放弃行为,新型联络中心的路由策略将有效提高顾客满意度、降低成本损失、提高系统整体服务效能.
  • 崔建群,邬尧,常亚楠,孙佳悦,余东海
    2023, 44(6): 1257-1265.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    延迟容忍网络(delay tolerant network,DTN)中,由于节点的移动性、休眠调度、资源受限以及网络误码率较高等因素,消息成功投递的可能性较低.为了解决上述DTN中存在的问题,有大量的路由算法被提出,其中Prophet路由算法作为DTN中重要的路由之一,主要思想是根据DTN中节点的相遇频率进行节点之间消息的传递,但该算法没有考虑节点的交互意愿和中继节点的缓存大小.针对这一问题,本文提出一种基于连接分离时间的概率路由算法P-AVF(Prophet routing based on Average fluctuation).该算法主要根据节点在时间窗口T内的连接分离时间以及节点间运动轨迹的差异性来定义节点连接的平均波动,进而引出节点连接紧密性与可靠性的概念,使得连接能力更优异的节点与它相遇过的节点保持更大的投递预测值,从而能综合挑选出合适转发消息的中继节点.同时利用消息接收节点的缓存占用比和该节点与其他节点连接分离的总时间作为影响该节点投递预测值衰减的一部分,使得投递预测值的衰减更准确.仿真结果表明,基于连接分离时间的概率路由算法P-AVF在消息的投递率、网络负载率和平均跳数等方面均优于其他对比路由算法.
  • 范艺璇,阚秀,曹乐,王夏霖
    2023, 44(6): 1266-1273.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于内部人员具有访问组织内部资源的权限,其行为出现漏洞或故意威胁所产生的影响对组织而言可能是巨大的损失.因此,内部人员威胁行为研究对保障系统安全具有重要价值.针对大量内部威胁行为的具体识别,本文提出了一种两步用户威胁行为活动分析识别策略.首先,利用粒子群优化(Particle Swarm Optimization,PSO)算法优化具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)来实现对偏离正常模式的离群点的精准查找.第2步,建立多特征权重联合评估策略,基于上一步的离群点分析结果,采用多指标评价方法实现对用户威胁行为的识别.实验结果表明,所提PSO-DBSCAN算法能更好地缩减初步离群点,并在特征约简后行为活动识别准确率最高达到99.58%,对威胁活动的识别具有有效性.
  • 李瑞同,刘亚,赵逢禹
    2023, 44(6): 1274-1282.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    压缩函数采用高级加密标准AES(Advanced Encryption Standard)的杂凑模型是杂凑函数设计的重要方式之一,研究者已经提出了针对7轮单AES分组杂凑模型的原像攻击和6轮单AES分组杂凑模型的碰撞攻击,而针对多AES分组的杂凑模型安全性仍未知.本文提出了适应于后量子时代的两AES分组和四AES分组的杂凑函数模型的原像攻击,该攻击中采用了初始结构、连接剪切、部分匹配等技巧,恢复了7轮双AES分组和6轮四AES分组的杂凑函数的原像,与已有7轮单AES分组杂凑模型的原像攻击相比,双AES分组杂凑模型可以达到几乎相当的安全强度,而四AES分组杂凑模型安全强度更强.此研究成果是对AES分组杂凑模型原像攻击的一个重要补充,为AES分组杂凑模型的设计提供了有力的理论保障.
  • 葛志辉,刘子萌,王哲,李陶深
    2023, 44(6): 1283-1289.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在移动边缘计算(Mobile Edge Computing,MEC)中,传统的基于平均性能约束的多址接入和计算卸载方法,无法满足用户设备的时延敏感型业务需求.本文针对多接入点(Access Point,AP)和多移动边缘主机(Mobile Edge Host,MEH)的边缘网络,基于李雅普诺夫随机优化与匹配理论,在用户设备随机到达和计算任务随机生成的场景下,提出一种边缘网络资源联合优化分配策略,包括用户与AP-MEH接入策略和计算优化卸载策略,旨在最小化平均时延约束和失效概率约束下的用户平均功耗.仿真结果表明,所提出的边缘网络联合优化分配策略在降低用户设备功耗中是有效的,且较传统的队列稳定性约束下的资源分配策略在能耗优化方面实现了更高的系统增益.
  • 杨子轩,张文柱,程鹏,谢书翰
    2023, 44(6): 1290-1296.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    计算卸载决策是移动边缘计算的关键问题之一,与移动边缘计算系统中任务计算时延和计算能耗的优化密切相关.针对多用户多MEC服务器的移动边缘计算系统中的计算卸载决策问题,考虑MEC服务器计算资源有限的特点,以任务计算时延和计算能耗为优化目标,设计了一种基于混合果蝇算法的计算卸载决策方法HFOA.HFOA方法首先使用启发式方法和随机方法进行种群初始化;然后,使用基于概率选择的自适应方法进行嗅觉搜索;最后,基于模拟退火原理对视觉搜索后的最优解作进一步优化,以提升算法的局部搜索能力.通过仿真实验,将HFOA方法与其他计算卸载决策方法进行对比,结果表明HFOA方法在系统计算时延、计算能耗、收敛性等方面均有改进.
  • 黄鑫涛,曹力,蔡有城,李琳
    2023, 44(6): 1297-1303.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    局部特征是图像匹配与识别等应用中的关键表征方式.针对目前局部特征提取方法存在的尺度单一、区分性不足等问题,本文基于双分支编码器解码器提出了一种联合多尺度与注意力机制的局部特征提取方法.首先,在共享编码阶段,采用经典的VGG-Style卷积神经网络对输入图像提取不同尺度的特征层;其次,在关键点解码阶段,通过与编码阶段中相同尺度特征进行并联构建特征金字塔结构以解决单一预测结构带来的特征信息不足等问题,同时在描述解码器中嵌入基于空间、通道的混合注意力模型以实现特征的选择性预测;最后针对检测和描述过程分别提出了针对性的损失函数对训练目标进行优化.实验结果表明,本文方法所提取的局部特征相较于现有方法不仅在重复性和区分性上表现更好,而且对视角、光照等变化具有更高的鲁棒性.
  • 许营坤,陈天阳,陈胜勇,徐新黎
    2023, 44(6): 1304-1310.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有多目标跟踪算法中存在目标运动模糊和相互遮挡的难点,在单阶段和无锚框的实例分割框架下,提出了一种融合运动特征嵌入的多目标分割跟踪算法.首先,提取当前帧与前后两帧光流场中的运动信息对表观特征进行运动补偿,再利用特征金字塔网络融合含有运动信息的多尺度特征,提高了目标检测性能.其次,通过两个用于提升网络预测性能的损失函数的设计和使用,进一步减少了由于检测器失效和目标遮挡而导致的漏检.最后,关联网络提取目标的外观特征,并通过预测并关联的更新轨迹策略将可靠的跟踪结果合并至轨迹.实验结果表明,本文提出的算法在MOTS20训练集上跟踪准确度达到了66.0%,测试集上达到了63.1%,与同类算法相比,本文算法表现出更好的有效性.
  • 杨文姬,李浩,王映龙,梅梦
    2023, 44(6): 1311-1317.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目标检测存在背景复杂,遮挡严重,尺度大小不一的问题,本文基于YOLOv3进行改进,提出了一种多尺度高分辨率的特征融合网络YOLOv3-F.首先,在backbone和neck之间添加空间金字塔池化结构(Spatial Pyramid Pooling),特征图经过局部特征与全局特征相融合后,丰富了特征图的表达能力,有利于待检测图像中目标大小差异较大的情况;其次,三尺度检测层增加为四尺度检测层,通过高分辨率特征图位置信息的保留,提高小目标识别的精度.最后,将YOLOv3损失函数改为CIoU,提高目标检测框回归的效率,降低目标漏检率.将改进算法在自制数据集COCO-CT6上进行试验,误检率降低1.8%,精度提高了3.6%.
  • 赵珊,管启,丁德锐,魏国亮,尚朝辉
    2023, 44(6): 1318-1323.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    同步定位与建图(Simultaneous Localization and Mapping,SLAM)问题近年来已成为机器人导航领域的热门研究话题,作为其重要环节之一,回环检测用以消除整个过程中的累积误差.针对该环节高效率的需求,本文提出了一种基于局部特征ORB和全局描述符VLAD组合的快速回环检测算法.首先,使用一种全新的二值特征的VLAD量化算法(Binary-VLAD)提取全局特征,在保持描述符代表性的同时加快运行速度.然后,在全局粗搜索阶段,改进倒排索引结构,有效地减少了计算量和存储空间.其次,在几何验证阶段,使用一种基于空间相似性的偏移稳定模型,无需像RANSAC一样恢复基本矩阵,简捷高效.最后,在3个数据集上进行了验证实验,并与经典的词袋模型方法以及最新的基于深度学习的方法进行对比.实验结果表明,本文所提出的算法仅耗时19ms,明显优于经典的词袋模型算法,相比于最新的深度学习算法,时间效率更是提升近10倍,并且在保持100%准确率的前提下,召回率优于两者.
  • 杨文哲,郝渊科,赵常胜,宋伟,杨先娣,彭智勇
    2023, 44(6): 1324-1328.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着数据型科学研究的快速发展及数据共享理念的推动,科学数据管理平台的建设得到了越来越多的重视.然而,由于科研数据量的增加和形式的多样性,传统的科学数据管理平台已不能满足用户对于数据组织服务的个性化需求.此外,数据湖作为一种新型的数据集中式存储库受到了工业界和学术界的广泛关注,它允许从多个数据源中摄入数据,并以原生格式进行存储.在数据湖架构的支撑下,本文主要基于对象代理数据库设计并实现了一种个性化的大数据共享可信数据湖平台.该平台支持多源异构原生数据的存储,实现了元数据管理、数据集检索等高效的数据存储和管理功能;基于对象代理数据模型,设计了合适的基本类和代理类,并结合对象代理数据库的更新迁移机制,实现了个性化数据空间管理及数据自动推送功能;在数据安全方面,利用数据去重技术进行重复数据删除,大大减少了存储消耗.
  • 王中华,舒碧华,陈书宁,刘瀚阳,崔秋,万继光
    2023, 44(6): 1329-1337.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大数据背景下剧增的数据给经典的内存索引技术带来了巨大挑战,为了实现对海量数据的高性能索引,工业界和学术界分别从设备和结构角度推出了高性能大容量的非易失型内存(Non-Volatile Memory,NVM)和受机器学习启发的学习索引(Learned Index,LI).然而目前基于NVM的学习索引结构的相关研究非常稀少,在如何结合NVM和LI来高效地索引海量数据方面还有许多问题需要解决.本文提出了一种基于NVM的新型智能索引结构LI-Tree,充分发挥了两者的优势.具体的,LI-Tree可分为三层:由机器学习模型组成的能够提高LI-Tree单点性能的模型层、由静态数组构成的减少NVM写的数据索引层和由一系列轻量级B+树组成以避免模型层插入时频繁重训练的数据层.在真实设备上评估表明,LI-Tree相比传统B+树,插入、查询和删除性能分别提高了70%、30%和130%.另外,LI-Tree与学习索引结构ALEX,PGM-Index和XIndex对比,插入性能分别提升了80%,130%和150%.
  • 薛诗琦,王阿川
    2023, 44(6): 1338-1344.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对软件缺陷报告严重性预测中现有模型分类精度较低、深层次的语义特征不够丰富等问题,本文提出了一种基于BERT句子级别与词级别特征融合的SWF-BERT(Sentence-level and Word-level features Fusion-BERT)软件缺陷报告严重性预测模型.首先,对缺陷报告中的文本进行了数据预处理.其次,为了加强嵌入层中融合后的特征语义信息,提取词频最高的前100个单词,筛选出与缺陷严重性相关的特征词对其进行关键词嵌入操作,并融合嵌入层中的其他向量进行词嵌入.最后,将BERT模型输出层得到的特征(除[CLS]token外)送入多尺度卷积神经网络结合长短期记忆网络(MC-LSTM)模型中,加强了不同特征间远距离的时序信息.采用BERT模型输出得到的[CLS]句向量经过线性变换的结果与MC-LSTM模型输出经过线性变换得到的结果做可学习的自适应加权融合,实现了对软件缺陷报告严重性的有效预测.实验结果表明,使用SWF-BERT模型的平均准确率、召回率和F1值在Mozilla数据集中分别达到了68.41%、64.60%和64.86%,在Eclipse数据集中分别达到了61.32%、62.62%和59.31%,与其他分类算法相比,该方法在性能上得到了较大的提升.