过刊目录

  • 2023年, 44卷, 第11期
    刊出日期:2023-11-07
      

  • 全选
    |
  • 杨潇,吴黎兵,张壮壮,霍丽娟
    2023, 44(11): 2369-2376.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云存储服务与传统的内部存储基础设施相比,拥有更高的扩展性以及更低的管理成本,其低成本和可靠性的优势吸引了越来越多的用户选择将数据存储到云存储服务器上.但是云存储服务也给用户带来了额外的安全问题,即用户失去了对数据的控制,无法确保云数据的完整性.目前已有很多云数据完整性验证方案来确保用户可以及时发现云上数据的损坏,但是传统方案本质上都是一种中心化的审计服务,面临着单点故障的风险;且存在着数据拥有者与审计者都是可信的安全假设,未能考虑到二者的不诚实行为所带来的安全风险;同时协议运行的透明程度不够,无法在协议运行异常的时候追溯到违反协议规定的一方.区块链技术为解决上述问题提供了新的方向,目前已有很多研究将区块链和传统云数据完整性验证方案相结合,增强了协议的可靠性与运行透明度.该文根据对区块链的不同利用方式对相关文献进行了梳理分类及对比分析,并指出了基于区块链的云数据完整性验证这一研究领域尚需要解决的问题及研究方向.
  • 葛优,金大海,宫云战
    2023, 44(11): 2377-2383.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和语义特性,构建并行程序的抽象语法树,并对控制流图进行扩展引入并行控制流图;然后将数据竞争问题抽象为一种故障模型,利用有限状态机来形式化的描述此类故障模型;最后对并行区域的潜在赋值操作进行并行数据流分析,在程序控制流图节点上进行故障状态机的状态转化来实现数据竞争的检测.该方法已在自研的缺陷检测系统(DTS)中应用,并通过DataRaceBench的实验数据证明本文方法可以有效的检测出数据竞争问题.
  • 弋英民1,2,王柯颖1,2,苑易伟1,2,薛向宏1,2,李余兴1,2,刘柏均1,2,王烨琛1
    2023, 44(11): 2384-2391.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统滤波方法各自使用时准确度低、稳定性差的问题,提出了一种基于扩展卡尔曼滤波的固定翼无人机姿态解算方法.在姿态角保持稳定时采用标准扩展卡尔曼滤波算法进行解算,姿态角发生剧烈变化时采用阈值法优化改进扩展卡尔曼滤波算法进行解算.改进方法在扩展卡尔曼滤波的基础上加入互补滤波器,把经过互补滤波和PI控制的误差向量补偿给陀螺仪传感器,加入动态梯度下降法对加速度计传感器的运动加速度加以抑制,将处理后的传感器数据代入扩展卡尔曼滤波方程组,用来解算固定翼无人机的三轴姿态角,可有效减小动态干扰和线性化误差,解算结果稳定性更高.与其他解算方法相比,本文用于三轴姿态角求解的姿态解算方法,静态姿态角误差小于0.6°,动态姿态角后验均方误差仅为0.01,特别是在姿态角度变化较大的时间点,本文解算的过程更加稳定和准确.
  • 荆沁璐1,冯林1,王旭1,龚勋2,胡议月1
    2023, 44(11): 2392-2400.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深度学习模型已在文本分类领域得到了广泛应用.然而,深度神经网络在处理少样本文本分类任务时其有效性易受噪声、同类样本点分布不均衡等问题的影响.为此,提出改进路由机制的元学习少样本文本分类模型.模型对胶囊网络的动态路由机制做出两种改进,针对噪声干扰问题,提出基于交互信息的路由机制,捕获同类文本间的交互信息来引导模型加强重要特征,减弱噪声影响;针对文本样本点分布不均衡的问题,提出基于距离系数的路由机制,引入距离系数指导权重分配过程以更好地划分原型空间.然后,将二者学习到的类原型进行融合,以充分捕获少样本文本特征信息.实验结果表明,相对其它少样本文本分类任务的基线方法,该文模型具有更优的少样本文本预测能力,并且收敛速度更快.
  • 陈彩蓉,刘虹,张岐山
    2023, 44(11): 2401-2407.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    Slope One算法在推荐系统中得到了广泛的应用,但该算法并未考虑用户间的差异性,并且存在数据稀疏、冷启动及灰羊用户等一系列问题.因此,采用均衡接近度灰关联方法计算用户间相似性,有效捕捉用户之间的潜在关联;并引入PageRank算法,利用图结构来建模用户间的信任关系,将计算出的PR值作为体现用户影响力水平的参数;最后将均衡接近度和用户影响力作为权重因子加权到评分预测过程中.实验结果显示,该算法可以有效提高推荐精度,缓解数据稀疏、冷启动和灰羊用户等问题对算法的影响,在数据稀疏、邻域较少的情况下,仍然可以达到较高的推荐准确率和较快的收敛速度.
  • 廖彬1,陈泽林2,3,陈羽中2,3
    2023, 44(11): 2408-2415.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    多轮对话是人工智能领域的一个重要分支.如何从多轮对话上下文中正确提取与问题相关的核心内容是多轮对话任务的关键问题.现有模型存在辅助任务低效,对全局与局部信息的筛选不够充分,对较短的多轮对话数据学习能力不足等问题.针对上述问题,本文提出了一种局部信息增强且能够感知对话结构的多轮对话模型(Structure-aware Dialogue Model with Fine-grained Local Information,SAFL).针对子任务训练代价大的问题,提出了随机滑动窗口回复预测任务,在多轮对话上下文中的不同位置与大小的窗口内进行回复预测,充分学习细粒度的局部对话语义.针对信息筛选不够充分的问题,提出了重点局部信息蒸馏机制,借助多门控融合方法从全局和局部信息之中蒸馏出重点信息,提升模型融合效果.针对模型对较短的多轮对话上下文学习能力不足的问题,提出阶段信息学习机制,在微调前加强预训练语言模型对短多轮对话数据的领域学习,降低微调阶段中对短多轮对话的学习难度.此外,SAFL设计了对话结构感知任务在对话结构方面进一步加强模型对对话上下文的理解能力.Ubuntu和E-commerce数据集上的实验结果表明,SAFL模型的总体性能优于对比模型.
  • 付小朋1,王勇1,2,冯爱武1
    2023, 44(11): 2416-2423.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对标准算术优化算法(AOA)存在的不足,提出一种新的采用协同搜索策略的算术优化算法(CSSAOA).首先,采用乘法搜索与除法搜索协同并行搜索的策略来增强算法的全局探索能力;其次,采用减法搜索与加法搜索协同进行的策略来增强算法的局部搜索能力;再次,改进数学优化加速函数(MOA),使算法在搜索前期侧重进行全局探索,在搜索后期侧重开展局部开发,加快了算法的全局收敛速度;最后,采用外抛交叉变异策略对当前最优个体实施多样性变异,确保在算法搜索前期不至于吸引过多个体过早聚集到群体当前最优个体的周围,增强了算法搜索跳出局部最优的能力.通过8个基准测试函数和2个典型的工程应用以及CEC2019函数实例测试,实验结果表明了CSSAOA具有更快的全局收敛速度和更高的优化精度,在实际工程优化应用中效率更高.
  • 王佳星1,周武源2,李甜甜1
    2023, 44(11): 2424-2433.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了解人工智能(artificial intelligence,AI)的研究现状和研究热点,以近10年Scopus和Web of Science数据库中的期刊与会议论文为研究对象,运用文献计量学方法,分析国内外AI学术研究现状,包括全球AI学术研究发展态势、发表论文国家/区域分布、AI研究机构分布、AI学者分布.在此基础上,进行AI研究热点分析,包括AI学科的知识结构和AI研究的关键词和研究主题,为人工智能相关的科学研究和管理决策提供参考.研究结果显示:1)全球人工智能领域研究成果总体上呈现急速增长态势,但仍然处于快速发展阶段,具有巨大发展空间和广阔发展前景;2)美国、中国及其研究机构在人工智能研究的文献数量方面占有绝对优势,但中国与全球主要国家与机构相比科研绩效较低;3)人工智能与众多学科的交叉融合已经成为主流,深度学习是人工智能的第一大研究方向,研究热点向着物联网和大数据转变,图像识别、工业4.0、意见挖掘、推荐系统、人机互动、脑机接口、轨迹跟踪、自动驾驶、故障检测、网络安全、交通流预测、机器翻译等方面是与人工智能相关的研究热点前沿;4)中国作为世界第一发文量大国,人工智能研究应当进一步重视提升研究质量,以迎接国际科技竞争的挑战并抢占全球新一轮科技革命和产业变革发展制高点.
  • 王杨1,2,单天乐1,李迎春1,赵传信1,陈鹏1,邹荣誉3
    2023, 44(11): 2434-2441.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对无线可充电传感网(WRSNs)存在的充电难、效率低等问题,提出了一种多无人机协同无线可充电传感网充电路径规划方案(MC-CPP).首先描述了多无人机路径规划问题并建立了数学模型,然后针对问题模型提出了相应的深度强化学习(DRL)算法,算法借助了神经网络、贪婪策略和经验回放等获取无人机的充电飞行路径;最后无人机沿着规划的路径为网络中各待充电节点进行充电.实验结果表明,与传统Q学习方案相比,MC-CPP方案在获得了较优规划路径的同时,不仅能够减少充电无人机的数量和强化学习迭代次数,而且提高了无人机的能量利用率;与TSCA、NJNP、GC等方案相比,该方案能有效减少无人机飞行时间、节点死亡的数量及无人机能量消耗.
  • 郭桂娟1,田晖1,皮慧娟1,贾维嘉2,3,彭绍亮4,5,王田2,3
    2023, 44(11): 2442-2449.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在联邦学习中,因数据只需要在终端设备上进行训练而不需要上传到服务器端,从而有效的保证了数据的隐私性和安全性.目前关于联邦学习各方面的研究虽然取得了很大的进展,但是联邦学习中的非独立同分布数据问题仍然是一个难以攻克的难题.本文对联邦学习中非独立同分布数据方面的研究进行了大量的调研,发现现有的研究主要涉及以下几个方面:性能优化、算法优化、模型优化、通信成本、隐私保护和个性化联邦学习等.为了归纳整理联邦学习中关于非独立同分布数据的相关研究,本文从以上各个方面详细介绍了现阶段联邦学习中有关非独立同分布数据的研究方案;最后分析了联邦学习中非独立同分布数据未来的研究方向,为今后联邦学习的研究指明方向.
  • 刘琨,王希孔,王辉,周超,刘沛骞
    2023, 44(11): 2450-2456.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在位置隐私保护中,差分隐私保护机制通过随机函数对真实位置加噪,从而保护真实位置信息.然而在隐私预算分配问题上往往易造成资源浪费以及隐私保护效率低下.针对此问题,本文在已有研究的基础之上提出一种基于概率相似性度量的差分隐私算法DPBO.首先,使用加权有向图来收集获取历史位置信息;然后通过范围度量找出历史位置点与真实轨迹中每个位置点R所对应的相似位置点集SET,对SET与R进行一对多(One To Many,OTM)概率相似性度量,得出每个R点的位置敏感度ΔG;最后根据不同ΔG,为真实轨迹中R分配相应隐私预算,添加Laplace噪声.通过实验,证明了该方案具有数据可用性和可行性.
  • 王瀚森,王婷,陈铁明,季白杨
    2023, 44(11): 2457-2463.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    代码注释生成技术通过分析源代码的语法和语义生成对应的自然语言描述,可以帮助开发人员理解代码,在软件开发和维护过程中起到重要作用.本文提出了一种基于Transformer的代码注释生成方法,可以同时学习源代码的语法结构特征和顺序语义特征.具体而言,将简化的抽象语法树(Abstract Syntax Tree,AST)通过多路树-LSTM建模,捕获树形语法结构编码,在Transformer中融合语法结构信息和顺序语义信息.实验结果表明,本文方法生成的注释质量优于其他基线方法.
  • 曾衍华1,单志龙1,2,陈之彧1
    2023, 44(11): 2464-2470.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对室内环境下Wi-Fi信号波动及在线定位阶段移动设备异质性而导致指纹定位算法精度不高的问题,本文考虑了用户移动轨迹上一系列接收信号强度指示(Received Signal Strength Indicator,RSSI)指纹之间的相关性,并提出了一种基于深度神经网络的室内定位算法.该算法在离线阶段,针对部分手机难以采集大量RSSI指纹的问题,通过数据增强扩充指纹库,减少指纹采集工作量;然后使用轨迹生成算法生成大量轨迹数据,训练基于卷积神经网络和循环神经网络的定位模型.在线阶段将RSSI指纹转换为差分矩阵以缓解设备异质性问题,并结合指纹的隐含特征以及模型上一时刻预测的位置进行定位.在不同移动终端设备上的实验结果表明,该算法可以有效缓解设备异质性的影响,提高定位精度.
  • 陈雨民1,李东喜1,闫一帆1,吕传建2,陈泽华1
    2023, 44(11): 2471-2476.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的学术论文推荐方法没有充分利用学术论文的结构化特点去捕捉标题摘要之间的语义关系.因此,提出一种结合文本与隐反馈信息的学术论文推荐方法.首先,通过预训练BERT模型获得标题摘要中单词的向量表示.其次,提出标题摘要注意力机制捕捉标题摘要之间的语义关系获得论文向量表示.最后,结合改进的神经协同过滤模型处理用户-论文隐反馈信息实现推荐.在CiteULike-a和CiteULike-t数据集上进行实验,本文方法相较基准方法在HR、NDCG两项指标上分别提升5.8,6.2个百分点,验证了本文方法提升学术论文推荐质量的有效性.
  • 郑志蕴,裴晓波,李钝,张行进,王军锋
    2023, 44(11): 2477-2484.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    事件检测是信息抽取的关键子任务,目的是识别文本中特定类型的事件实例.图注意力网络在图结构上使用自注意力机制,能实现高质量的事件检测,但现有图注意力网络存在忽略依存标签信息、上下文信息获取模型复杂等问题,导致模型准确率下降、计算资源开销较大.本文提出依存边信息嵌入的图注意力网络模型(EIEGAT),设计依存边信息嵌入模块,将依存标签信息嵌入到图的邻接矩阵中,使模型在构造图时同时考虑节点和依赖边的表示,提升事件检测准确率.使用结构和计算更简单的门控循环单元捕获单词的上下文信息,在维持性能的同时简化网络结构、节省内存空间.实验表明,EIEGAT有效提高事件检测的总体性能,在ACE2005英文语料集上事件识别与事件分类的F1值分别提高5%与0.9%.
  • 杨培星1,2,汤红波2,游伟2,邱航2
    2023, 44(11): 2485-2492.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于网络功能虚拟化(Network Function Virtualization,NFV)软硬件解耦的网络架构,运营商通过部署多个端到端逻辑网络为垂直行业提供多样化服务.然而,面对时延敏感型服务,需要将部分虚拟网络功能(Virtual Network Function,VNF)下沉到网络边缘.基于此,多接入边缘计算(Multi-Access Edge Computing,MEC)技术应运而生.但是,与核心云相比,边缘云的资源容量和计算能力有限,因此,在部署网络服务时既要考虑云边协同下的资源分配问题,还要考虑如何进行流量调度以提升边缘云的资源利用率并解决底层网络中的负载均衡问题.鉴于此,本文提出了一种基于动态流量拆分的VNF部署和流量调度方法.通过动态流量拆分将流量请求分配到多条路径和多个节点,从而使全局流量分布的更加均衡,根据流量拆分结果进行VNF部署,进而减少发生网络拥塞和流量请求超时的概率.其中,每条流量请求的拆分条数与拆分比例可以根据底层网络的资源状态和流量的特性灵活调整.因此,整个过程包括有效的流量拆分策略、VNF部署策略和流量调度策略.本文将云边协同下的虚拟网络功能部署和流量调度问题描述为混合整数线性规划(Mixed Integer Linear Programming,MILP)问题,并提出了一种基于禁忌搜索算法和遗传算法的联合优化(TSGA)算法.仿真结果表明,TSGA算法相比于TS算法和RB算法可以分别提高7.7%和12.9%的流量请求接受率,并分别减少5.4%和7.8%的流量平均开销.
  • 衣俊艳,贺树辉
    2023, 44(11): 2493-2501.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类分析在数据挖掘领域有非常重要的作用.为了克服传统聚类算法存在的低精度、低稳定性、无法求解大规模数据的问题,提出了引入特征选择初始化策略的弹性网络聚类算法(FSENC).算法首先用聚类目标函数替换弹性网络的损失函数,从而获得用于求解聚类的新能量函数,并优化了弹性网络的结构,根据极大熵原理与确定性退火技术,以最小化能量函数的方式得到聚类解.其次,提出了能够根据空间数据分布变化动态调整的初始化策略,提升了算法灵活性.在大量合成数据集和真实数据集上的实验结果表明,FSENC算法在求解聚类问题时是有效和高效的.与一些经典的和近年来新提出的聚类算法相比,能够获得更高的聚类质量,尤其适用于求解大规模高维聚类问题.
  • 周俊杰1,许鸿奎1,2,卢江坤1,张子枫1,李振业1,郭文涛1
    2023, 44(11): 2502-2509.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈骗电话文本分类.首先构建相关数据集,词嵌入用于表示文本,不同频率的正弦、余弦函数对文本位置信息编码并融入词嵌入向量,然后分别利用BiGRU(Bidirectional Gated Recurrent Unit)和CNN(Convolutional Neural Network)提取文本上下文相关信息、语句序列以及局部相关性,Attention机制对提取出的信息重新分配权重,突出关键信息的作用,最后将两种信息融合,通过Softmax实现分类.在THUCNews数据集以及诈骗电话文本数据集上的实验结果表明,本文提出模型的准确率和F1值均比对比模型有提升,同时模型对诈骗电话文本数据集分类的各项性能指标均在0.91以上.
  • 折夏煜1,刘玉宏1,王杨圣1,郭刚2,王海滨1,王亮3,韩光洁1
    2023, 44(11): 2510-2515.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    卷积神经网络(Convolutional Neural Networks,CNN)凭借其优越的并行处理能力,在医疗健康、无人驾驶、人脸识别等领域得到了广泛应用.现场可编程门阵列(Field Programmable Gate Array,FPGA)的灵活性使其适于CNN的硬件实现.然而随着工艺尺寸减小,软错误对FPGA的影响变得不容忽视.为了更好地研究基于FPGA的CNN异构加速器的可靠性,对其在关键任务中的设计给出参考性指导,提出了不同深度和宽度的网络拓扑,并对基于其设计的加速器进行了大量故障注入实验.通过分析实验中数据集、网络深度、宽度和资源开销对软错误恢复能力的影响,得出以下结论:使用高复杂度的数据集和增加网络深度会使CNN加速器抗软错误性能降低;而网络宽度的增加虽然会增大开销,但加速器并未因此获得更高的错误率,可靠性反而有所提升.
  • 孟祥福,温晶,李子函,纪鸿樟
    2023, 44(11): 2516-2521.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对复杂网络环境下搜索与目标节点文本和结构均相似的top-k节点问题,本文提出了一种基于卷积神经网络的top-k相似节点搜索算法LRE-CNN.对于一个无向带权复杂网络,首先为网络中每个节点构造基于度和权重的最近邻网络模型,利用最近邻网络相对加权熵计算度和权重对节点结构的影响.然后,通过KL散度比较节点对的差异生成节点结构相似度,从而筛选出目标节点的候选相似节点.最后,利用卷积神经网络(CNN)抽取目标节点和候选相似节点的文本特征间的潜在关系,从而预测出与目标节点文本结构均相似的top-k节点.通过在不同规模的复杂网络上进行实验,并与现有主流相似节点搜索方法进行对比,实验结果表明所提方法具有较高的检索准确率,同时具有较高的执行效率,能够有效适用于大规模复杂网络环境下的相似节点top-k搜索.
  • 阳磊1,宋威1,2
    2023, 44(11): 2522-2528.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    关系抽取旨在从非结构化文本中识别出实体对间的关系.目前,大多数关系抽取方法缺乏考虑实体的上下文语义环境,难以获得输入文本中丰富的语义特征.另一方面,大多数研究仅在包级别进行噪声句的筛选,无法有效地处理包内仅有一个句子的情况.为此,本文提出一种语义增强与双级别注意力的关系抽取方法.该方法首先利用门控机制筛选句子中的关键词,并依此作为实体的上下文语义环境信息,得到语义增强实体特征,与经过神经网络编码得到的句子特征相整合,得到鲁棒的句子特征表示.最后,利用双级别注意力降低噪声句对关系抽取方法性能的影响.在NYT公共数据集上的实验结果表明,本文所提方法优于目前主流的关系抽取方法.
  • 张潇1,宋威1,2
    2023, 44(11): 2529-2537.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    面对多峰优化问题粒子群优化算法因多样性不足和搜索动作选取不合理,难以找到问题的全局最优解.为此本文提出一种径向基函数神经网络指导的粒子群优化算法.首先设计子群划分方法,将种群划分成多个子群,子群中心作为子群粒子的学习目标,指导其搜索.该方法充分考虑种群多样性,选择能代表子群搜索特性的粒子作为子群中心,并使之远离存在的中心,通过选择合适的子群中心,实现子群划分.不同子群粒子在各自子群中心指导下搜索,呈现多样的搜索特性.其次,利用子群中心设置隐藏层节点,并在输出层输出粒子加速系数的调整动作.最后引入强化学习来训练网络.在CEC2013的15个多峰函数上开展实验,结果表明本文方法明显提高了多峰优化问题的求解精度.
  • 罗媛婷1,唐振华1,2
    2023, 44(11): 2538-2545.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的立体重定向图像客观评价算法往往采用统一的方法对重定向图像的失真予以衡量.然而,对于不同类型的立体重定向图像,人眼关注的失真类型与模式不尽相同.此外,现有算法未能精确地衡量重定向图像中深度感变化.针对上述问题,本文提出了一种基于分类和深度感损失的立体图像重定向质量评价算法.该算法根据重定向图像的显著度和深度特征进行图像分类,对不同类型的图像采用不同的失真质量评价策略.此外,为了精确衡量重定向图像的深度感变化,本文还提出了两种用于衡量深度感损失的指标,分别利用重定向过程中深度信息的丢失以及绝对深度的相似度来衡量深度感的损失.本文利用NBU-SIRQA和SIRD数据库进行实验,结果表明,本文算法的整体评价性能优于现有所有算法.
  • 李珊珊1,张曦3,刘文1,2,杨嘉鹏2,海玲2
    2023, 44(11): 2546-2551.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对乳腺X线影像数据样本少、肿块类别间差异不明显、乳腺肿块背景复杂与组织对比度低,导致检测的精度低等问题,文章提出了一种乳腺X线影像肿块征象检测算法.首先在主干网络中的卷积层中添加高效注意力机制,提升算法对特征的提取能力;其次,在特征提取网络中引入非对称卷积结构,利用3种不同尺度的卷积核进行特征检测,增强模型对旋转和翻转目标的特征提取能力,最后使用One Cycle学习率调整策略在模型训练时跳出局部最优解.在DDSM(CBIS-DDSM)公开数据集测试,本文提出的YOLOv5-EA模型有效提高了乳腺X线影像目标检测精度,在识别X线影像的良、恶性肿块及钙化灶的准确率分别达到了93.0%,88.4%和88.1%.
  • 杨有1,边雅琳2
    2023, 44(11): 2552-2557.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    利用现有深度学习方法实现人脸图像修复存在特征挖掘不充分、语义表达不完整等问题,导致输出图像容易存在伪影或模糊纹理等现象.为了解决这个问题,提出一种多特征深度融合的人脸图像修复模型.以融入门控卷积的U-Net作为主干网络,来提取结构和纹理这两种特征.再对两特征依次使用双向门控特征融合和门控注意特征融合进行两次融合,以充分挖掘图像高级语义及特征间上下文关系,实现精准而且有效的空洞填充.在训练过程中,定义一种修正的重建损失函数,强调保持结构完整时生成更多纹理细节.在CelebA-HQ数据集上的实验结果表明,与CA、EdgeConnect和CTSDG等代表性模型相比,所提出的图像修复模型在峰值信噪比、结构相似度和FID指标上均得到提升,它能够有效修复人脸图像.
  • 叶俊民,宋家琦,张珂,于爽
    2023, 44(11): 2558-2565.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前在线评测(OJ)系统中往往积累了大量的习题数据,学习者难以从海量习题数据中快捷、准确地识别出适合于自身的习题开展答题训练,只能大量地进行无差别刷题,习题与学习者的失配问题浪费了学习者大量的时间和精力,从而提升了学习者的学习成本、降低了学习效率.为此,本文提出了一种知识图谱增强的在线测评系统习题推荐算法,该方法结合了习题知识图谱,基于知识图增强推荐的多任务特征学习方法(MKR)模型完成习题推荐任务.首先,基于在线测评系统中的赛事集与习题知识体系构建习题知识图谱;其次,根据习题难度和学习者的能力水平,构建“学习者-习题”匹配矩阵;最后,利用交叉压缩单元,使用交替学习方法训练知识图谱嵌入(KGE)任务和习题推荐任务,完成学习者个性化习题推荐任务.在一个含有6919道习题、100名学习者的真实在线评测系统数据集上的实验表明,本文方法能够以84.2%的查准率完成在线评测系统学习者个性化习题推荐任务.
  • 徐良奎1,2,3,杨哲1,2,3,吴国荣4,赵雷1,2,3
    2023, 44(11): 2566-2575.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    超图直推学习模型是机器学习领域研究热点.超图模型的性能取决于构造的超图结构及其Laplacian矩阵的质量.现有超图模型基于单一超图结构,信息表达能力有限.本文提出超图结构扩张法,将异构超图的关联矩阵和权重矩阵拼接,融合更多的顶点间全局高阶信息,增加Markov随机游走的扩散范围.但这会导致矩阵维度高,计算开销大.因此进一步提出多通道Laplacian矩阵融合法,用多个通道计算异构超图结构各自的Laplacian矩阵,再加权累加.在4个数据集上的实验表明,两种方法都能提高超图直推学习模型的分类性能,且Laplacian矩阵融合法比结构扩张法平均节约40%左右时间成本,F1指标最高提升8.4%.
  • 江一鸣,董天阳
    2023, 44(11): 2576-2583.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有基于深度学习的单棵树木检测方法一般是对同个树木对象产生重复的候选框,然后通过非极大值抑制方法进行过滤,以确定每个对象最终的边框.这种方法对于孤立的树木对象能够起到很好的作用,但对密集重叠的树木场景中的单棵树木检测结果并不理想.本文提出一种基于迭代框架的密集场景单棵树木检测方法.该方法采用迭代框架统合两轮训练过程,首先在第1轮训练中提取边框,然后在第2轮训练中引入迭代边框,对候选边框进行筛除后再执行非极大值抑制过程,最后将非极大值抑制结果和迭代边框进行合并整合,这种方法将重叠边框分配到两轮训练中分别处理,减少了候选框之间的干扰;此外,该方法在两轮训练中可以采用不同的网络,本文通过实验得到最为适配的组合.为验证本文方法的有效性,本文采集和标注了密集重叠场景的树木数据集,并在该数据集上进行了实验和结果分析,实验结果表明本文提出的方法与现有方法相比,树木检测的准确率和召回率分别提升了2.4%和2.7%,能够有效提升密集场景树木检测的准确率.
  • 张家豪,张娟,郎晓奇
    2023, 44(11): 2584-2590.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    场景深度估计在三维重建、自动驾驶等应用中极为重要,目前深度估计缺乏在恶劣天气条件下的应用研究,实际场景表现不佳.本文针对雨天场景进行研究提出了一种联合的场景深度估计和图像去雨算法.其中深度估计网络以Transformer结构作为编码器和解码器主要模块,首先通过对图像块进行重排和线性投影生成嵌入块,减少了下采样的特征损失;接着利用多头自注意力机制在不同尺度提取特征并与解码器通过跳跃连接对局部和整体深度特征进行学习,提高了全局和长距离上下文信息的利用率,在RainCityscapes数据集上的场景深度估计质量优于现有算法.此外本文还将深度图结果作为先验信息,通过深度信息引导全局残差特征融合去雨网络得到无雨图像,在多个公开数据集上相比现有去雨算法的结构相似度(SSIM)和峰值信噪比(PSNR)均有提高.
  • 胡易航1,裘旭益2,张彦2,袁伟伟1
    2023, 44(11): 2591-2596.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    空中格斗决策作为空战领域重要组成部分,格斗决策的实时性、准确性直接关系到空战的成败,构建一个有效的、高速的、可解释的空中格斗模型显得十分重要.实际场景中,基于深度强化学习的空中格斗决策模型为了实现强大的学习能力,往往得到的模型参数过多,这导致了决策时间的延迟,不能较好的满足实时性强的空中格斗场景.同时深度强化学习模型的黑盒特性,使得模型在智能决策过程中的决策原因不可知,可是每一次空战决策过程中的不可解释性在空战场景中存在极大的未知风险.为了解决这些问题,本文提出一种基于高效的轻量级决策树的模型用于空战中战斗决策,该轻量级模型不仅满足可解释性同时满足空战场景中的高速决策.为了解决智能决策模型在每一次决策过程中的黑箱特性,本文采用一种局部代理技术完成空战格斗中每一次决策过程中的样本级解释.实践表明本文所构建的空中格斗模型具有较高的决策精度、速度与实战性能.
  • 郑俊1,3,肖明军2,3
    2023, 44(11): 2597-2602.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着移动互联网的飞速发展,对感知数据收集的需求增加,移动群智感知得以广泛应用.移动互联网数据的时效性要求越来越高,移动群智感知中移动数据的信息新鲜程度逐渐变得重要.然而,传统的激励机制设计方案只考虑了系统的经济效益,没有考虑移动数据的信息新鲜度.针对此问题,提出了一种平均信息年龄敏感的移动群智感知机制设计方案.首先,对移动群智感知中的信息新鲜度问题进行建模和问题形式化.然后,推导出单个或多个同质移动用户情形下3种先到先服务队列系统的平均信息年龄表征.以此为基础,进一步推导出多异质移动用户竞争情形下的平均信息年龄表征,给出了信息阈值限定下,移动用户可选的数据更新频率范围,为移动群智感知系统中移动用户的行动提供了明确的指导.通过数值研究进一步论证了上述情形中的平均信息年龄表征的正确性和合理性.
  • 胡锆,董天阳,方思琦,江一鸣
    2023, 44(11): 2603-2609.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    演员检测是将混合现实(MR)技术应用于戏剧表演的关键技术之一.然而,现有的行人检测方法无法在复杂舞台场景中进行有效的演员检测.因此为了提高演员检测的准确率,本文提出了一种用于复杂舞台场景的演员检测网络,将演员的关键点语义信息引入演员检测中.首先使用姿态估计子网络预测每个演员的关键点,然后根据演员的关键点生成包含语义信息的热力图.接着采用注意力机制将语义信息与原始图像融合,融合后的特征图送入检测网络进行进一步检测.同时为了提高关键点预测的准确率,改进了姿态估计子网络,将ResNet翻转拼接,堆叠成两级沙漏结构网络.在舞台演员数据集上进行对比检测,实验结果表明,引入关键点语义信息后的演员检测网络在MR,AP和AR上分别达到了14.37%,68.4%,73.3%要明显优于当前流行的其他方法.
  • 姜博1,张艺川1,易力1,王雷1,姜哲2,邹仕洪2,3
    2023, 44(11): 2610-2618.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当今主流操作系统通常采用访问控制列表的方式进行权限管理,但对于现实中多级权限传递的场景,由于用户主体和资源客体数量庞大,访问控制列表方式无法解决代理混淆问题.权能是对操作系统中进程所拥有的资源的一种描述.一方面,进程在访问某个资源前必须获得该资源的权能;另一方面,进程只能访问其权能空间中的资源.采用权能访问机制的操作系统能避免进程对资源的访问越界,实现了系统安全范畴中的权限细粒度化、特权最小化原则.本工作基于一个已有的微内核操作系统MOS,设计并实现了权能机制和基于权能机制的用户态C库函数;在用户态设计并实现了进程服务器和进程间通信接口;最后针对权能系统展开实验分析,以验证整体设计的正确性和有效性.
  • 常清宜1,龚博雅1,鲁克文1,2,陶丹1
    2023, 44(11): 2619-2624.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    地面相控阵雷达相比于传统雷达在部署方式和功能上具有优势,有较好的应用前景.目前,采用硬件传输地面相控阵雷达数据流缺乏灵活性,而采用传统的基于Linux网络协议栈的传输方法具有性能瓶颈.针对上述问题,本文基于DPDK(Data Plane Development Kit,数据面开发套件)提出了一个面向地面相控阵雷达数据流的高性能传输机制.首先,针对CPU单核频率较低的问题设计了一种基于多核CPU的多线程方法.其次,设计了帧池、帧索引池和进程间通信协议,实现了数据的重组和消费.再次,融合了Mbuf和Mempool数据结构实现了高速网络报文的缓冲.最后,基于实际的硬件平台开展了实验,实验结果表明,本文提出的传输机制能够在低丢包数前提下实现单机不少于8通道的地面相控阵雷达数据流传输,数据传输效率相比于传统的Asio网络库在网络流量和数据包捕获率指标方面有一定的提高.