过刊目录

  • 2022年, 43卷, 第3期
    刊出日期:2022-03-01
      

  • 全选
    |
  • 罗建华,黄俊,白鑫宇
    2022, 43(3): 449-455.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了研究传统目标检测算法在进行道路小目标检测时效果不佳及漏检率较高等问题,本文提出了一种基于改进YOLOv3的小目标检测方法.首先通过设计新的特征融合结构降低小目标漏检率,并且使用DIOU损失提高定位精确度.同时对YOLOv3算法中的聚类算法进行改进,采用K-means++算法改进聚类先验框中心点的提取,选取更为合适的Anchor Box,用于提高检测的平均精度和速度.在自制混合数据集上对行人及车辆进行对比检测,在不影响检测速度的情况下,改进的YOLOv3算法能够有效降低小目标物体漏检率,并且提高了检测精度.根据实验结果,本文所提出的改进YOLOv3模型在混合数据集上的平均精度达到92.82%,与未改进的YOLOv3算法相比提高了2.77%.
  • 赵海燕,周萍,陈庆奎,曹健
    2022, 43(3): 456-465.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着推荐系统的广泛应用,它正在对社会产生越来越大的影响.由于数据、算法等原因,推荐系统可能会对具有某些特性的群体产生带有偏见的结果,导致不公平现象的产生,从而引发各种问题.消除偏见并在推荐中实现一定的公平性,会使整个推荐系统的结果更加平衡、友好.对推荐系统的公平性进行评价是提高推荐系统公平性的基础,近年来,研究者提出了各种不同的推荐系统公平性评价方法.本文系统总结了近几年的研究成果,从3个维度对推荐系统公平性进行了分类介绍,重点从利益相关者的维度详细分析并总结了在各种推荐环境下出现的公平性定义和评价标准,并对其进行了展望.
  • 陈佳豪,白炳松,王冬华,严迪群,王让定
    2022, 43(3): 466-474.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    自动语音识别系统(ASR)能将输入语音转换为对应的文本,其性能因深度学习技术的发展得到了显著提高.然而,通过在输入语音中添加微小扰动而生成的对抗样本,可以使人类毫无察觉的同时让ASR系统产生不可预测的,甚至是攻击性的指令.这种新型的对抗样本攻击给基于深度学习的ASR系统带来了诸多安全隐患.本文对语音对抗样本作了系统性的分析和梳理,提出了对现有对抗样本的分类.其次介绍了面向ASR系统的对抗样本生成方法.同时,阐述了典型的对抗样本防御策略.最后讨论了对抗样本带来的挑战,并分别就如何使生成的攻击更加逼真,和增强ASR的鲁棒性提出了若干有价值的研究方向.
  • 尹晓娜,王国辉,施智平,关永,张倩颖,张景芝
    2022, 43(3): 475-482.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    区域覆盖算法广泛用于群机器人解决资源勘查、目标搜救、地形测绘等问题.目前,对区域覆盖算法的研究主要是用传统计算机仿真和数值计算方法对算法模型进行测试,然而,软件系统缺陷可能会使测试结果出现偏差,导致任务失败.因此,本文采用定理证明的形式化方法,基于交互定理证明器HOL-Light中集合库、实分析库等定理证明库,实现了群机器人工作场景的高阶逻辑表达;完成了机器人移动概率和平均移动概率的建模与验证;最终验证了一定时间步长内群机器人在特定区域内的覆盖率的正确性.为实现多种复杂场景下群机器人区域覆盖算法的高阶逻辑定理证明形式化分析奠定基础.
  • 杜铭浩,刘爽,刘潇雅,张文荃,明东,
    2022, 43(3): 483-489.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于面部视觉特征的抑郁症诊断方法借助计算机视觉技术,通过分析被试的面部肌肉和眼球相关运动特征来辅助抑郁症的早期检测.与目前临床上通常采用的医生访谈方式相比,基于面部视觉特征的抑郁症诊断法具有被试无须与外人外物交流接触且客观高效、普及性强与成本低的显著优点,可极大缓解医生患者比例不足、误诊率偏高现状,拥有广阔应用前景.本文从抑郁症患者的面部行为特点入手,综合介绍了目前常用的诱发实验范式、现有面部视觉特征公开数据库及基于面部视觉特征的抑郁症诊断的最新研究成果,最后简要讨论了存在问题与发展动向.
  • 钱勤红,刘安,孙玉娥
    2022, 43(3): 490-497.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    任务调度问题是空间众包的核心问题之一.现有工作主要针对欧式空间中的个人任务,忽略了群组任务以及底层的路网信息,实用性有待提高.有鉴于此,本文研究路网场景下群组任务匹配和调度问题,提出了基于网格索引的群组任务匹配和调度算法框架.该框架由网格索引、搜索有效工人集算法和组建团队算法组成.该框架首先通过网格索引存储的路网信息和工人信息快速过滤掉不满足时间或预算约束的工人,避免大量无效的最短路径计算.然后利用基于剪枝策略的搜索算法搜索到满足任务约束的有效工人集.最后通过组建团队算法迭代地在有效工人集中选择最小成本覆盖比的工人加入团队完成任务.最后通过实验验证本文提出方法的有效性和高效性.
  • 江婧婷,郑朝晖
    2022, 43(3): 498-505.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文阐述了一种应用于大规模数据节点划分的改进网格密度峰值聚类算法.针对传统的密度峰值聚类算法距离矩阵计算时间长,人工选取阈值对聚类结果的影响较大,限制其在大规模数据集中的应用等缺点,本文采用基于自适应网格划分的密度峰值聚类,通过判断网格均衡来计算网格间距离,引入万有引力得到网格相对引力,通过极大值平均选取法自动得到密度与引力阈值.经过不同数据集的对比实验,本文提出的大规模节点划分算法在保证算法准确度的同时,其执行速度最高约提升了77%,由轮廓系数评估的聚类质量稳定在0.42左右.
  • 朱海,金瑜,
    2022, 43(3): 506-513.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    共识算法作为区块链的核心技术,决定了区块链系统的性能.其中,PBFT是最具有代表性的一种共识算法,但它存在以下缺点:通信代价大、共识时延长.由此诞生了许多通过各种方法减小共识节点规模来提升PBFT效率的一类算法,但是它们都不是基于距离因素的,并且具有与PBFT类似的缺点.基于此,本文提出了一种基于距离的面向区块链的共识算法.首先通过Grouping算法对节点进行分组,将距离较近的节点分成一组进行共识,从而在缩短共识节点之间距离的基础上减少共识时延.同时结合speculation技术,降低节点间通信的时间复杂度,从而减少了系统的通信代价.最后理论分析了影响共识时延和通信代价的两个指标:节点间的平均延迟、通信次数,证明了DS-PBFT在共识时延以及通信代价这两个方面均要优于PBFT和现有的这一类算法;通过实验验证了DS-PBFT相比PBFT和现有的这一类算法,降低了共识时延.
  • 张忠林,傅添翼,闫光辉
    2022, 43(3): 514-519.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统的过采样算法中决策边界模糊以及噪声样本分布问题,本文提出一种基于概率密度函数与自适应过采样算法.首先将少数类样本分为安全样本、边界样本、噪声样本;然后采用瑞利分布(Rayleigh Distribution),对安全样本及边界样本进行采样操作,利用其概率密度函数对新样本的分布密度进行构造,以此达到平衡数据集的目的;最后使用随机森林作为分类器,并进行网格搜索(Gridsearch)进行参数寻优.实验结果将所提出的方法与4种代表性算法在10个不均衡数据集上进行了比较,验证了该算法的有效性.
  • 王丹,梅志强,刘金枝
    2022, 43(3): 520-524.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有5G系统主同步信号同步算法在大频偏情况下的同步性能较差的问题,本文提出一种基于快速傅里叶变换(Fast Fourier Transform,FFT)的联合检测算法,通过对传统互相关算法中的共轭相乘结果进行FFT变换,记录变换后的峰值,遍历所有峰值找到同步点,得出小区组内号,再进行载波频偏的估计.仿真结果及复杂度分析表明,改进算法不仅具有很强的抗频偏能力,尤其对于大频偏下的情况,同时完成载波频偏的估计,所增加复杂度在可接受范围内且检测性能稳定.
  • 周超,武友新
    2022, 43(3): 525-529.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的神经协同过滤算法在隐式反馈数据集上对用户和项目建模,由于隐式反馈数据天然带有很强的噪音,这给模型的学习带来了挑战.为了缓解该问题,文中提出了一种基于三通道的神经协同过滤算法,该方法使用自编码器去挖掘用户和项目的特征向量,然后结合用户和项目的辅助信息一起通过多层感知机去学习特征向量不同维度之间的高阶交互关系,并将其与传统的神经协同过滤算法融合,以此来提高模型的泛化能力和命中率.此外,在隐式反馈数据集上进行负采样不易且采样结果会极大程度影响模型的表现,文中采用一种基于传统矩阵分解的概率负采样方法克服这个问题,提高了模型的鲁棒性.本文在公开数据集MovieLens上进行了大量实验,实验结果表明基于本文提出的算法比其他先进算法有更优的表现.
  • 徐嘉康,张晨,王柳静,张贵军
    2022, 43(3): 530-535.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的地址匹配方法往往难以胜任中文地址匹配问题.首先,每个中文单字都是独立整体,在纠错上难度大于英文,其次中文地址体系结构复杂,缺乏一个统一的标准.本文结合生物信息领域的序列比对思想,提出了一种基于动态规划的中文地址匹配方法.该方法将中文单字看成字符单元,对中文地址进行序列化,改进Smith-waterman算法进行序列匹配.针对中文的单字特点,统计区分文字的重要性差异,构建非均权打分策略;引入空分罚分策略,解决错误匹配及其过度拟合问题;使用排序均一化策略,优化了排序效率,增加了结果集的多样性.最后,将本算法应用于杭州市实际路网(1:30万),实验结果表明,该算法可以有效提升中文地址匹配精度.
  • 崔员宁,李静,陈琰,陆正嘉
    2022, 43(3): 536-543.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于深度强化学习(Reinforcement Learning,RL)的知识推理旨在推理缺失事实并补全知识图谱,RL智能体在知识图谱上搜索路径,并基于路径进行事实预测和链接预测.由于具有良好的性能和可解释性,基于深度RL的知识推理方法近几年迅速成为研究热点.然而,对于特定实体来说,动作空间中存在大量的无效动作,RL智能体常常会因选择无效动作而终止游走,所以路径挖掘的成功率很低.为了解决无效动作的问题,本文提出一种基于深度迁移强化学习的知识推理方法—TransPath,在目标任务之外增加了单步游走选择有效动作的源任务.首先在源任务上训练单步游走,帮助RL智能体学会选择有效动作,然后迁移到目标推理任务上进行路径搜索训练,提高路径挖掘的成功率.在数据集FB15K-237和NELL-995上的对比实验结果表明,本文方法不仅大幅提升了路径搜索的成功率,而且在大多数推理任务中性能优于同类方法.
  • 李孟浩,赵学健,余云峰,宋学永,孙知信
    2022, 43(3): 544-554.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着互联网的发展,全球数据量爆炸式增长,信息过载现象严重,如何获取用户真正关注的信息成为困扰人们的难题之一.在此背景下,推荐算法在各个领域得到了广泛应用.本文首先介绍了目前主流推荐算法的分类方法和主要评价指标.其次,分别介绍了当前各类推荐算法的研究进展,其中包括传统推荐算法的基础推荐原理和研究进展以及神经网络在推荐算法中的研究应用,对其进行归纳总结.同时分析了数据稀疏性、冷启动和可伸缩性等推荐算法常见问题.最后,提出了现有推荐算法的不足以及在应用中遇到的部分问题,介绍了未来推荐算法的研究热点.
  • 葛志辉, 谭悦, 李陶深, 叶进
    2022, 43(3): 555-560.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现代大型系统中系统日志的异常检测问题,提出了一种基于自动日志分析的异常检测方法(CSCM).该方法通过在预聚类下结合细化分析与多视角的异常提取过程,来实现系统日志的异常检测.首先,引入信息熵以提取日志信息量;其次,基于Canopy预聚类过程提取子集交叠数据,以缩小计算范围;利用谱聚类进行细化分析,并结合预聚类结果以优化初始化问题;最后,通过关联不同视角下的日志分析,分别提出显性与隐性异常对象的定义,基于稀疏簇质心的分析和异常度的计算,识别出异常日志.实验结果表明,提出的检测方法能够准确有效地识别系统日志中的异常值.
  • 赵娜,孙红,黎铨祺,黄瓯严
    2022, 43(3): 561-567.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    各种类型的深度神经网络模型已被应用到时序分析中,但基于频域的神经网络与时域的线性模型融合仍然缺乏有效的模型.提出一种基于多级小波分解的深度网络和差分自回归移动平均模型相融合的方法(mWDLNet),时序信号经小波分解到频域,由卷积神经网络和长短期记忆网络提取时序信号的空间和时间维度特征,同时利用差分自回归移动平均模型(ARIMA)解决神经网络模型的尺度不敏感问题,最后融合两部分的输出结果,提高了预测的准确性.并通过实验验证了mWDLNet模型添加小波分解、卷积模块以及融合线性预测的有效性.将提出的模型应用于北京气象数据集,进行PM2.5浓度预测,并与常用的时序预测模型进行对比分析,结果表明,提出的mWDLNet模型能达到更好的预测结果.
  • 傅晨波,夏镒楠,岳昕晨,俞山青,闵勇
    2022, 43(3): 568-573.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着互联网上用户移动数据的日益繁荣,用户的移动行为预测也成为了预测研究的热点.近年来,循环神经网络(RNN)技术因其高效性和扩展性在移动预测中得到了广泛的应用.但是,目前大部分网上收集到的用户移动行为数据普遍具有稀疏和异质的特性,特别是当用户出于习惯或隐私考虑可能会拒绝向平台提交活动记录.因此在这些稀疏数据集上基于RNN的预测技术无法有效地学习到足够的用户行为特征,从而影响了模型的预测性能.为了解决该问题,本文提出了一种融合信息网络结构的数据增强行为预测算法.具体来说,首先我们将用户历史行为数据转为信息网络图;然后通过该信息网络的模块度来评估用户的信息传递效率;最后根据信息传递效率对用户的朋友数据进行采样,将具有高信息传递效率的朋友数据嵌入到用户数据中对用户数据进行增强.在真实数据集Yelp上的实验结果显示,我们的方法可以起到对现有算法模型增强的作用,所有模型的预测性能都得到了大幅提升.
  • 杨宇,吴国栋,刘玉良,汪菁瑶,范维成
    2022, 43(3): 574-581.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    生成对抗网络(Generative Adversarial Nets)是一种融合了生成学习和对抗学习的无监督学习方法,以零和博弈作为核心思想,其组件通过互相对抗不断地提升模型效果.将GAN模型融入到推荐领域中,可有效缓解数据稀疏性问题,提高推荐效果.本文从模型输入的是隐式反馈信息或显式反馈信息两个方面对基于GAN的个性化推荐模型进行了分析;探讨了基于GAN的个性化推荐研究已取得的相关成果,指出了现有GAN推荐研究在稳定性较差、缺少通用优化方法、模型复杂度较高、缺少通用评测指标等方面的不足;并从提高模型稳定性、缓解数据稀疏性、融合多场景、融入图神经网络等方面对GAN推荐的未来发展性方向进行了展望.
  • 陶丹,姚伊,吴谨汐,范睿明,郑晨旺
    2022, 43(3): 582-588.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的兴趣点推荐通常忽略了用户签到行为中序列模式的重要性,且无法有效地捕捉用户复杂且动态变化的兴趣偏好.由此,本文提出了一种用户偏好和时间序列的兴趣点推荐模型(User Preference & Time Sequence based POI Recommendation,UPTS-PRec).该模型能够分别对短期偏好和长期偏好建模并融合,以捕捉用户兴趣的变化.对于短期偏好,提出了融合时空上下文信息的长短期记忆网络来学习用户签到行为中复杂的序列转移模式,并通过基于目标的注意力机制进一步精确地提取短期偏好.对于长期偏好,基于用户注意力机制以捕捉用户和兴趣点之间细粒度的关系.最后,在Foursquare和Gowalla两个数据集上进行实验仿真.结果表明本文提出的UPTS-PRec模型和主流的推荐方法相比在不同的评价标准上性能有较好的提升,验证了所提出模型的有效性.
  • 熊威,王展青,王晓雨
    2022, 43(3): 589-597.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    哈希检索具有存储消耗低、查询速度快等优点,被广泛应用于跨模态检索研究,其中基于深度学习的跨模态哈希方法是热点研究问题.大多数深度哈希方法通常在多模态数据的特征关联性学习过程中忽略了数据内容的潜在相关性和语义判别性,从而导致哈希码的关联性不强,容易造成原始数据特征和神经网络特征的不兼容问题.针对以上问题,本文提出一种图像文本深度联合语义哈希算法(Deep Joint-Semantic Hashing,DJSH).该方法使用两个神经网络分别提取图像和文本的细粒度特征,并为每个模态网络设计了哈希层和标签层,分别用于特征学习和标签预测.一方面,通过特征学习模块进行跨模态数据的深度特征学习,提出能够增强数据内容相似度和平衡数据分布的联合语义特征损失,同时基于拉普拉斯约束的图近邻结构能够保留原始数据的相似度排序;另一方面,通过引入标签预测和标签对齐技术,将有判别力的标签信息融入到图像与文本的跨模态网络学习中,确保哈希码的每一位具有不同类别的判别信息.在MIRFLICKR25K、NUS-WIDE和IAPR-TC12三个基准数据集上的实验结果表明,该模型较近年来先进的跨模态检索模型,具有更好的检索效果.
  • 谭茜成,郭涛,李鸿,朱新远,邹俊颖,夏青
    2022, 43(3): 598-603.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    多表征自适应网络(MRAN)用于无监督学习取得了显著成效.但MRAN的特征提取只关注了域在空间结构上的联系而忽略了特征通道之间的联系,在进行无监督领域自适应(UDA)分类时,决策边界附近存在大量混淆数据的情况,当使用信息熵最小化对混淆数据进行分类时,往往会产生错误分类.针对这一问题,提出了基于批量核范数最大化的多表征挤压激励自适应网络(Multi-Representation Squeeze-Excitation Adaptation Network_Batch Kernel Norm Maximization,MRSEAN_BNM).该网络采用挤压激励注意力机制对多表征特征进行重标定,以强化重要的表征特征,采用条件最大均值差异(CMMD)拉近源域和目标域的特征分布距离,并通过最大化目标域分类输出矩阵的核范数以约束决策边界的混淆数据,达到提升域适应图像分类精度的效果.在基于公开数据集的域适应下的图像分类、可视化结果实验结果表明,MRSEAN_BNM分类精度有明显提升.
  • 易思恒,陈永辉,王赋攀,蔡婷
    2022, 43(3): 604-610.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在人机交互动作识别领域中,基于深度学习的动作识别方法比传统的手工特征提取方法准确率更高.为了解决基于深度学习的动作识别方法在实时人机交互的实际应用问题,本文设计并创建了交互动作数据集(IA RGB-D),用于深度学习方法的人体动作识别研究.将IA RGB-D用于多种神经网络的训练和测试,测试结果准确率均在95%以上,验证了数据集的正确性和有效性.为保障对采集动作的实时识别正确率,本文提出了一种基于高效通道注意力的位移图神经网络(ASGCN),将高效通道注意力模块引入位移图卷积神经网络(Shift-GCN),增强其在通道特征上的提取能力.实验证明,ASGCN比Shift GCN准确率更高,提高了复杂动作的识别率,并且与传统的手工特征提取方法对比,识别效率接近但是准确率大幅提升.
  • 郑愈明,范媛媛,牛玉贞,
    2022, 43(3): 611-620.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    立体图像左右视图间的差异影响了视觉任务对深度信息的重建.现有立体图像颜色校正方法在进行颜色校正时,颜色校正效果与整体时间效率不平衡.为了解决这个问题,本文提出一种端到端的基于视差注意力的立体图像颜色校正方法.该方法在一个卷积神经网络内同时进行立体图像对应关系获取和目标图像颜色校正.先采用共享参数的多尺度特征提取模块分别提取参考图像和待校正失真图像的特征,再通过视差注意力模块的双向匹配策略进行特征之间的对应关系匹配与融合,获取图像对应匹配关系,最后重建融合特征得到校正目标图像.视差注意力机制仅在图像水平视差方向进行搜索匹配像素,能够实现左右视图信息的高效融合.实验结果表明,与现有方法相比本文模型更有效,能够在保持高时间效率的同时获得更高质量的颜色校正结果.
  • 宋欢,沈韬,曾凯
    2022, 43(3): 621-625.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于太赫兹技术的安检设备具有独特的无损伤检测特性,在安防领域具有良好的发展前景.太赫兹图像分辨率低,特征信息有限,且高亮区域多,目标与背景亮度相近,为太赫兹图像中的目标检测带来了一定的困难.针对此,本文提出一种融合多尺度注意力的目标检测框架MSAD-SSD,在SSD算法的基础上,采用ResNet101作为特征提取网络,并设计一种多尺度注意力模块.该模块采用多支路膨胀卷积进行多尺度特征提取,扩展网络的感受野,充分获取目标的上下文信息;通过注意力机制对特征图的通道特征进行权重分配,增强有用特征,抑制无关信息的干扰;最后对多个分支进行特征融合.实验结果表明,所提MASD-SSD在太赫兹图像数据集中达到82.63%的平均检测精度,能够有效提高目标的检测精度.
  • 庄咸乐,王朝立,孙占全
    2022, 43(3): 626-631.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在CT图像分割的过程中,通常都会先使用窗口技术对图像数据做预处理.然而,由于脏器组织与病变组织密度的不均匀性,使得这种预处理方式并不能完全将无效信息除去而重点关注脏器和病变部位.受注意力机制的启发,本文提出了一种新的CT图像预处理方式.首先,根据专家经验制作标签,计算出组织的空间概率分布,利用概率分布制作出CT蒙版.其次,将蒙版覆盖到原图上后即可除去大量低概率区域的图像信息,降低网络学习难度.对于蒙版的制作,文中给出了3种做法.针对由于蒙版覆盖导致信息损失的特性,本文还提出了一种蒙版和初次分割结果相结合的方式,用于补偿使用蒙版导致的信息损失.本文提出的预处理方法在经典网络结构FCN、U-net和SegNet,在LiTS和3Dircadb数据集上做了多组对比,实验结果表明该方法对CT图像的分割结果有较好的效果.
  • 杨凯婷,张素兰,张继福,胡立华,杨海峰
    2022, 43(3): 632-637.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大多数图像标签完备方法仅依据待完备图像的视觉特征搜索近邻图像,获取候选标签实现完备,往往忽略候选标签与初始标签隐含的语义和视觉关系.为有效完备图像标签,本文依据信息的相互学习机制提出一种基于视觉和语义互学习的标签完备标注方法.首先,依据待完备图像的视觉特征和初始标签语义,搜索其近邻图像集并获取候选标签;其次,根据候选标签与初始标签的视觉内容相似性和语义相关性度量候选标签与待完备图像的关联度;最后,结合候选标签频率,选取关联程度高的候选标签实现标签补全.在基准数据集 Corel5K 以及真实数据集 Flickr30Concepts上进行实验验证,结果表明该方法在图像标签完备的平均准确率、平均召回率以及覆盖率上均表现出更优的性能.
  • 陈延雪,杨长春,葛天一,朱军
    2022, 43(3): 638-643.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    应急响应是各类突发事件应急管理的关键.为解决现有医疗领域应急响应决策支持模式存在的精细化程度低、决策服务单一、智能性不足等问题,提出了混合基于案例推理和规则推理的医疗紧急呼救事件应急响应方法.该方法首先将呼救信息构建为呼救知识图谱并将医疗单位和警务单位等信息构建为外部知识图谱集;然后通过实体对齐技术,将呼救知识图谱和外部知识图谱集融合成医疗突发事件知识图谱,以支持事件信息可视化和应急响应方案推理;最后运用基于案例推理(CBR)和基于规则推理(RBR)的混合推理方法,对突发事件知识图谱中隐含关系进行挖掘,推理出符合实际救援需要的资源调配方案.结合实例,验证了该方法的可行性和有效性.
  • 曹鹤玲,刘昱,赵晨阳,王玉华
    2022, 43(3): 644-654.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    程序缺陷自动修复是指针对程序中存在的缺陷,自动生成相应的程序补丁,进而使程序恢复正常运行.首先,根据补丁生成方式的不同,将程序缺陷自动修复方法划分为4类,分别为基于搜索的、基于语义的、基于机器学习的以及基于错误报告驱动的程序缺陷自动修复方法.基于搜索的程序缺陷自动修复方法运用启发式算法在搜索空间内通过搜索生成程序补丁;基于语义的程序缺陷自动修复方法将修复约束作为合成程序补丁的规约,最后通过约束求解器生成程序补丁;基于机器学习的程序缺陷自动修复方法使用数据集训练并生成修复模型,通过修复模型生成程序补丁;基于错误报告驱动的程序缺陷自动修复方法通过利用程序执行以及用户反馈的错误信息生成程序补丁.本文对以上4类程序缺陷自动修复方法进行了详细阐述;其次,总结了检验程序缺陷自动修复方法及工具修复效果所用到的缺陷库;最后,分析了程序缺陷自动修复在工业界的应用现状并总结了该领域面临的关键问题及未来研究的方向.
  • 张晓莹,陆慧娟
    2022, 43(3): 655-660.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文研究医疗简历筛选,提出了基于多级特征表征与级联模型的方法.首先,面向医疗简历教育与工作背景、科研能力、业务能力等多组与多层特征表征问题,提出基于注意力网络的多级特征表征方法,实现特征级、特征组级与特征组组合等多级表征的融合.其次,提出了级联分类模型建模细粒度筛选过程,将现有简单的“通过与不通过”粗略筛选改进为“优秀、良好、中等、一般”的细粒度筛选,更加符合现今医院招聘初审、笔试、面试的多级筛选过程,有利于后续对不同等级人才的考量,也解决了数据不平衡带来的分类错误.最后,在包含13552条简历的数据集上验证了所提出方法,以支持向量机为分类方法的级联模型平均F1值达82.46%.特别是能够提升优秀类简历的分类效果,对可能被录用的竞聘者识别的更好,对于简历筛选的实际应用帮助更大.
  • 唐文,周兰江,张建安
    2022, 43(3): 661-666.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前流行的词性标注方法严重依赖语料规模及人工提取特征的质量;然而,老挝语资源稀缺,语料及特征选取面临很大挑战,且老挝语句子本身存在普遍过长的特点.因此,该文提出一种融合细粒度词特征的老挝语词性标注方法,构建了融合细粒度词特征的Att-BiLSTM-CRF模型.首先,以老挝音素和声调符号作为基本单元来进行老挝细粒度词特征的提取,使模型获取更加丰富的语料信息;然后,将细粒度词特征输入BiLSTM中获取句子级别特征;其次,使用自注意力机制防止老挝句子长远上下文信息丢失;最后,使用CRF提取相邻词性约束关系,从而获取最优词性标签.实验结果表明,在有限语料集下,该方法精确率、召回率和F1值分别为93.70%、93.87%、93.62%.
  • 熊鑫,田增山,谢良波
    2022, 43(3): 667-672.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文对基于跳频的宽带RFID测距系统进行研究,分析了该测距系统结构及多频点联合距离解算原理、载波相位的求解过程;研究了相位误差度量函数,解释了在多频点距离解算中出现整周求解错误的原因;提出多径等典型误差的消除方法,提升了系统性能.实际测试结果表明,跳频的多频点载波相位和距离之间呈现规则的变化趋势;本文的误差抑制方法能有效减少整周求解错误,在使用误差抑制后系统测距平均误差从10cm减小到了2.5cm,实现了厘米级测距.