过刊目录

  • 2021年, 42卷, 第6期
    刊出日期:2021-06-01
      

  • 全选
    |
  • 孙淑娟,过弋,钱梦薇
    2021, 42(6): 1121-1128.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现实购物场景中存在的用户偏好多样性且兴趣动态变化的问题,本文提出一种融合上下文信息的序列推荐模型(DeepSeq),通过嵌入用户提供的反馈信息深入挖掘用户的长短期潜在兴趣,有效解决了传统推荐系统无法模拟用户兴趣进化的问题.该文以真实的电商网站数据为背景,首先,利用历史行为数据和项目辅助信息融合构造长短期会话序列并融合上下文信息,提出兴趣衰减因子反应用户偏好变化.其次,基于文本卷积模型(TextCNN)训练得出序列向量表示,并通过多头注意力机制抽取用户项目序列潜在向量;最后,将用户交叉辅助信息和潜在行为特征组合向量输入到多层感知机,建立基于序列的推荐模型.实验结果表明,在行为序列中融合兴趣衰减因子和项目辅助信息,均有效提高了模型的准确率.此外,DeepSeq相对于传统的推荐模型在评价指标RMSE上至少降低了0.21%,并且在GAUC评价指标上提升值均超过了0.59%.
  • 邓良,陈章进,乔栋,屠程力
    2021, 42(6): 1129-1135.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对大多数基于FPGA的加速器受限于运算资源与访存带宽,很难部署大型的神经网络这一问题,通过研究神经网络的计算特点,运用通用计算模型的思想,提出了一种指令集架构的神经网络协处理器的设计方案.该方案中的协处理器具有一套专用的运算指令集,支持多种神经网络结构的运算,搭配相应的指令生成程序,能够灵活快速的进行神经网络在FPGA平台上的部署.考虑神经网络运算的相似性,对电路进行复用,降低资源的占用;设计内存多端口读写控制模块,通过协调片上缓存与片外存储,降低对访存带宽的需求.使用python与UVM验证方法学搭建验证平台进行验证,并在PYNQ-Z2开发板上进行实验.结果表明:方案中的协处理器对激活函数的运算误差在0.05以下,对其他类型指令的运算误差在10-4 级别,工作在100MHz下的运算性能达到41.73GOPS,达到同类设计的主流水平,消耗的资源比同类设计平均降低80%.
  • 高虹雷,门昌骞,王文剑,
    2021, 42(6): 1136-1143.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征的所有取值,当数据集规模较大时,递归构建决策树所需时间将会很长,因此在保证分类精度的前提下加速决策树的构建具有重要意义.本文首先根据数据的不同分布,给出两种特征值区间的分割方法,即等精度特征值区间划分和变精度特征值区间划分,然后计算各选定区间的基尼指数,寻找最优特征及最优切分点,最后递归生成模型决策树.实验表明,算法在构造决策树时可有效减小计算代价,在保证分类精度的同时加速决策树的构造,且在一定程度上能够避免过拟合现象的发生.
  • 赵海燕,成若瑶,陈庆奎,曹健
    2021, 42(6): 1144-1151.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,个性化推荐系统的研究已经成为一个热门领域,其技术在各行各业得到了广泛应用.在现实生活中,人们可以划分成不同的群组,人们也经常以群组的形式一起参加各种形式的活动,所以对群组推荐也具有实际的应用价值,群组推荐系统已经吸引了越来越多的关注.本文对群组推荐系统的相关研究进行了梳理,将群组推荐的核心技术分为5个方面:群组识别、信息获取方法、融合策略、推荐方法和评价指标.本文对这些方面进行了详细介绍与分析.此外,还列举了群组推荐系统发展中面临的困难与挑战.最后,对群组推荐系统未来的发展方向进行了展望.
  • 董明刚,范培,闭玉申,敬超,
    2021, 42(6): 1152-1157.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    虚拟化技术是云数据中心的核心技术之一,良好的资源管理及调度方法有利于云数据中心的虚拟资源管理从而提供快速、安全和可靠的服务.本文主要研究了工作流联合调度问题,以最小化费用开销为目的,在保证工作流完成的前提下,提出了一种二阶段的工作流联合调度算法,分别优化了工作流到虚拟机的映射和虚拟机到物理机的部署问题.该算法基于蚁群系统的核心思想,设计了相关的启发函数和信息素更新规则,形成了工作流到虚拟机的映射集合,在减少了工作流的完成时间的同时避免了陷入局部最优解;然后,针对虚拟机物理机的部署问题,考虑了多类型虚拟机的特点,采用了贪心算法的思想,在保证工作流的完成时间的情况下达到了最小化费用开销目的.最后,通过Cloudsim仿真平台进行实验,分别采用四个工作流数据集:CyberShake,Montage,LIGO,SIPHT,将提出的算法,与代表性的PSO算法、FCFS算法、IPSO算法进行对比,结果表明提出的算法在费用和执行效率明显优于其他算法.
  • 蔡恒雨,郑启龙,
    2021, 42(6): 1158-1164.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性.
  • 孟学尧,郭倩倩,郭海儒
    2021, 42(6): 1165-1170.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    模糊C均值聚类容易受噪声数据影响,进而影响聚类准确率.鉴于此,提出了一种改进萤火虫算法的模糊聚类方法.该方法首先在萤火虫算法中引入Chebyshev映射初始化种群的分布;然后提出一种自适应步长方法来平衡探索与开发能力;最后在局部搜索过程中对每次迭代的最优个体加入高斯扰动策略,使其跳出局部最优.该过程拥有良好的寻优能力,易于得到全局最优值,将其作为模糊C均值聚类算法的初始中心进行聚类,可有效增强算法的鲁棒性,提高算法的全局寻优能力.为了评估算法的有效性,在4个数据集上进行了对比实验,实验结果表明该算法在聚类准确率和鲁棒性方面均优于对比算法.
  • 陈可嘉,黄思翌
    2021, 42(6): 1171-1175.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对RAKE(Rapid Automatic Keywords Extraction)算法在中文短文本关键词提取算法中未考虑词语语义和候选关键词过长的问题,提出一种以RAKE算法为基础的改进方法.在词语特征值计算阶段,利用词项距离、词间关系频率、共现频率构建共现矩阵,利用语境值计算公式计算每个候选关键词的特征值;按照特征值的降序输出候选关键词,若候选关键词词语个数超过n个,则利用窗口输出算法限制关键词的长度.实验表明,本文方法在中文短文本关键词提取方面相比RAKE算法及其它算法有更好的表现.
  • 刘鑫,祁瑞华,徐琳宏,陈恒
    2021, 42(6): 1176-1183.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社交媒体中俄语情感信息的深入挖掘和分析,对国家制定政治、经贸和外交战略具有重要参考价值.本文针对俄语社交媒体文本口语化、不规范、形态多样等特点,提出融合俄语形态、俚语等词级特征和特殊符号、英译情感信息等句级特征的多级特征表示方法,建立基于自注意力机制的俄语情感分类深度学习模型.针对俄语推特文本的情感分类实验表明,本文提出的多级特征能有效提升多种模型分类的F1_macro和准确率,与已有研究相比,本文模型不仅提升效果最明显,而且针对俄语情感的特征提取和分类能力更强.
  • 朱晓松,郭景峰,李爽,郝童,
    2021, 42(6): 1184-1191.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着直播频道的不断增加,观众不得不花费额外的时间和精力来选择适合的节目.通常,推荐系统可有效缓解上述问题,然而直播电视所具有的实时性、多用户、隐性反馈、冷启动等特点给推荐系统的研究带来挑战.针对这些特点,现有的方法大多利用时段划分的方式将用户对节目的偏好转换为对频道的偏好,通过推荐频道来完成节目的推荐.然而,这些方法的时段划分规则依赖经验,不具通用性,可解释性差,并且未考虑用户偏好会随时间的推移而变化的情况,同时,推荐频道的模型往往忽视了对正在播出的节目的关注.为此,本文提出了时间相关的直播电视推荐算法TTRec.首先,采用聚类的方法按时段将每个物理频道划分为若干虚拟频道,构建用户虚拟频道偏好矩阵.其次,利用遗忘函数调整用户隐性反馈的量化结果,将其作为偏好矩阵的填充值.然后,采用协同过滤算法对偏好矩阵中未知项进行预测.最后,以节目的时间特征为属性,通过计算正在播出的新节目与历史节目的相似度来调整偏好矩阵中对应的数值,按调整后的结果生成推荐列表.在真实的数据集中的对比实验表明,TTRec明显优于对比算法.
  • 何炜俊,艾丹祥
    2021, 42(6): 1192-1198.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    许多推荐技术(如协同过滤)存在以下不足,降低了用户的体验满意度和忠诚度:1) 忽略了“用户兴趣和商品属性会随时间而改变”这一事实;2) 过度追求预测准确性而牺牲了推荐多样性和新颖性.为此,提出一种能动态适应上述变化,同时优化推荐准确度、多样度和新颖度的互动式推荐系统.主要步骤:1) 采用理想点法构造多目标优化函数;2) 收集用户反馈信息,及时地更新推荐策略;3) 基于多臂赌博机构建互动式推荐框架.实验表明,经过与用户不断地互动推荐,该系统的平均列表准确度、多样度和新颖度都在逐步提升.
  • 汤彩芸,张孙杰,裴自强
    2021, 42(6): 1199-1205.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出一种新型的带有注意力模块的反卷积一阶检测器,简称做DSSDA(Deconvolutional Single Shot Detector with Attention Module).整个网络架构主要借鉴DSSD模型,在卷积层后加反卷积上采样进行特征融合,再在融合的特征后嵌入注意力模块,以帮助网络将注意力放在目标上并抑制不重要的信息.注意力模块包括通道注意力和空间注意力两个子模块,作用分别是识别物体类型,以及确定物体位置.两个子模块都分别采用最大池化和平均池化获取全局信息.子模块通过串联形式实现拼接.为了节约计算成本,省略原始的DSSD最后一个上采样过程.在PASCAL VOC和MS COCO公开数据集上验证本文提出的带有注意力模块的反卷积一阶检测器的有效性,结果表明所提模型在目标定位和分类上性能都提升显著.
  • 施举鹏,李静,陈琰,陆正嘉
    2021, 42(6): 1206-1212.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深度卷积网络由于强大的特征学习及表征能力在图像超分辨率领域取得了广泛的应用,伴随图像超分辨率模型的不断发展,复杂的模型带来了庞大的参数量以及越来越高的计算需求.为了提升参数的复用并抑制特征冗余信息在迭代反馈中的传播,本文引入了反馈机制,并提出了一种新的基于深度反馈注意力的超分辨率网络模型(Deep Feedback Attention Network,DFAN).本文提出的模型在每一轮训练中,以迭代的方式学习图像低分辨率到高分辨率的映射,并在迭代的过程中结合反馈注意力机制提高模型学习的准确性,从而进一步提升超分辨率结果的质量.本文提出的模型在单图像超分辨率基准测试集Set5的×2/×3/×4倍率重建任务上,最高分别达到了38.04/34.65/32.41db的峰值信噪比.
  • 潘伟博,汪海涛,姜瑛,陈星
    2021, 42(6): 1213-1218.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统阿尔茨海默症辅助诊断算法使用单一模态数据,以及丢弃缺失模态样本的问题,本文提出了一种基于非对称多模态学习的阿尔茨海默症辅助诊断算法.本算法包含两阶段任务,第1阶段利用磁共振成像(Magnetic Resonance Imaging,MRI)和正电子发射断层扫描成像(Positron Emission Tomography,PET)之间的潜在联系,使用3D循环生成对抗神经网络,训练出一个特定的PET生成模型,补全缺失的PET数据.第2阶段,通过多模态深度非负矩阵分解模型,将MRI和PET的特征融合/学习过程和辅助诊断集成到一个框架中进行分类.这可以消除神经影像特征与疾病标签之间的差异,并提高辅助诊断性能.本文对ADNI数据库中1457名受试者进行的实验结果表明,本文提出的算法在阿尔茨海默症识别和轻度认知障碍转换预测中均表现出良好的性能.
  • 李昆仑,陈栋,王珺,王怡辉
    2021, 42(6): 1219-1226.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在微表情自动识别任务中,浅层卷积神经网络和深层网络相比更好地改善了网络训练过拟合的情况,但是多数浅层卷积神经网络存在输入特征单一和提取高维有效特征能力不足的问题.针对上述问题本文同时使用图像的灰度特征和运动特征表征原图像,并且提出了一种改进双流浅层卷积神经网络(Enhanced Dual-stream Shallow Convolutional Neural Network,EDSSNet)用于微表情的识别.本文首先使用欧拉视频放大算法和TV-L1光流法对视频关键帧处理,提取图像的灰度特征和运动特征,然后用空洞卷积和注意力模块改进双流浅层卷积网络模型,提高网络提取有效特征的能力,最后将两种特征输入网络训练后进行分类.理论分析及在CASMEⅡ、SMIC-HS和SAMM微表情数据库上的实验结果均表明了改进模型的有效性.
  • 王丽萍,汪成,邱飞岳,章国道
    2021, 42(6): 1227-1235.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    3D手势姿态估计是计算机视觉领域一个重要的研究方向,在虚拟现实、增强现实、人机交互、手语理解等领域中具有重要的研究意义和广泛的应用前景.深度学习技术已经广泛应用于3D手势姿态估计任务并取得了重要研究成果,其中深度图像具有的深度信息可以很好地表示手势纹理特征,深度图像已成为手势姿态估计任务重要数据源.本文首先全面阐述了手势姿态估计发展历程、常用数据集、数据集标记方式和评价指标;接着根据深度图像的不同展现形式,将基于深度图像的数据驱动手势姿态估计方法分为基于简单2D深度图像、基于3D体素数据和基于3D点云数据,并对每类方法的代表性算法进行了概括与总结;最后对手势姿态估计未来发展进行了展望.
  • 窦晓磊,陈鸣,陈兵,徐亚欣
    2021, 42(6): 1236-1242.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无人机实时图像应用(Realtime Image Applications based on Unmanned aerial vehicle,RIAU)在民事和军事领域具有广泛的应用前景,研发这种系统面临着许多挑战.本文提出了“人在环路上”RIAU系统的概念,采用人工智能技术来提升RIAU系统的能力;研究了人在环路上RIAU的典型计算模式,分析了地面计算和机载计算两种模式系统的特点;研究了RIAU系统的关键技术和基于YOLOv3算法的图像目标检测方法;设计实现了RIAU原型系统.试验结果表明,系统的总时延主要取决于计算单元处理时延和通信单元传输时延;在机载计算模型下利用神经网络计算棒,目标识别时间不超过1秒;采用4G技术,通信单元之间的距离可以不受限制.
  • 吴建斌,牛玉贞,张宇杰
    2021, 42(6): 1243-1249.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对低光照图像增强任务中缺少正常光照的参考图像问题,提出了一种基于生成对抗网络的无参考低光照图像增强方法,即在不需要参考图像的条件下可训练得到低光照图像增强模型.为实现低光照图像增强过程中保留图像细节和全局一致性,本文了提出了改进的基于空间和通道的自注意力融合模块以及图像全局信息感知的自适应实例化归一化模块.由于训练过程中无法获得参考图像,本文进一步提出基于图像自身信息感知的自颜色损失函数,从而提升生成对抗网络复原低光照图像中颜色信息的能力.实验结果表明,本文方法在低光照图像增强中保留细节信息和恢复低光照场景颜色上具有良好作用.与已有的低光照图像增强方法相比,本文方法在主观视觉效果和无参考自然图像指标Natural Image Quality Evaluator(NIQE)上均有提升.
  • 陈权,黄俊,徐访
    2021, 42(6): 1250-1255.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统视觉背景提取算法(visual background extraction algorithm,ViBe)在室内监控条件下容易产生“鬼影”现象以及阴影难以消除的问题,提出一种针对人物室内活动的改进ViBe算法.针对容易引入“鬼影”现象,采用一种外接矩形像素直方图的方法,利用运动目标区域直方图与邻域背景区域直方图相似度匹配,快速检测“鬼影”现象,设置鬼影点像素值并参与背景模型更新,从而快速消除“鬼影”现象.针对阴影难以消除的问题,采用YCbCr颜色空间与混合高斯阴影模型相结合的方法共同确定阴影区域,从而解决阴影问题.仿真结果表明,相较于传统的ViBe算法,本文算法能够有效的消除“鬼影”现象,解决阴影问题,运动目标检测的准确性也得到了有效提高.
  • 姚明海,沈颖琦,柳嘉敏
    2021, 42(6): 1256-1261.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    工件表面缺陷检测是保障工件质量的重要环节,在有足够标签的情况下,有监督学习可以很好地对其缺陷进行分类,但当有新的工件需要检测时,又要标注新的数据集.为了解决该问题,本文利用不同工件之间缺陷种类的相似性,并基于迁移学习的思想,提出了一种全局特征和局部特征共同适应的无监督域适应方法(GLDA).该方法首先利用生成对抗网络对齐全局特征,然后最小化生成域数据与目标域数据的协方差矩阵的差从而对齐局部特征,并将语义损失加入总体优化目标函数中作为正则项,使得对齐全局特征后的数据经过分类网络后不丢失局部的特征信息.所提出的方法不再局限于同类别不同分布的迁移,并在工件表面数据集和公开数据集上能取得较好的分类效果.
  • 廖璐明,张伟,王亚刚
    2021, 42(6): 1262-1266.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有的交通标志识别算法在识别率和识别速度等方面存在的不足,在空间不变性方面还可以进一步利用的问题,提出一种基于空间变换网络和注意力机制的交通标志识别算法.首先将交通标志图片经过数据增强,然后输入到空间变换网络中,使得图片具有空间不变性,经过卷积层提取特征和池化层降维,提取图片抽象语义信息进行分类,在模型中加入改进的注意力机制模块,在通道和空间两个维度对特征图施加注意力机制,实现交通标志的准确快速识别.最终实验结果表明,在公开的德国交通标志数据集上,在43个类别12630个测试集上达到99.80%的识别率,平均识别时间只需0.29ms.
  • 冯波,刘桂华,曾维林,余东应,张文凯
    2021, 42(6): 1267-1275.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对机器人SLAM系统,在实际场景或低纹理场景中提取的有效特征点数量少,使得系统初始化效果差和定位精度不高的问题,提出了一种基于点线特征和IMU信息融合的双目惯导SLAM系统(Stereo Visual-Inertial state estimator based on optimized ORB point feature and line feature,OOL-VINS).首先,对双目视觉进行点线特征的提取与匹配,通过匹配的特征点构建残差模型,并结合松耦合算法实现系统快速且稳定的初始化.然后,利用点线特征以及三角化算法设计了一种更加鲁棒的方法来获取路标点的3D信息,以此来实现系统的位姿跟踪.最后,根据位姿跟踪过程中构建的局部三维地图,并结合滑动窗口的非线性优化对相机位姿进行更新,提高系统的定位精度.实验结果表明,OOLVINS在TUM纹理结构类数据集上能获取更多有效的点线视觉特征,且特征提取耗时为27ms.在EuRoc和TUM-VI数据集上进行初始化实验,实验表明,OOL-VINS初始化更加快速稳定.同样地,我们使用以上数据集进行系统性能的实验验证.结果表明,该系统的平均跟踪帧率为25Hz,在300m的低纹理场景中,定位精度可达0.072m.
  • 王岩,董方旭
    2021, 42(6): 1276-1280.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对肝脏肿瘤存在的分割难点结合级联网络的思想,提出了一种融合了双注意力机制和UNet架构优势的肝脏肿瘤分割网络(CDA-Net).首先,训练第一个DA-Net来实现肝脏的粗略分割;然后将第一阶段的分割结果与原始CT图做与操作,提取感兴趣区域,并将其输入第2个DA-Net实现肝肿瘤的精确分割;最后利用条件随机场对分割结果进行边缘约束,优化分割结果.在LiTS2017数据集上对模型进行训练及测试,平均Dice指标为0.658.实验结果表明,本文提出的方法具有较好的精度,证实了其对肿瘤分割的有效性.
  • 杨晶东,王海灵
    2021, 42(6): 1281-1287.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    器官或肿瘤的精确分割对于医生诊断和预测疾病至关重要.与传统的特征工程相比,经典的U-Net模型在生物医学图像分割中具有较好的性能.但在U-Net模型中,池化操作和卷积操作会使得一些特征空间信息丢失,导致图像分割精度降低.为此本文采用MultiResR2block模块代替UNet模型中的两个3×3卷积模块用于提取特征,采用PathNet模块连接MultiResR2U-Net模型中的编码网络和解码网络,减少空间信息丢失,同时本文也提出了一种新的图像增强策略,使分割模型更加关注图像较难分割的部分.针对细胞数据集和血管数据集进行分割研究,实验表明,与U-Net和RU-Net模型相比,本文方法仅采用近2/3训练参数,获得了更好的分割评估性能,其中,Dice系数增长了0.56%和1.46%,Jaccard系数增长了0.91%和1.92%.因此,与U-Net和RU-Net模型相比,本文方法具有更高的分割性能和更好的泛化性能.
  • 吕念祖,李小霞,肖娟,周颖玥,
    2021, 42(6): 1288-1292.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    视网膜血管分割对眼部疾病的自动分析和诊断具有重要意义.针对视网膜图像对比度低、血管细小导致血管分割困难的问题,本文提出一种结合注意力机制和条件生成对抗网络的视网膜血管分割方法.首先设计一个高低层(HL)特征注意力模块作用于高层和低层特征图,使模型分别加强高层和低层空间相关特征,剔除冗余信息,有助于模型更加关注血管前景信息,提高细小血管的分割精度;其次将高低层特征注意力模块与U型网络相结合,构成视网膜血管分割的生成器,并去掉生成器中的BN层,避免小批次训练生成器时批统计量不稳定对分割结果造成的影响;最后将残差网络作为判别器,与生成器一起构成条件生成对抗网络,在生成器和判别器博弈过程中增强生成器学习能力.实验结果表明,本文方法在DRIVE数据集测试的灵敏度、特异性、准确率、AUC(Area Under Curve)分别为82.88%、97.45%、95.59%和97.86%,各项指标均优于目前主流的视网膜血管分割算法.
  • 林雪,张志佳,刘立强,杨欣朋,王士显
    2021, 42(6): 1293-1296.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了提高交通标志识别系统在城市路况环境中的实时性应用,本文面向城市路况交通标志识别对 VGG 网络进行了剪枝与量化研究.以VGG网络为基础,从网络架构的角度采用基于LAOSS回归的通道剪枝方法缩减卷积通道,横向压缩网络的宽度,以最小均方误差作为损失函数对剪枝后模型进行重新训练恢复精度,将VGG模型由537M压缩至507M,运行速度提升29.6%;从模型权重数值的角度采用最小化K-L散度的量化方法对复杂模型进行权重的拟合及优化,参数由float32量化为int8,降低权重参数的复杂度,模型空间占用缩减为原来的1/4,运行速度提升12.8%;以数据融合的方式对自采数据集进行数据扩增,增加数据量同时也增加正则化惩罚项,提高泛化能力,模型的识别率提高0.9%.
  • 秦绪佳,赵铮,柯玲玲,郑红波,马骥
    2021, 42(6): 1297-1303.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于气象数据直接体绘制的方法对三维云进行可视化时,如果使用低精度、少层级的网格数据就会造成模拟数据在垂直方向上相对稀少,从而导致云面会十分粗糙、渲染效果缺乏真实性.为了解决这个问题,本文提出一种利用纹理噪声引入随机抖动从而使云面细节丰富、有较强真实感的方法.首先生成3D Perlin噪声纹理并采样,再和气象数据的原始纹理以不同的比例进行融合.该方法可以让三维云整体有更好的立体感以及更佳的视觉感受.此外,仅仅用数值模拟绘制云虽然已经模拟了光的反射和吸收,但并未涉及到光的散射效应,所以使用数值模拟绘制出来的云真实感仍旧不够.为了绘制出更具有真实感的三维云,本文结合Cook Torrance光照模型和双向反射分布函数(BRDF)对传统光照模型进行改进.此改进模型考虑了材质微平面对光照的影响,运用到对三维云的可视化中,可以得到真实感较强的三维云仿真效果.
  • 隋源,汪卫,邓雪
    2021, 42(6): 1304-1312.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来区块链技术受到广泛关注,区块链的应用已经不止局限于加密数字货币,还在溯源、金融、物联网等领域有了初步的应用.传统结构的区块链由于受到共识算法的限制,大量的密码学计算导致网络的事务吞吐量无法得到有效的提升.本文提出一种面向区块链的链下数据库的可验证查询模式,全部的数据按批次存储在链下数据库,区块链中只存储批次数据的消息摘要值,通过这种方式将区块链不可篡改的特性与链下数据库强大的增、删、改、查的能力结合,同时保证了该模式的效率和安全.基于这种模式,本文提出了一种多模式可验证查询方法,根据节点之间信任程度的不同,提供不同代价花费的验证查询方式.在实验的部分采用了Hyperledger Fabric和HBase作为这个模式的实例,通过实验说明了这种模式在系统吞吐量和可验证查询方面有着较好的表现.
  • 朱文强,傅游,梁建国,郭强,花嵘
    2021, 42(6): 1313-1320.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    Silicon-Crystal应用运用分子动力学方法对晶体热传导性进行模拟,采用Tersoff势模拟硅晶体的运动轨迹.本文利用神威Athread在神威太湖之光上成功移植了Silicon-Crystal应用,针对SW26010异构众核处理器带来的内存受限问题,提出5种主要优化方式:1)将计算所需参数预取到LDM(Local Data Memory);2)通过DMA(Direct Memory Access)方式对中心原子数据进行传输;3)合理设计软件cache,利用软件cache实现邻居原子数据的读取;4)在从核定制超越函数,避免从核访问超越函数时的离散访存;5)利用寄存器通信实现从核间任务分步流水优化.经过优化,单核组较主核串行取得了12.89倍的加速,较Intel Xeon E5-2620 v4处理器取得了8.7倍的加速.本文还对Silicon-Crystal应用进行了可扩展性测试及分析,实验结果证明Silicon-Crystal应用在神威太湖之光平台上具有良好的可扩展性.
  • 刘云,郑文凤,张轶
    2021, 42(6): 1321-1326.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    离群点数据在数据分析中会影响回归模型的拟合精度,特别是高维不确定性离群点数据,通过模糊回归方法,可减少离群点对多维数据模型拟合的影响.本文提出模糊残差算法,首先在模糊域中构建模糊回归模型,其次迭代计算观测值和估计值之间的残差确定权重,通过最小化加权目标函数估计模型参数,得到基于加权优化的鲁棒模糊回归模型,最终算法优化的模型更精确拟合目标数据.仿真结果表明,在离群点影响情况下,与RTS-L1算法和FLAR算法相比,模糊残差算法在估计精度和鲁棒性方面有更好的提升.
  • 王杰,付安琦,余开文,
    2021, 42(6): 1327-1331.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文中探讨了多输入多输出非正交多址接入(Multiple-Input Multiple-Output Non-orthogonal Multiple Access,MIMO-NOMA)系统的用户分簇问题.针对现有用户分簇算法需要指定簇数的问题,提出了一种基于近邻传播的无监督机器学习用户分簇算法.仿真结果表明,提出的用户分簇算法在系统和速率上相较于对比算法具有显著的优势,同时算法不需要指定簇数,仅依赖于基站(Base Station,BS)处获取的信道状态信息(Channel State Information,CSI),便可将用户划分为多个簇,是一种方便且实用的算法.
  • 吴明杰,陈庆奎
    2021, 42(6): 1332-1339.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着边缘AI的兴起,边缘GPU集群被广泛用于大量并发AI数据流的实时处理.AI数据流不仅需要在集群内传输,还需要在计算节点上排队和计算.为了减少响应时间,研究者们旨在通过优秀的调度算法减少任务的排队等待时间,而忽略了调度命令的传输耗时.在传统的单平面框架下,由于调度命令与数据在同一个物理线路上传输,在集群内传输数据量很高时,容易因调度命令的传输延迟和丢弃而调度失败,甚至造成集群性能下降或者故障.本文提出一种边缘集群内AI数据流的双平面调度模型.首先,提出一种双平面的框架,将调度命令和数据传输从物理上分离,互不影响.其次,在数据平面使用基于DPDK的多网卡并行通信技术以提高数据传输的效率和带宽,针对AI数据流设计和实现了基于消息的可靠传输协议.最后,提出兼顾计算节点网络负载和计算负载的任务迁移调度模型,旨在降低集群内数据流的排队延时.在不出现消息丢失的情况,本文的双平面架构传输方案能够增加集群数据流容量约30%;在不出现任务丢弃的情况下,本文的双平面架构调度模型能够增加集群数据流容量约15%.
  • 李兰,张才宝,奚舒舒,马鸿洋
    2021, 42(6): 1340-1344.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    用户使用基于位置服务功能的APP时,通常利用手机号进行登录,为了防止手机号码与用户提交的位置信息与查询内容被恶意攻击者关联起来,提出一种身份认证下交换查询的轨迹位置保护算法.用户登录时,利用第三方服务器将手机号码过滤,使服务提供商无法获得手机号;用户利用自身位置发送查询请求时,第三方服务器根据距离权重选择最佳协同用户,对用户的ID进行转换,保护用户位置隐私与查询内容.实验结果表明,与CPP算法相比,该算法将轨迹位置保护度提高了2.8%,并降低了用户请求响应时间.