过刊目录

  • 2022年, 43卷, 第6期
    刊出日期:2022-06-01
      

  • 全选
    |
  • 梁润秋,沈瑜,Naji Alhusaini,何卓骋,李京
    2022, 43(6): 1121-1127.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    超算中心已经成为众多科研机构的重要科研基础设施,对基于MPI的高性能计算应用进行数据建模和分析对优化网络流量、资源调度等许多方面十分重要.已有的研究工作大都集中在超算中心大规模MPI整体使用情况,或小规模的某个特定应用的研究,缺乏对科研行业超算中心的研究.本文通过采集和跟踪中国科学技术大学超算中心最典型的两个应用的流量信息:小规模并行的VASP应用和大规模并行的OpenFOAM应用,对MPI各个函数调用的流量数据和数据包传输进行了统计分析并发现其特点和性质,得出了一些新结论,这些结论可以用于指导超算中心网络设计和优化.
  • 周利峰,殷新春,宁建廷
    2022, 43(6): 1128-1135.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着无线通信技术的迅速的发展,无线医疗传感器网络正在推动着智能化医疗的进步.医疗传感器节点能够收集病人的医疗数据,并将其传输给医生进行诊断与治疗.但是,无线医疗传感器网络中的通信安全、病人的身份隐私以及对集中式服务器过度依赖等问题亟待解决.针对上述问题,提出了一种适用于无线医疗传感器网络的基于区块链的无证书聚合签名方案.该方案无需集中式的医疗服务器,通过基于分布式哈希表存储机制以链上-链下的方式存储医疗数据,保证了医疗数据的安全和去中心化存储;同时,本文方案通过智能合约技术实现医疗传感器节点在许可区块链上身份来源认证.在随机预言模型下证明了该方案具有不可伪造性,并且满足可追踪性,匿名性等安全需求.与现有其他相关的方案相比,该方案在签名和验证阶段的计算和通信开销更具优势.
  • 聂佳幸,谭国平,周思源
    2022, 43(6): 1136-1140.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于感知的半静态调度(S-SPS,Sensing based Semi-Persistent Scheduling)是C-V2X车联网协议中车车直连通信的信道资源选择机制,能够有效避免通信过程中数据包的碰撞问题.但是S-SPS不能完全避免数据包碰撞,目前缺乏对数据包碰撞产生干扰的建模研究.针对此问题,构建了通过S-SPS进行信道资源选择的车辆通信网络模型.然后,统计在此场景下其他车辆与发射车辆选择同一资源而产生干扰的概率,并通过曲线拟合得到其服从双指数分布.最后,利用得到的干扰分布和随机几何模型推导出车辆信干噪比的表达式,从而得到工作在此模式下的车辆通信网络的数据包成功接收率.实验仿真结果验证了干扰建模和推导公式的正确性.
  • 邵椿与,李晓娟,史涤霏,张笑搏,王瑞,关永
    2022, 43(6): 1141-1146.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    CAN总线是一种基于消息的事件触发通信服务,主要应用于汽车、机器人等实时通信系统.CAN总线上有多个节点互相独立工作,当多个节点访问总线时出现消息碰撞,由于CAN总线采用按位仲裁算法决定节点访问总线的优先级,导致低优先级节点访问失败,而高优先级节点继续传输消息,这种方式导致低优先级节点饥饿现象而丢失消息,因此CAN总线调度算法随之被提出.目前调度策略已从静态发展到动态,但是随着节点的增多,系统维护和调度难度增加,单条总线调度策略难以维持系统性能需要.因此本文考虑将系统中的节点挂载到多条CAN总线上构成CAN网络,针对CAN网络提出了一种层次化的动态调度算法,将节点优先级仲裁分为:单条总线本地优先级仲裁和系统全局优先级仲裁,确定系统优先级最高的节点,使其进行数据传输.利用MATLAB中的Stateflow工具,建立分层动态调度模型,依据CAN总线数据传输机制和仲裁机制,设计实现了节点模块、总线模块、函数模块等,在总线模块实现了两级调度.实验结果表明,本算法在增加了节点总数目的基础上,满足高优先级节点传输且避免了低优先级节点的饿死现象.
  • 涂聪,陈庆奎
    2022, 43(6): 1147-1153.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在边缘计算场景中,GPU集群需要应对终端设备所产生的数量庞大的AI计算任务.AI计算任务在边缘GPU集群内的响应耗时不仅包括计算时间,还包括数据传输和排队等待延时.因此,任务数据传输和AI数据流调度也是影响GPU集群数据处理性能的关键因素.传统网络协议栈的低效率和专用高速网络设备的高成本,并不适用于边缘场景中大规模AI数据流的实时处理.本文基于DPDK技术提出多核多网卡的并行通信机制,利用集群空闲的CPU资源加快数据传输;兼顾节点计算能力和网络负载分析节点实时处理能力制定数据流分配策略,并实现了由数据接入量驱动的动态多核多缓冲区模型,减少了任务计算的等待时间.实验结果表明,提出的通信调度方案不仅能够增加约30%的集群数据流容量,而且带宽利用率能够达到90%;在总AI任务量相同的情况下,归功于DPDK高效的数据包处理能力,避免了大量的AI任务因传输失败而被丢弃的情况.
  • 梁荣欣,陈庆奎
    2022, 43(6): 1154-1161.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    边缘AI的兴起促进了AI在边缘计算场景中的广泛应用.随着AI任务的多样化、终端设备性能的不断提升,实际应用中亟须设计一种新的模型实现单个终端设备上的多AI任务并行调度.然而目前的研究更关注单个AI任务在单个终端设备上的计算效率,因此本文提出一种基于模型预分层的多AI任务调度策略,以优化多AI任务在终端设备上的计算效率.首先,对多个AI任务进行模型预分层,并记录每种预分层的计算量和参数量;其次,在终端设备上建立资源监控模型,实时检测可用资源情况;最后,结合时间周期要求和实时可用资源的约束,以对边缘终端的计算资源需求最大为目标,从多个AI任务的多个预分层模型集合中选取一组由多个AI任务不同预分层组成的最优解,动态地调整每个AI任务在终端设备上的模型计算层数,在避免固定式模型分层的弊端的同时,充分利用终端设备的计算资源.实验结果显示,本文策略能够有效提高多AI任务的计算效率,计算资源利用率可达到96.97%,调度分配成功率可达到96.45%,数据传输量减小率可达到97.22%.
  • 田贤忠,许婷,朱娟
    2022, 43(6): 1162-1169.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    边缘服务器和通信网络的接入点(例如基站)集成部署构成边缘节点,可以在网络的边缘同时实现通信和计算的功能.边缘计算作为一种介于本地计算与云计算中间的一种新型计算范式,一方面缓解了中心云的负载压力,另一方面因为更靠近用户,有效减少了设备卸载计算产生的传输时延.在边缘计算中,边缘节点的计算资源相比于计算资源丰富的中心云是有限的;另一方面,在不同区域的边缘节点服务于不同的群体,其负载量的差距是是悬殊的,有的过载,有的过于空闲.为解决边缘节点中服务器的负载均衡问题,本文考虑通过软件定义网络(Software Defined Network,SDN)监控网络中的数据流量,调控热点区域的数据以多跳的方式卸载到周边的节点执行计算任务,实现热点区域降热减少执行任务时延的目的.同时,本文提出了基于量子粒子群算法的边缘节点卸载算法和一种基于启发式算法的边缘节点负载均衡算法来求解此问题.最后通过仿真实验验证了我们所提出方案的有效性.
  • 李响,何东钢
    2022, 43(6): 1170-1177.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    采集运动目标图像时,由于目标与采集相机之间产生相对运动造成图像模糊.为了获得清晰运动目标图像,提出了极端先验下的编码曝光运动目标模糊成像复原方法.该方法将传统曝光快门的一次开合过程转变为特殊逻辑编码的多次开合过程,将频域中将窄带滤波扩展为宽带滤波,进而将原始目标高频信息保留在模糊图像中.通过建立极端先验下的正则化编码曝光优化函数,提出了一种有效的编码曝光图像复原迭代和核估计算法.本方法利用编码曝光保存目标原始信息,再利用图像的极端先验自然属性有效复原.在多组合成和实际采集编码曝光运动模糊图像复原中,利用图像质量评价指数表明本方法能够在不同相对运动模式下均获较好的复原效果.
  • 蔡李美,李新福,田学东
    2022, 43(6): 1178-1184.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于深度图像的虚拟视点绘制(Depth Image Based Rendering,DIBR)在双视图像融合后存在重叠、伪影和空洞等问题,为提高融合后图像质量,提出一种利用背景信息的虚拟视点图像后处理方法.首先,在图像融合时引入深度信息解决像素重叠问题.其次,根据视点移动方向定位左、右虚拟视图伪影区域,利用互补视点的背景像素擦除伪影.最后,利用不同视点参考图像信息之间的冗余性将左、右参考视点进行融合并消除前景像素,再进行正向映射得到虚拟视点背景图像填充双视融合后剩余的空洞.与基于图像分割的虚拟视点绘制算法相比PSNR值提高了0.6357dB,实验结果表明,该算法能有效提高绘制图像质量.
  • 唐亮,张孙杰,刘燕
    2022, 43(6): 1185-1190.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块.基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块.LFN模块利用捕捉全局依赖性的非局部操作来提升神经网络的性能并应用于计算机视觉领域.LFN模块是对传统非局部操作的因子分解,通过对水平和垂直两个方向进行分解,网络不仅可以捕捉到像素点之间的长距离依赖关系,而且分解后的非局部操作计算量大幅度下降.然后,通过结合LFN模块和残差模块,我们设计RLFN(Residual Lightweight Factorized Non-local)单元,并基于该单元设计两种改良网络结构分别应用于图像分类和语义分割.最后,本文算法在CIFAR-10和PASCAL VOC2012两个数据集上进行分类及语义分割任务,实验结果表现该算法取得十分优越的性能.
  • 陶交,范馨月,周非
    2022, 43(6): 1191-1196.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在低纹理场景中,基于点特征的同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)算法很难追踪足够多的有效特征点,系统甚至无法正常工作.众所周知,丰富的线段特征存在在人造结构化环境中的地面与墙面交界处.因此,提出一种点线特征融合的双目视觉SLAM算法.在特征提取前,引入梯度密度滤波器加速线特征提取和提高线匹配的准确度,在特征点匹配阶段,采用渐进采样一致性(Progressive Sampling Consensus,PROSAC)算法剔除误匹配点,从而提高定位精度.此外,在特征的融合过程中引入加权思想.在构造误差函数时对点线特征权重进行合理分配.最后,通过在公开的数据集上得到的仿真并与一些优秀的算法进行对比,该算法性能优于PL-SLAM和LSD-SLAM算法,证明了算法的有效性和准确性.
  • 卢印举,李祖照,戴曙光
    2022, 43(6): 1197-1203.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对裂缝图像的光照不均匀、斑马线等复杂背景使得传统的裂缝图像分割算法容易丢失细微及末梢裂缝等问题,本文提出了一种基于泰勒级数和多尺度特征的裂缝图像分割算法.首先,采用瑞利和高斯分布构成的有限混合模型对裂缝背景和目标进行建模,并使用期望最大化算法求解混合模型的参数;然后,通过泰勒级数的展开式描述裂缝的梯度方向,利用尺度变换构造裂缝图像的高阶多尺度特征;最后,将灰度有限混合模型和裂缝高阶多尺度特征融合到马尔科夫随机场模型,通过条件迭代算法优化求解裂缝标号场最大后验概率来实现图像分割.性能测试和不同算法对比分析实验表明,本文算法在保证裂缝几何参数不变的前提下能够抑制非裂缝目标并保留低对比度、细微和末梢裂缝,分割准确率达到85.93%、灵敏度达63.87%,衡量指标优于其他算法.
  • 王宪保,肖本督,姚明海
    2022, 43(6): 1204-1209.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    半监督学习要求无标记数据集远大于标记数据集,然而无标记数据集中包含的复杂无关信息又会对模型训练造成负面影响.针对此问题,本文提出了一种基于增强的均值教师模型的半监督图像分类方法.首先根据类激活映射的工作机制,构建一个具有类激活映射功能的网络;然后将无标记数据集输入结合类激活映射的目标初定位网络,得到目标初定位图;最后将标记图像和目标初定位图像组成训练数据集,训练得到半监督图像分类器.本文设置了标记数据占比、骨干网络、数据集的对比实验,结果表明,本文算法在Top1和Top5上的表现优于现有算法,说明了本文算法的可行性和有效性.
  • 肖飞,沈韬,曾凯
    2022, 43(6): 1210-1216.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着世界性反恐举措的加强,隐匿在人体衣物、箱包中的小尺度危险物体如手枪、管制刀具等的检测越发重要.本文首先将非局部均值滤波方法和边缘增强方法结合,用以增强太赫兹人体安检图像质量.然后基于Faster R-CNN方法,提出了一种Double-RPN方法,该方法解决了主网络(以VGG16为例)在进行特征提取时,深层卷积池化操作引发信息流失从而导致小尺度物体检测准确率下降的问题.最后针对Double-RPN方法提出自适应损失函数,用以增强对困难样本的训练,并在主网络一致的前提下对该自适应损失函数进行消融实验分析.实验结果表明,本文提出的改进方法在手机和刀两类小尺度物体上较未改进之前检测准确率分别提升7.5%、4.7%,平均检测准确率提升4.06%.
  • 韩光洁,史国华,缑林峰,徐甜甜,林川
    2022, 43(6): 1217-1220.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    剩余使用寿命预测对于航空发动机的故障预测和健康管理至关重要.为解决传统长短期记忆网络只利用最后一步学习到的特征进行回归的问题,本文提出了一种基于注意力机制的航空发动机剩余使用寿命预测模型.利用长短期记忆网络处理航空发动机的时序数据,自动提取与时间有关的特征,采用注意力机制为不同传感器特征和不同的时间步进行了加权.此外,本文还考虑到了不同操作条件对发动机剩余使用寿命的影响,将自动提取的特征与操作条件进行了特征融合.实验结果表明,本文提出的模型能有效预测航空发动机的剩余使用寿命,为基于状态的维护提供了可靠的支持.
  • 赵盛烨,吴文江
    2022, 43(6): 1221-1225.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无线网络影响因素较多,总是无法避免地产生定位误差,为取得更好的可靠性与精准度,针对智能化区域无线网络,提出一种移动台动态定位算法.构建基于到达时延差的约束加权最小二乘算法,获取到达时延差信息,根据移动台对应服务基站获取的移动台到达时延差与到达角度数据,利用约束加权最小二乘算法多次更新定位估计,结合小波变换,架构到达时延差/到达角度混合定位算法,依据智能化区域无线网络环境的到达时延差数据采集情况,将估算出的移动台大致位置设定为不同种类定位结果,通过多次估算实现移动台动态定位.选取不同无线网络环境展开移动台动态定位仿真,分别从到达时延测量偏差、区域半径以及移动台与其服务基站间距等角度验证算法定位效果,由实验结果可知,所提算法具有理想的干扰因素抑制能力,且定位精准度较高.
  • 李天昊,霍其润,闫跃,徐远超
    2022, 43(6): 1226-1231.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    关系抽取任务是要在实体识别的基础上确定无结构文本中实体对间的关系类别,即判断实体间的关系.针对目前中文关系抽取精度不足以及静态词向量无法很好地解读文本的问题,本文提出一种融合ERNIE预训练模型和注意力机制的TEXTCNN中文关系抽取模型.ERNIE词向量针对中文的特点以词组为单位做掩盖进行模型训练,实现了对中文文本更好的语义表达,再通过TEXTCNN模型对输入数据进行特征提取,融合注意力机制聚焦于影响最终结果的关键特征,从而实现特征优化提取.本文在百度发布的SKE数据集上进行实验,重点探索ERNIE模型结合注意力机制对中文文本的特征表达效果,结果表明本文模型可以更好地学习中文文本中的特征并用于关系抽取,有效提高关系抽取任务的准确率.
  • 王怡,王黎明,柴玉梅
    2022, 43(6): 1232-1239.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    语音情感识别已经成为下一代人机交互技术的重要组成部分,从语音信号中提取与情感相关的特征是语音情感识别的重要挑战.针对单一特征在情感识别中准确度不高的问题,该文提出了特征级-决策级融合的方法融合声学特征和语义特征进行情感识别.首先提取声学特征,包括:1)低层次手工特征集,包括基于谱相关、音质、能量、基频等相关特征,以及基于低层次特征的高级统计特征;2)DNN提取的谱相关特征的深度特征;3)CNN提取的基于Filter_bank特征的深度特征.并且使用基于Listen-Attend-Spell(LAS)模型的语音识别模块提取语义特征.然后将声学特征中的3类特征与语义特征进行特征级融合,在确定融合特征的先后顺序时引入了构造哈夫曼树的方法.最后得到融合后特征和原始4类特征各自的情感识别结果,在结果之上进行决策级融合,使用此方法在IEMOCAP数据集中分类准确度可达76.2%.
  • 吕海峰,蒲宝明
    2022, 43(6): 1240-1244.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了找到更合适的网络激活函数,来进一步提高深度信念网络算法的非线性逼近能力和性能,本文提出了一种基于径向基函数的深度信念网络算法.该算法将径向基函数引入其中,作为其激活函数,同时利用对比分歧的方式对激活函数的重点变量(中心、宽度、权值)进行了优化和调整.然后,设计了人脸识别预测实验和洛伦兹序列预测实验来对本文算法进行验证,人脸识别预测实验使用了比较权威的户外脸部检测数据库LFW.实验结果表明,本文所提出的算法在性能、预测准确率方面优于传统方法,同时具备可行性.
  • 韩京宇,陆维,武凡,刘阳,葛康,朱曼,陈伟
    2022, 43(6): 1245-1253.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    最近,通过学习型索引取代传统索引以减少索引大小和提高查询效率受到广泛关注.轨迹点在路网和时间维度的连续性难以刻画,数据分布倾斜普遍存在,现存的学习型索引不能有效地支持其查询.提出一种基于路网时窗排序的回归模型树,以支持点和范围查询,含数据排序和模型训练两个阶段:首先,结合希尔伯特曲线和模拟退火寻找保持道路临近性的路段排序,进而采用两层划分获取轨迹点的一维排序,保证时空近邻点排序后彼此靠近;其次,引入回归模型树映射轨迹点和存储位置,提出批量加载和周期更新两种训练模式.真实和模拟数据集上的实验表明,在保证和传统索引可比的查询性能前提下,大幅度降低索引大小,有效地支持以读为主的历史轨迹数据查询.
  • 付淇,刘德喜,邱祥庆,赵凤园,
    2022, 43(6): 1254-1264.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    自杀已成为全球重大的公共卫生和社会关注问题,自动在有自杀意念的社交文本中抽取出该意念产生的原因,可以为自杀预防提供支持.在自杀意念原因抽取任务中,由于人工标注的主观因素造成标注边界模糊或存在误差,同时人工标注成本大也导致训练样本量较小.本文针对这些问题探索和使用数据增强的方法,提出基于标签窗口缩放的标签增强方法LWS,LWS通过设计标签窗口缩放概率、缩放尺度、标签增强率等参数及其应遵循的原则,较好地解决了原训练集中人工标注较短和存在误差的问题,F1值比原训练集上的Char-BiLSTM-CRF模型平均提高了1.6%.实现了基于同义词替换SR、随机插入RI、随机交换RS和随机删除RD的EDA数据增强方法.实验结果表明,在基于EDA的数据增强中,单独和综合运用SR、RD都取得较好的效果,F1值比原训练集上的Char-BiLSTM-CRF模型平均提高了1.1%~1.6%.此外,当数据改变较少时,即增强率或改变率较小时,模型提升效果较明显,而过度增强反而会降低模型的性能.
  • 甘海林,雷震春,杨印根
    2022, 43(6): 1265-1271.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coefficients,LFCC)构建高斯概率特征(Gaussian Probability Features,GPF);结合能够捕捉语音帧的前后依赖关系的双向LSTM和具有强大分类能力的孪生网络,使用孪生双向LSTM(Siamese Bidirectional Long Short-Term Memory,SBi-LSTM)模型进行语音欺骗检测.SBi-LSTM模型进行语音欺骗检测时,首先在真实和欺骗语音数据集上训练得到两个GMM,然后利用GMM计算每条语音的GPF,最后对输入的GPF进行二分类.实验在ASVspoof 2019 数据集上进行,实验结果表明SBi-LSTM模型明显优于GMM,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了47.62%和48.35%,物理访问场景下分别降低了31.03%和39.69%.SBi-LSTM模型和GMM得分融合后性能有进一步提高,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了71.43%和70.62%,物理访问场景下分别降低了34.48%和45.74%.
  • 李彦柯,祁志卫,李剑宇,胡矿
    2022, 43(6): 1272-1277.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在基于贝叶斯网的概率推理应用中,由于缺乏节点间潜在的关联信息,使得与推理任务无关的节点参与计算,导致推理效率不高,高效的贝叶斯网推理有待深入研究.为此,本文引入知识图谱,使用领域知识补充节点间潜在的关联信息,从而支持高效贝叶斯网推理.首先,基于TransE模型将知识图谱中的三元组嵌入到低维向量空间,通过向量的相似度计算得到实体间的关联信息,以此为依据从贝叶斯网中抽取与推理任务相关的子图构建节点关联图;然后,基于实体间的相似度与贝叶斯网节点参数给出图中的权值计算方法;最后,基于节点关联图的嵌入实现近似推理.实验结果表明,本文方法的效率优于吉布斯采样算法与前向采样算法,验证了本方法的高效性.
  • 赵奎,闫玉芳,曹吉龙,高延军
    2022, 43(6): 1278-1284.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    预测宫颈癌的诊疗项目是辅助医生诊疗的重要手段,文中针对宫颈癌患者住院数据的复杂性以及现有时间序列预测技术的不足,提出了创新性的诊疗过程规范化判断的两段式预测模型Bi-GRU-DT,同时对比验证了GRU-2、Bi-GRU、GRU-2-DT、FL-LSTM、Phased LSTM、AMNN的模型性能.具体而言,首先用加权池化的方式对住院数据进行处理,用Skip-gram算法将处理后的数据表示成向量;然后,利用二分K-means算法挖掘规范的诊疗模式,利用基于Bi-GRU的循环神经网络构建诊疗项目预测模型.在预测未来诊疗项目前,首先对诊疗过程进行规范化判断,并将相邻诊疗日的时间间隔融入到输入数据中.实验结果表明,相较于未规范化判断的情况下,模型的召回率和平均准确率分别提高了6.4%和5.3%.
  • 刘颖,周恩辉,张薇,王秀青,吕锋
    2022, 43(6): 1285-1292.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在计算机视觉领域中,卷积神经网络取得了举世瞩目的成就,但其能耗问题一直未能得到很好解决.基于此问题,本文主要研究无监督学习范式下的Spike-CNN分类性能以及计算力.首先,本文设计了一种基于CNN和SNN的混合结构,在层级结构上实现脉冲机制;其次,为减少模型训练时间,本文提出了ReLU-ROC编码方案;最后,为使兴奋性神经元快速做出决策,本文提出了具有决策能力的RP-STDP学习方案:计算每对突触前与突触后兴奋性神经元的相对时间差.实验结果表明:以工业机器人采集到多元时间序列数据解决机械臂不同工作状态的3分类、4分类、5分类问题,在没有引入其他分类器的情况下,本文提出的具有奖罚机制的STDP的Spike-CNN方法平均准确率为LP1(91.07%)、LP2(96.66%)、LP4(93.95%).
  • 黄名选,胡小春
    2022, 43(6): 1293-1302.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出一种深度学习与关联模式挖掘融合的查询扩展模型.该模型采用基于Copulas函数的支持度-置信度评价框架挖掘初检伪相关反馈文档集中扩展词,构建统计扩展词集,利用深度学习工具对初检文档集进行词向量语义学习训练得到词向量扩展词集,将统计扩展词集和词向量扩展词集融合得到最终扩展词.该模型不仅考虑来自统计分析与挖掘的扩展词与原查询间的关联信息,还考虑扩展词在文档中的上下文语义信息,扩展词质量得到较好地改善.在NTCIR-5 CLIR语料的实验结果表明,本文扩展模型能提高信息检索性能,其MAP和P@5平均增幅高于近年现有同类查询扩展方法.本文扩展模型可用于跨语言检索系统,以提高其性能.
  • 陈靖元,周刚,卢记仓
    2022, 43(6): 1303-1308.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布情况将两种算法进行动态融合,充分利用了HowNet和同义词词林中的体系结构信息,改善了现有方法的局限性.经Miller & Charles(MC30)数据集测评,该算法所得到的词语相似度值与人工判定值之间的皮尔森相关系数为0.927,验证了融合多知识库策略的可行性,也证明了本文方法在实用方面可以达到符合人类主观判断的效果.
  • 潘润海,高盛祥,余正涛,刘奕洋,尤丛丛
    2022, 43(6): 1309-1314.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    汉越文本相似度计算是实现汉越文本理解和文本分类的基础.目前使用神经网络来计算文本相似度是一个有效方法,但由于文本较长、冗余信息较多,神经网络难以有效捕获文本间的相似信息,同时汉-越平行语料稀缺导致模型泛化性能一般,此方法受到一定限制.故提出一种融合关键词和语义特征的汉越文本相似度计算方法.针对文本较长冗余信息较多,提出使用文本关键词来获得文本关键信息以压缩文本减少冗余,同时计算出文本间关键词相似信息;针对汉-越平行语料稀缺,提出使用知识蒸馏的方法来训练神经网络来对文本进行编码,得到上下文语义特征;最后将词的相似信息和上下文语义特征融合实现文本相关性判断.实验表明,本文提出的方法能有效提升汉-越文本相似度计算的准确率.
  • 谭瑛,曹修,王浩,李晓波
    2022, 43(6): 1315-1321.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前,基于代理模型辅助的进化算法广泛用于解决昂贵优化问题.其中,由于集成模型策略可以有效的集合多种模型的特点从而提高模型预测的准确度,所以被广泛应用.但是建立多个模型会增加优化过程的计算成本,因此本文提出一种基于历史模型集成辅助的差分进化算法.本文工作分为两部分:首先,提出由一部分历史模型和当前模型构成集成模型,该策略可以有效的降低计算成本.其次,提出一种新的基于决策空间欧式距离的不确定度评价标准,用于选择个体进行真实计算.为了验证本文提出算法的有效性,将本文方法与相关算法在CEC2005测试函数上测试,并且进行比较.实验结果证明本文提出的算法可以更有效的解决昂贵优化问题.
  • 郑琳琳,贾宁欣,张贵军,胡俊
    2022, 43(6): 1322-1328.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分子虚拟筛选方法旨在找到一种可以与受体蛋白质进行相互作用并适当修改其生物学行为的活性分子.大多数分子虚拟筛选方法的先决条件是已知蛋白质的结构或小分子结合物.然而对于大多数蛋白质而言,这些信息都是未知的.因此,本文提出了一种名为Screener的基于蛋白质序列比对和活性分子相似性评估的分子虚拟筛选方法.Screener首先从受体蛋白质的序列出发,生成位置特异性频率矩阵特征、二级结构特征以及溶剂可及性特征,利用I-LBR程序对受体蛋白质的潜在结合位点残基进行预测;其次,根据预测的结合位点残基以及相关特征信息构建模板蛋白质库;然后,将所有与任意模板蛋白质相互作用的活性分子收集起来构成潜在的种子分子库;最后,利用分子2D指纹之间的相似性来对待筛选分子集进行排序,完成分子虚拟筛选.在基准测试集DUD40和DUD-E65上,Screener的平均EF1%分别为16.6和25.7,HR1%分别为44.1和67.6.基准测试结果表明Screener的虚拟筛选平均性能优于基于对接的虚拟筛选方法AutoDock Vina及基于结构比对的虚拟筛选方法FINDSITEfilt和PoLi.
  • 高丽萍,董梦宇,高丽,陈庆奎
    2022, 43(6): 1329-1334.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    如今,外出旅行占据了人们解压方式的很大比重.拥有一个(些)志同道合的旅行玩伴成为了旅行能否舒心的一个重要因素.结合众包思想,用户发布结伴需求(用户可成为众包的任务发布者也可以成为任务的执行者),平台为用户匹配志同道合的玩伴,用户及其玩伴共同执行出去游玩任务,这样,在保证旅行质量的前提下,可以节省用户的金钱,实现资源共享,具有很好的现实意义.因此,本文提出了一个基于用户兴趣的玩伴匹配算法CGA(Car Group Allocation),根据仿真的用户历史访问数据为用户匹配具有相似兴趣的其他用户,且提出了用户根据意愿选择是否提供交通工具,也可以选择是否服从调剂,同时提供车辆的用户可以根据需求决定车辆剩余位置等现实因素.该算法采用真实的POIs(points of interest)点,仿真用户兴趣以及结伴需求,结合现实情况下的约束,运用蚁群算法迭代,为用户匹配相似度最高的群体.实验证明了本模型的有效性.
  • 钱忠胜,涂宇,俞情媛,李端明,孙志旺
    2022, 43(6): 1335-1344.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    作为当今电子商务中的一项重要技术,推荐系统的重要性日益提升.在项目空间上用户的评分数据十分稀疏,导致推荐系统的质量不佳.商品评论中蕴含着丰富的信息,通过提取评论文本信息能够有效地减少数据稀疏性带来的影响.事实上,用户的偏好并非一成不变的,将不同时间段设置不同的权重能更有效地描述用户的整体状况.在神经网络算法广泛应用的背景下,将神经网络引入到跨领域推荐中可以发现不同领域用户偏好的映射关系.此外,注意力机制是一种流行的深度学习方法,将注意力机制与主题模型结合,提出一种基于注意力机制的跨领域推荐方法.首先,使用LDA(Latent Dirichlet Allocation)主题模型分别提取源领域和目标领域的项目主题分布.接着,将其与用户评分、时间权重因子、注意力机制结合,得到用户的动态偏好.然后,使用BP(Back Propagation)神经网络学习用户偏好的映射关系,并将用户在源领域与目标领域的偏好结合.最后,通过协同过滤的方法进行评分预测.实验结果表明,提出的推荐方法在亚马逊电子商品、影视与以及音乐的评分评论数据集上较其它传统推荐策略有着更好的推荐效果.