过刊目录

  • 2020年, 41卷, 第7期
    刊出日期:2020-07-01
      

  • 全选
    |
  • 王伟,黄德根
    2020, 41(7): 1345-1350.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了提高汉语词义消歧的性能,提出了一种基于滑动语义串匹配(Sliding Match of Semantic String,SMOSS)的汉语词义消歧方法.首先,从标注词义的训练语料中提取N元语义模板,建立N元语义模板库;之后,从待消歧句子中提取N元语义码串与N元语义模板库中的语义模板匹配,通过计算匹配成功的多个模板的得分来确定歧义词的最终词义.该方法具有好的弹性匹配能力和宽的匹配范围,能够有效减少数据稀疏问题.实验采用了SemEval2007-Task#5中文词义消歧的评测标准,消歧正确率为75.06%,与目前已知的最好系统性能相近.
  • 肖竹,谢宁,陈佳黎,刘保生,姜峰,杨郭镳
    2020, 41(7): 1351-1356.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深度确定性策略梯度算法(DDPG)是一种用途广泛的深度强化学习方法,但它往往会受到梯度估计不稳定的影响.最近的一些方法(如近端策略优化算法PPO)只是限制在较低速度下进行策略更新以保持稳定性.在本文中,我们在一个优势演员评论家算法(A2C)架构下对问题进行建模.我们首先分析了A2C中简化解析解的运算,其中策略更新的不稳定性主要归因于两个因素:动作估计的方差和累积奖励的方差.为了解决这个问题,我们提出了一种新的基于最佳基线的近端策略优化算法称为Fast-PPO.具体来说,我们混合了最优基线既考虑了动作估计的优势,又考虑了累积奖励的估计.实验结果表明,我们的方法不仅保证动作估计可以在正确的方向上更快地收敛,而且也保证了在较低的方差下了累积奖励的收敛速度.
  • 王运,倪静
    2020, 41(7): 1357-1362.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的概率矩阵分解在推荐算法中取得了一定的效果,但是仍然面临数据稀疏性问题,并且对数据的利用效率不高,不能根据已有数据准确计算用户(物品)之间的关系,评分预测准确性仍然有待提高.本文利用用户对物品的评分序列信息充分挖掘用户(物品)之间的相似度关系,提出了基于用户行为序列的概率矩阵分解推荐算法UBS-PMF(Probability Matrix Factorization Recommendation Algorithm Based on User Behavior Sequence).首先根据用户对物品的评分序列和物品标签信息计算用户对标签的评分序列,即为用户的偏好转移序列,根据该序列可以计算出用户之间的相似度矩阵,同时,用户对物品的评分序列也隐藏着物品之间的关系,利用多个用户对物品的评分序列可以得到物品相似度矩阵,将所得用户(物品)相似度矩阵融入概率矩阵分解模型中进行评分预测,Movielens数据集中的实验表明该算法具有显著的效果,在评分预测准确性方面优于传统的推荐算法.
  • 杨阳,姜春茂,李志聪
    2020, 41(7): 1363-1370.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云资源负载预测是云计算系统体系规划的一个重要组成部分,其预测效果直接影响到云计算系统的经济性和服务质量.为保证基础设施及服务(Iass)模式下资源有效分配和高效调度,实现精准有效地负载预测,本文提出了一种基于三支决策的云资源负载预测模型(DMASVR-3WD).借鉴三支决策的基本思想,根据负载特征变化进行三支划分,来设立云资源需求的三个不同时期,并有针对性的施加策略.对于平缓期和抖动期,采取立即决策的处理方式,直接进行负载预测处理,对于中间波动期,采取延迟决策的处理方式,依据代价最小化的原则,对其进行划分处理.实验结果表明,所提出的算法能够精确实现负载预测,有效保证用户的服务等级协议.
  • 贾辛洪,宋文爱,李伟岩,王青,雷毅,陈志华,常宗平
    2020, 41(7): 1371-1374.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有大量慢阻肺患者跟电子病历,但偏远地区缺乏相关有经验的医生且患者缺乏对疾病的认识.知识图谱利于知识的展示,利于医生学习新的医学知识,也能普及患者对疾病的认识,因此本文提出一种构建慢阻肺知识图谱的方法及其中涉及到医学实体的命名实体识别问题的解决方法.首先对慢性阻塞性肺疾病诊治指南用自顶向下的方式设计Schema(概念)层,对中日友好医院的电子病历中的数据进行知识抽取,其中非结构化数据的知识抽取采用双向长短期记忆网络与条件随机场相结合的方法,通过设计实验,验证了该设计方法的准确性和有效性.
  • 贾瑞玉,宋飞豹,汤深伟
    2020, 41(7): 1375-1380.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着生物技术的不断发展,越来越多的基因表达数据被获取.为了对这些数据进行聚类分析,本文在深入分析传统的聚类算法之后,提出了双精英遗传聚类算法.该算法通过精英策略来保证种群的全局收敛性.针对遗传算法交叉过程中的无效交叉与多样性的丢失,算法还提出了基于差异度的交叉个体选择策略和双种群协同进化.通过实验测试得出,该算法聚类的准确性更高,更接近真实划分.
  • 宋丹丹,翟俊海,李艳,齐家兴
    2020, 41(7): 1381-1388.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对MapReduce和Spark两种框架下的大数据极限学习机进行了比较研究.具体地,从程序运行时间、任务的同步次数、分类器的泛化性能和需要读写的文件数目4个方面进行了比较.得出了如下结论:1)在程序运行时间上,基于Spark的大数据极限学习机明显优于MapReduce的大数据极限学习机,通过理论分析以及对比不同平台的并行指标speedUp和sizeUp证明了这一结论,而且随着隐含层节点个数的增多,这一优势越发明显;2)在任务的同步次数上,基于MapReduce大数据极限学习机的性能优于基于Spark大数据极限学习机;3)在分类器的泛化性能上,基于MapReduce的大数据极限学习机与基于Spark大数据极限学习机并无本质的差别;4)在需要读写的文件数目上,基于MapReduce的大数据极限学习机需要读写的文件数目与Map任务个数有关,而基于Spark的大数据极限学习机需要读写的文件数目与分区数有关.这些结论对从事相关研究的人员,特别是从事大数据机器学习研究的人员具有较高的参考价值.
  • 赵串串,游进国,李晓武
    2020, 41(7): 1389-1394.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    推荐系统旨在解决项目的信息爆炸问题并为用户提供个性化推荐.通常,用户交互的历史项目对于用户交互的下一个项目是有着不同的影响的.为此,本文提出一种序列感知深度网络(SeqaDN).本算法主要分为三部分,即项目嵌入、序列感知和深度神经网络偏好学习.首先,通过Item2vec项目嵌入方法将项目的上下文项目作为输入,得到项目的嵌入;其次,本文在SeqaDN中添加了一个自注意力网络,以感知序列中每个项目关于当前下一个项目的不同影响权重;最后,基于深度双向循环神经网络学习用户的历史偏好.通过在真实数据集MovieLens上设置对比实验验证算法有效性,与传统算法以及同类型算法作对比,实验结果证明了SeqaDN比现有的序列推荐方法取得了更好的推荐性能.
  • 耿宜鹏,鞠时光,蔡文鹏,章恒
    2020, 41(7): 1395-1399.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    概率主题模型与词向量模型的结合已经成为主题分类研究的一大热点,本文基于该思想提出了一种适用于网页主题分类的Skip-PTM模型.Skip-PTM模型吸取了LDA主题模型的优势,扩展了Word2Vec的Skip-gram模型,由原来的使用词向量预测上下文词转变为使用上下文向量来预测上下文词.在网页主题类型变迁的研究中,本文根据一定的时间粒度,将网页文本集离散到时间窗口,然后在独立的时间窗口中使用Skip-PTM建模,从而挖掘主题的变迁.本文利用搜狗实验室语料数据和各门户网站搜集的数据集进行分析实验.实验表明,本文提出的方法可以通过潜在语义对网页主题进行分类,并且可以挖掘出主题变迁的趋势.
  • 夏家莉,曹中华,彭文忠,张守胜
    2020, 41(7): 1400-1405.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    常见词嵌入学习可以理解为是在分解词的点互信息值矩阵,主题一致性评价方法也使用了词的点互信息,二者存在紧密的联系,但是现今还缺少深入分析主题一致性评价标准和词嵌入之间联系,并将词嵌入的主题特性应用于主题建模的研究.先分析了主题一致性和常见词嵌入的联系,Softmax函数生成的主题-词项分布的特性;然后提出主题分布式假设,并引入Skip-Gram结构描述中心词的主题和相邻词之间的关联,从而充分使用词嵌入向量相似、关联特点挖掘文本主题.在3种公开数据集上的实验表明,该模型方法比较现有神经网络结构的主题模型,在主题一致性、主题词的专有性方面都有显著提高;同时模型的主题嵌入向量和主题代表词嵌入向量间具有很强的相似或关联特性.
  • 王根生,潘方正
    2020, 41(7): 1406-1412.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对矩阵分解推荐算法存在的数据稀疏和不能反映用户兴趣变化的问题,提出一种融合用户点评数据、用户-物品评分数据、物品异构信息和遗忘曲线的改进型矩阵分解推荐算法.首先,利用Worde2Vec对用户点评数据中包含的物品内容信息进行挖掘,结合物品属性数据得出物品相似度矩阵;然后,构建用户-物品-属性的加权异构信息网络,在权重计算时引入激活函数和遗忘曲线,通过元路径计算用户相似度矩阵;最后,把物品相似度矩阵和用户相似度矩阵融合到矩阵分解算法的目标函数中.实验结果表明,该改进算法相比于传统矩阵分解推荐算法和部分其他改进算法具有更高的准确率、召回率、覆盖率和更低的均方根误差.
  • 刘艳丽,付晓东,岳昆,刘骊,冯勇,刘利军
    2020, 41(7): 1413-1420.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    用户对服务的评分可被视为用户对服务的分类,而服务信誉则是在用户对服务分类基础上进行聚类的结果.在聚类过程中不考虑在线服务信誉度量结果与所有用户分类之间的一致性关系,将导致通过聚合分类得到的信誉度量结果缺乏合理性.为此,提出一种基于一致性聚类的在线服务信誉度量方法.首先,根据用户-服务评分矩阵获取用户对服务的分类信息;其次,考虑到在线服务分类信息之间可能存在相似性,建立基于簇间和簇内相似性的最小成本生成树;然后,从具有最小相似度值的边开始对最小成本生成树进行切割,产生多种可能的聚类;最后,采用一致性质量函数和多数投票从多种可能的聚类中寻找整体质量高且非重叠的最终聚类,并以最终聚类为基础计算服务信誉.该方法充分考虑了用户对服务的分类与最终获得的信誉之间的一致性关系.通过实验验证了该方法的合理性和有效性.实验结果表明方法在不需要输入任何参数的情况下,自动计算出高质量信誉度量结果,同时还提高了信誉度量方法的抗操纵性,从而使用户能够根据该信誉结果做出正确的服务选择决策.
  • 杨朝强,邵党国,杨志豪,相艳,马磊
    2020, 41(7): 1421-1426.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,MFFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long Short-Term Memory)、CNN(Convolutional Neural Networks)和CAPSNET(Capsule Network)模型对短文本进行不同层面的特征提取,并使用Self-attention模型动态调节各模型特征在最终特征构建中的权重系数.在实验部分,本文用MFFM方法与四个短文本分类经典模型(CNN、BILSTM、CAPSNET和CNN-BILSTM)在三个中文短文本数据集上进行验证,为了进一步验证数据融合(将三个中文短文本数据正负样本融合)对MFFM的影响,实验结果表明MFFM模型性能在四个评价指标(F1、Recall、Precision、Accuracy)下优于对比模型.总之,这可表明MFFM是短文本分类模型的一个有用框架.
  • 吴辰文,魏立鑫,刘晓光
    2020, 41(7): 1427-1432.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对密度峰值聚类算法(Density Peak Clustering,DPC)在密度分布不均匀及同一个簇有多个高密度点的数据集中难以准确选取聚类中心的情况,提出一种改进节点凝聚度的密度峰值聚类算法.先将数据转化为一个加权的完全图.其次,引入改进后的节点凝聚度的思想构建节点重要度的评价函数,并计算网络中每个节点的局部重要度,聚类中心为局部重要度最高的节点并且与重要度大于该聚类中心重要度的点具有较大距离.然后,对节点重要度进行排序,比较选取节点重要度与距离乘积值异常大的点作为类簇中心.最后,利用所提出的算法和其他密度峰值聚类算法比较,在人工数据集和真实数据集上的实验仿真表明,该算法能够找到具有更高精度的聚类中心,从而可以实现更高的性能.
  • 马艺梅,王立东,陈雪波,吴文良
    2020, 41(7): 1433-1437.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了提高OFDM信道估计的性能,提出了小波与孪生支持向量机相结合的基于导频的信道估计算法.由于TSVR算法对不同位置的训练样本赋予同样的权重,导致了性能降低.本文利用小波变换对训练数据进行预处理得到权值矩阵和权值向量,以此建立孪生支持向量机回归预测模型WTWTSVR,利用WTWTSVR算法来预测无导频处的子载波的信道频率响应.以误码率和均方误差为评价标准的仿真结果表明,在Jakes快衰落信道模型条件下,改进后的孪生支持向量机导频信道估计方法与传统的孪生支持向量机回归方法和传统的信道插值方法比较,具有更好的预测性能.
  • 赵玉强,钱谦,周田江,伏云发
    2020, 41(7): 1438-1445.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    天牛须搜索算法(BAS)具有搜索快和执行简单的特点,但在多峰复杂函数优化中易陷入局部极值.遗传算法(GA)的全局搜索能力强,但收敛速度缓慢,收敛精度不高.针对二者的优缺点,本文提出天牛须搜索与遗传进化混合的优化算法.首先,在BAS算法中设计多方向探索反馈策略来增加算法的搜索能力,并将其嵌入到GA算法中,加快GA的全局收敛速度,然后在GA算法中采用扩展的多子代竞争交叉和自适应调整参数的方式来维持种群的多样性,避免了局部极值问题,进一步提高了算法的寻优性能.对测试函数的优化结果分析表明,与其它几种混合算法相比,该混合算法具有更高的收敛精度和优化性能,并且在复杂函数中有更好的普适性.
  • 张送柱,王兴伟,黄敏
    2020, 41(7): 1446-1450.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    信息中心网络(Information-Centric Networking,ICN)的缓存替换策略具有重要的研究价值,几种常见且具有代表性的缓存替换策略可归结为最近最少使用、基于自适应模糊推理以及基于内容流行度预测.然而ICN要想完全实际应用且兼容当前的IP网络,必然要重点解决盛行的互联网视频流业务,这就导致前两种缓存替换策略效果不佳.为此,立足于热点内容缓存,着重研究基于内容流行度的缓存替换策略.针对内容流行度,提出一种新型的评估算法,包括启发于酒精挥发模型的流行度衰减建模、启发于吸热模型的流行度上升建模和流行度周期建模.在真实YouTube数据集的驱动下进行仿真实验,结果表明提出的算法在缓存命中率、路由时延以及网络能效等三个方面优于对比算法.
  • 王树航,徐君,杨锴,邓庆绪
    2020, 41(7): 1451-1457.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目前云端计算处理数据能力不足、效率不高等问题,在嵌入式开发迅猛发展的背景下,将新兴的边缘计算模式与新零售的思想结合起来,运用于智能自助咖啡机系统,重新构建和设计了咖啡机系统的嵌入式系统终端、服务器和用户界面等.该系统将咖啡机作为一个智能终端接入互联网,采用EdgeX-Foundry边缘计算框架,并将其部署在边缘网关;硬件采用stm32并利用边缘计算感知融合决策咖啡机状态;通过SpringBoot开源框架搭建完整的服务器;在用户APP方面,开发并使用了微信小程序作为客户端;在系统测试中,实验结果证明了边缘计算应用于智能咖啡机系统的优势.
  • 薛拯,刘洋,韩国军,闫晶莹
    2020, 41(7): 1458-1463.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在车联网中,由于车辆快速移动以及网络拓扑动态变化,短时间内车辆之间形成的分簇结构不稳定,导致簇内流媒体数据广播业务面临困难.本文针对这一问题,提出一种基于复杂网络理论的车联网综合通信优化方案.该方案提出基于车辆广义距离的分簇算法及基于模糊逻辑理论的簇头选择算法,在此基础上建立了簇内数据传输优化模型.本文定义的车辆广义距离综合考虑了车辆相对位置及通信链路质量.本文提出的簇头选择算法综合考虑了车辆的速度、领导力、距离,并基于模糊输出选择出最适合的簇头节点.仿真结果表明,本文提出的解决方案与现有工作相比,提高了簇内网络吞吐量并降低了数据传输时延.
  • 徐江,孟相如,韩晓阳,史朝卫
    2020, 41(7): 1464-1469.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对当前节点多指标排序的虚拟网络映射算法中,指标权重选取较为片面的问题,本文提出一种博弈论组合赋权的虚拟网络映射算法.首先提取网络节点特征指标,组成节点特征指标向量并构建决策矩阵,然后利用博弈论组合赋权模型对熵值法和层次分析法获取的节点指标权重向量进行均衡处理,得到最优权重向量,最后将最优权重向量与特征指标向量的内积作为节点排序的依据.该方法通过将主观赋权法与客观赋权法结合,实现了对节点指标权重向量的优化.仿真结果表明,算法能够适应环境变化得到更为合理的权重向量,提高了虚拟网络映射成功率和收益开销比.
  • 王红艳,韦永壮,刘文芬
    2020, 41(7): 1470-1475.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    ANU,ANU-II和LiCi算法是近几年相继被提出的新轻量级分组密码算法.由于采用比特级的设计理念,相比于传统字节级更具有结构轻巧、扩散灵活和实现效率高等优点,因而其安全性备受关注.基于以上三个算法的结构特性,构建了新的比特可分性MILP模型,并给出了ANU,ANU-II和LiCi算法的积分区分器自动化搜索方法.通常而言,区分器轮数的高低能够较好的衡量密码算法的安全性.研究结果表明:ANU,ANU-II和LiCi算法分别存在9轮、8轮和12轮的积分区分器,所需的数据复杂度为263,260和261个选择明文,这是目前已知分析方法中轮数最高和选择明文量最优的区分器结果.另外,提出了一种新的LiCi算法的等价结构.
  • 陈朔,胡军,王立松
    2020, 41(7): 1476-1487.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    AltaRica 3.0是一类面向复杂关键系统的安全性建模与分析语言,由于AltaRica 3.0的结构模型S2ML(System Structure Modeling Language)是描述真实系统的层次结构信息,无法进行模型的安全性分析,而AltaRica 3.0的语义模型GTS(Guarded Transition Systems)可以用来进行安全性分析,因此,将AltaRica 3.0的S2ML转换为语义等价GTS语义模型是最新的AltaRica 3.0中的一个关键技术.为此,本文提出了一种基于ANTLR(Another Tool for Language Recognition)的AltaRica 3.0模型平展化算法.首先,根据Block和Class对AltaRica 3.0模型进行分割分别获取对应的AST(Abstract Syntax Tree);然后设计相关的转换算法,在遍历AST时,对结点存储的AltaRica 3.0模型语言信息进行获取和转换,通过不断的递归过程获取到平展化后的文件.实验表明,设计的算法可以很好地完成AltaRica 3.0模型的平展化过程.
  • 崔丽珍,曹坚,安竹林,李丹阳,王巧利
    2020, 41(7): 1488-1493.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对大规模的无线传感器网络中,低成本传感器节点的计算能力较低,时间同步过程中存在随着跳距的增加出现同步误差积累的现象,本文基于萤火虫同步技术提出了一种具有抑制耦合的线性脉冲耦合振荡器同步模型.使用线性动态函数描述振荡器的状态变化,降低运算复杂度,引入负耦合因子建立新型的脉冲耦合方式,有效缩短同步过程,对两个及多振荡器系统分析同步过程得出同步条件,构建完整的有限状态自动机证明模型同步性.通过实验仿真,分析耦合参数对同步速度的影响,系统的稳定性以及网络同步周期,结果表明该模型有效提升了系统同步速度,取得较好的同步效果.
  • 韩艳茹,尹梦晓,杨锋,钟诚,
    2020, 41(7): 1494-1500.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    超像素分割将图像划分为一组包含图像结构特征的、有意义的子区域,这极大地减少了图像基元的数量,从而有效提高图像处理的计算效率.时间一致性超像素是一组应用于视频处理的超像素,这些超像素在时间上跟踪视频中同一对象在不同帧的相同部分.本文首先介绍视频分析处理中视频超像素的发展现状,根据处理时视频的加载方式进行分类梳理和总结,然后介绍评测视频超像素常用的基准指标及其在视频处理领域的应用,最后分析总结时间一致性超像素的局限性,并对未来可能的研究改进给出几点建议.
  • 张锋,叶茂,曾凡玉
    2020, 41(7): 1501-1507.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着深度学习的发展,相关的模型与方法被应用到单人姿态估计研究领域中并取得了较大提升,一举超越了传统基于手工设计特征的单人姿态估计方法.基于深度学习方法的单人姿态估计从各个方面取得了突破.本文总结了基于深度学习方法的单人姿态估计这一领域一系列研究成果,将这些方法分为三类:基于坐标回归的方法、基于热力图回归的方法以及使用热力图表示的基于坐标回归的方法.着重介绍了基于热力图回归这一主流的方法,分析并对比了各类方法的优势与不足.给出了单人姿态估计常用数据集的对比,并对基于深度学习方法的单人姿态估计研究进行展望,指出了未来研究的趋势与热点.
  • 孙伟忠,马跃,尹震宇,谷艾,徐福龙,
    2020, 41(7): 1508-1512.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    纸币的污损程度在某种程度上决定了纸币是否能够继续流通.如何精准的识别纸币的脏污,是当前金融机具面临的一项重大问题.为了解决这个问题,本文使用接触式图像传感器采集纸币在红光、绿光、蓝光、红外光下的双面反射图像,同时也采集纸币在绿光透射和红外光透射下的图像.通过使用图像处理的方法把纸币图像提取出来,然后分析不同脏污等级的纸币在各种光源照射下所形成的图像,最终决定把哪种光源的纸币图像输入到卷积神经网络.之后,将已经分类好的训练样本和测试样本通过上述方式处理,会得到纸币图像的训练样本和测试样本.使用训练样本对本文设计的卷积神经网络进行训练,就会得到本文所需要的纸币脏污识别分类器.然后使用测试样本在这个分类器上进行测试,会得到训练的分类器的识别效果.测试结果表明本文所设计的卷积神经网络分类器对于识别纸币脏污的准确性非常高.
  • 任敏敏
    2020, 41(7): 1513-1518.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的图像融合去雾算法通过统计大量图像特征来设置融合权重,不仅耗时费力,还易出现误差.为此,本文提出了图像融合的循环神经网络来解决该问题.首先,从初始雾图中推导其衍生的白平衡图像、对比度增强图像、伽马校正图像,作为去雾所需的融合图像;随后,构建编码解码网络的去雾模型,并将三张融合图像与初始雾图相串联,共同作为网络的输入.利用此网络学习和生成融合图像对应的权重图,以融合信息估计无雾图像,从而解决传统图像融合去雾算法中权重计算耗时费力,易产生误差的问题;最后,为了进一步优化去雾结果,在编码解码的网络模型中嵌入循环单元,构建循环编码解码网络,即将上次循环时网络输出作为下次循环时网络输入,同时使循环单元中的隐藏状态也随之传递,以便更好优化去雾结果.实验结果表明,在合成和真实图像的测试下,本文算法都具有较高去雾精度,与已有算法相比,其去雾精度提高了19%,能有效用于工程实践中.
  • 胡德敏,胡钰媛,褚成伟,胡晨
    2020, 41(7): 1519-1523.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的基于补丁的图像修复方法在修复过程中无法复制真实的图像纹理,即故障像素区域,通常需要手动标记故障区域.我们提出了一个迭代检测故障区域的图像修复模型.使标记故障区域过程自动化、精确化,模型将从修复过程中的多个特征图中图区的补丁作为CNN的输入,经CNN卷积和池化后输入Softmax分类器识别区域像素有效性,对标记为无效的故障区域采用Patch Match算法进行修复,引入启发式阈值对修复图像多次迭代直至收敛.实验结果表明,本文方法与传统的人工标记法相比节约了人工时间,与非迭代应用方法相比,降低了故障像素与原始缺失区域比值,证实了方法的有效性.
  • 杨晶东,朱锦图,孙新博,杨文皓
    2020, 41(7): 1524-1529.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    内容针对传统指数滑动平均(EMA)算法在AlexNet卷积神经网络的训练后期无法持续优化网络参数,而导致网络过拟合问题.提出一种基于Tanh动态衰减指数滑动平均算法(T-ADEMA),采用变系数Tanh函数作为衰减率函数,根据训练次数动态调整优化参数,减小数据集中噪声对网络学习影响,提高模型泛化性能.实验结果表明,基于T-ADEMA算法的AlexNet网络在MNIST,CIFAR_10,CIFAR_100三个数据集上与传统EMA算法相比具有更好的泛化性能和分类正确率.
  • 陈宁,张书玮,王凤英
    2020, 41(7): 1530-1540.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了对多参非解析对称复映射进行动力系统图形化研究,本文研究了含有5个实参非解析4旋转对称复映射f(z)=[λ+αzz+βRe(z4)+ωi]z+γz3的广义M集的构造以及其非线性迭代函数系的构造等问题.固定5参数空间中的3个参数α,β与γ的取值,构造参数λ与ω组成的参数断面C;用无约束最优化求解方法中的“步长加速法”,求解使参数断面C的参数c=(λ,ω)下的迭代映射fc(z)的Jacobin矩阵为0的局部极值点;计算每个局部极值点的Lyapunov(L)指数,考察局部极值点的轨道特性,将参数断面C划分成逃逸、混沌、吸引和混合参数区域,构造出参数断面C上的广义M集.实现了采用不同参数区域的参数构造动力平面上的混沌吸引子和充满Julia集;在吸引参数区域,根据参数点c下1个迭代映射具有多条吸引周期轨道特性,提出构造非线性迭代函数系方法,生成相应分形.结果表明:采用本文提出的构造广义M集的方法,可以有效进行多参非解析对称映射的动力系统图形化研究,可以大量构造迭代映射族在动力平面上的混沌吸引子、充满Julia集和NIFS的分形.
  • 李远沐,王展青
    2020, 41(7): 1541-1546.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在机器学习领域,从少量样本中高效的学习仍然是一个巨大的挑战.本文借鉴度量学习的思想,基于深度高斯过程模型这一非参数模型,提出了用于小批量手写字符识别的深度高斯匹配网络.该框架可以自适应的学习到一种将以标注支撑集和未标注的样本映射能够有效到其标签的深度结构,同时避免因训练数据不足而出现的过拟合现象.在深度高斯过程模型的训练阶段,运用标准化流方法构造灵活的变分分布,改善了推断的质量.并且在稀疏化高斯模型以降低计算量时,使用最优k均值方法寻找伪点.在Omniglot和MiniImage数据集上的实验结果表明,相比于传统的CNN,本文算法在单学习样本中的准确率均有所提高,并且本文模型不依赖于微调,同时计算量也得到了控制.
  • 刘先锋,石静,陈明,杨予丹
    2020, 41(7): 1547-1552.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    半监督学习利用少量的辅助信息以提升学习器的性能.基于图的学习方法是较为典型的半监督学习实现途径,利用图来表达和分析数据,能够处理复杂的数据分布.不同于这类方法通常所利用的无符号图,符号网络具有更强的表达能力,其负边能够表达额外的信息.本文基于符号网络的规范化割(Signed Normalized Cut,SNCut),提出了可处理成对约束的半监督聚类,通过实验验证了负边给半监督学习带来的附加价值.将SNCut应用于图像分割问题,获得的分割效果明显优于规范化割.为了进一步强化边界对齐性,引入马尔科夫随机场(Markov Random Field,MRF)正则化项,构建SNCut&MRF目标函数,并提出基于界优化和图割的求解算法.结果表明,SNCut&MRF相比一些典型分割方法有更好的分割性能,在边界处表现良好.
  • 李慧,李贵洋,周悦,江小玉,韩鸿宇
    2020, 41(7): 1553-1558.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为扩展纠删码在区块链中的应用,研究了去中心化存储系统中的修复机制,发现系统中RS码存在多节点修复成本高、效率低的问题.针对这个问题,本文提出一种更契合去中心化网络环境下的多节点修复传输模型DSMR,充分利用RS码在修复多节点时的数据冗余性和计算冗余性.通过节点稳定性和网络跳数来选择节点、构造数据传输并行结构、分组修复计算和节点数据交互四个步骤,以最大化数据传输效率、较低带宽开销和较短修复时间完成了去中心下分布式低带宽多节点修复工作.理论及实验结果表明,在任意(n,k)参数下,分布式多节点修复传输机制在保持较低存储空间地同时进一步降低修复带宽、减少修复时间.
  • 胡金平,李贵洋,江小玉,周悦,韩鸿宇
    2020, 41(7): 1559-1568.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了高效可靠的存储海量数据,分布式存储系统常利用纠删码来降低存储开销.Hitchhiker码是Piggybacking架构下易于工程实现的双条带MDS(Maximum Distance Separable Code)码,具有参数(k,r)取值任意、修复成本较低等特征.然而,目前Hitchhiker码只优化了数据单元的修复带宽,未优化校验单元的修复带宽.针对此问题,本文提出了利用LRC(Locally Repairable Code)的思想同时优化数据单元和校验单元的编码(Hitchhiker-LRC和Hitchhiker-LRC+).该方法是对第一个子条带中l个校验求局部校验,将其存放在第一个子条带的某个校验上,要求该校验的数据已通过局部校验的形式捎带在了第二个子条带的后r-1个校验中,并且对该校验单元做了横向减法.最后,理论和实验证明,Hitchhiker-LRC和Hitchhiker-LRC+这两种编码在2≤r