过刊目录

  • 2019年, 40卷, 第3期
    刊出日期:2019-03-01
      

  • 全选
    |
  • 邹磊,朱晶,聂晓辉,苏亚,裴丹,孙宇
    2019, 40(3): 465-471.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数据热点发现的目标是找出数据集中的区域,并以易于人理解的方式将其展示出来.本文针对同时包含数值型特征和类别型特征的多维数据设计了数据热点发现算法,该算法的核心是改进CLTree设计的聚类算法CLTree+.本文改进了CLTree,使其能够直接对同时包含数值型特征和类别型特征的数据进行聚类,并提升了具有周期性性质的数值型特征的聚类效果.除此之外,相比CLTree,CLTree+还大幅度提升了计算效率,使其可以用于处理大规模数据.CLTree+被应用于某大型互联网公司的业务数据,成功找出了若干个数据热点,并以易于理解的特征取值组合的方式将这些信息展示出来.
  • 孙红,陈锁
    2019, 40(3): 472-476.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着“互联网+”的高速发展,大数据的不断产生,人们对时空轨迹的数据分析也越来越多.本文针对海量的用户轨迹数据进行研究,提出一种基于分区域的隐马尔可夫模型用以解决时空轨迹序列的预测问题.该模型首先通过聚类将一片区域内的时空序列分成多个小区域,每个小区域内再通过聚类确定多个隐状态和发射序列,然后针对每个小区域进行隐马尔可夫模型的训练得出最终模型.预测时通过已知的时空序列,找到对应的区域模型,通过维特比算法计算出最佳隐状态序列,再结合转移矩阵做出下一个轨迹点的预测.实验表明,该模型具有较高的学习速度,且预测精度较高.
  • 林鑫涛,何振峰
    2019, 40(3): 477-481.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    子空间聚类是解决高维数据聚类问题的有效方法之一,其面临的主要挑战是如何高效率地搜索一系列子空间.算法Chameleoclust利用可演化的染色体结构来搜索子空间聚类,取得了较好的聚类效果.但由于其以自然选择作为进化的主要驱动力,无法对进化过程中最主要的突变“中性突变”进行评价,因此缺乏足够的启发信息来引导搜索,导致搜索效率不高,且极易陷入局部最优等问题.本文提出一种中性游走驱动的Chameleoclust算法(Chameleoclust NW),该算法主要特点是以中性理论的思想为基础,将中性突变视为进化的主角,以进化潜力为启发信息对染色体进一步评价,并利用中性游走对算法搜索过程进行引导.实验结果表明,与Chameleoclust相比,Chameleoclust NW具有更高的搜索效率和准确率.
  • 霍欢,邹依婷,周澄睿,薛瑶环,黄君扬,金轩城
    2019, 40(3): 482-487.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    机器阅读理解是针对问题、文章、答案这个元组的建模问题,目的是根据问题中的关键词和关键词间的关系,给出问题答案.本文研究填空型阅读理解中候选答案与问题句式结构的对齐问题,提出一种基于注意力机制的序列学习模型,句式注意力网络SAN.首先,SAN的词嵌入层后添加一个前向GRU网络实现问题对文章句子的全局筛选,缩小候选文章内容范围.之后参照问题与文章句子的内容与结构确定答案,使用句式注意力结构对文章与问题进行实体对齐,再依据实体间的相似性获取问题答案.实验通过人工数据集Children′s BookTest进行验证,结果表明SAN模型回答问题的准确程度和速度都比AOA模型好.
  • 李炜,宋威,王晨妮,张雨轩
    2019, 40(3): 488-492.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    栈式自编码器通过逐层无监督学习能够表达数据的语义特征,但面对具体领域问题时其特征训练缺乏针对性,所处理的数据用于分类领域时易导致分类准确度低,稳定性差等问题.针对这些问题,提出了一种标签约束的半监督栈式自编码器(LSSAE),结合无监督学习与监督学习的优势,在有效抽取样本内在特征的同时保证特征训练目标化.引入的标签约束项,以监督学习的方式逐层比对实际标签与期望标签,针对性地调整网络参数,进一步提高分类准确率.为验证所提方法的有效性,实验中对多个数据集进行广泛测试,其结果表明,相对自编码器(AE),稀疏自编码器(SAE),以及深度信念网络(DBN)等,LSSAE明显提高分类准确率和稳定性.
  • 叶俊民,赵丽娴,罗达雄,王志锋,陈曙
    2019, 40(3): 493-498.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在在线学习环境中,依据学习者的行为为其推荐合适的问题回答者,可有效提高其学习效果.目前许多的问题回答者推荐研究考虑到了问答数据,但没有考虑行为因素对推荐问题回答者的影响.本文结合问答数据与学生行为数据,提出了一种论坛问题回答者的推荐方法.该方法的基本思路是:获取学习者求助行为类别;根据学习者求助行为类别为其推荐论坛问题回答者.为此,采用聚类算法处理学习者的求助行为数据并得到该学习者求助行为类别标签;采用此学习者求助行为数据和求助行为类别标签作为训练数据,训练朴素贝叶斯模型,从而自动识别新的学习者求助行为的类别;在此基础上,提出使用卷积神经网络方法构建论坛回答者推荐模型.通过对采集到的在线学习求助行为数据进行实验,说明了该方法能为学习者有效推荐合适的论坛回答者.
  • 王勇,何养明,邹辉,黎春,陈荟西
    2019, 40(3): 499-502.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本特征提取(文本输入表示)作为文本分类技术的要点,其构建质量直接影响着分类系统的分类效果.现在最流行的文本输入表示——词向量(Word Vector)虽然考虑了词的相似性但忽略了局部词序特征,在一些情况下造成文本语义上的缺失和歪曲.为此,本文提出了一种结合N-Gram特征与Word2vec的词向量模型WordNG-Vec,其提取出的词向量(Word-NG向量),作为双通道卷积神经网络模型(DC-CNN)的输入.经过多组对比实验分析表明,在精确率(precision)和召回率(recall)和F1值三个评价指标下,本文提出的方法有效提高文本分类的效果.
  • 李永帅,王黎明,柴玉梅,刘箴
    2019, 40(3): 503-509.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本情感分析最基础且最关键的一个环节就是构建一个高质量情感词典.为克服传统的情感词典中词汇所表达出的情感倾向不变性等问题的不足,本文基于三层神经网络结构构建动态情感词典.第一层通过改进的CBOW神经网络提取含有情感信息的特征;第二层通过双向LSTM神经网络,利用二叉语义依存结构模型提取出二叉语义依存路径特征;第三层在前两层获得的情感特征和语义特征基础上,将中心词信息和词汇到中心词的距离两个特征一起组成当前词的特征,然后,对双向LSTM神经网络进行情感词分类训练,从而得到动态情感词典.使用动态情感词典进行初级扩展也可以得到更大的静态情感词典.实验结果表明使用该动态情感词典进行微博情感分析可以有效地提高分类精度.
  • 曹中华,夏家莉,李光泉,张志斌
    2019, 40(3): 510-514.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    模型规则化可以通过给模型加入先验知识,而避免模型过拟合,并且能够使模型参数稀疏,选择出最有代表性的模型参数.具有稀疏性的主题特征能够更有效的表示文本语义信息,通过WordNet和Word2Vec可以得到相似词集,将相似词集的编码向量归属为相同组,构造相似词组语义约束,并将其表示为层状结构化先验信息,论文因此而实现了两种层状稀疏规则化方法,应用于主题编码模型.实验表明采用层状规则化的稀疏编码模型可以提高主题模型编码效果,学习到主题一致性、分类结果更好的文本主题信息.
  • 陈芳,梁家荣,张乾
    2019, 40(3): 515-519.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出一种新的诊断策略蚁群系统(Ant Colony System,简称ACS)在比较模型下的快速精确诊断算法,即在系统中通过模拟蚁群获取食物的过程,并对其最短路径进行分析,结合ACS环诊断策略,得到关于序列的重要性质,基于这些性质,从而提出一种快速精确诊断算法,此算法的时间复杂度为O(N),其中N为蚁群中蚂蚁的数量.
  • 徐琳宏,林鸿飞,杨亮,徐博
    2019, 40(3): 520-526.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    汉语中的成语语言精练,典故源远流长,其趣味性是成语研究的一个重要方面.本文依据语音模板生成候选成语集合,从中提取语音、幽默、语义、情感和形态五大类11个特征,将这些特征融入到排序学习的相关算法中,从候选成语集合中检索趣味成语,进而构建趣味成语的生成模型.该模型将成语生成问题映射到信息检索领域,以查询及相关反馈的技术解决生成问题.经机器和人工的双重评估,实验结果表明五个维度的特征能够细致刻画趣味成语,生成质量较高,模型具有一定的实用价值.
  • 沈泽君,杨文元,
    2019, 40(3): 527-532.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    BP(Back Propagation)神经网络在金融趋势预测上得到了广泛的应用,其通过反向传播误差来调整模型的权重与偏值,能够较强的适应金融的走向趋势.但是由于金融趋势的周期性变化多端,不同周期下对预测值的影响不一,传统的BP神经网络在金融趋势预测上存在一定的局限性.本文充分考虑金融趋势周期粒度这一特性,提出了基于粒计算思维的BP神经网络(Back Propagation on Granular Computing,BPGC).BPGC算法首先对数据集进行不同粒度划分、构造粒度矩阵,然后根据粒度矩阵进行BP训练得出各粒度下的权值,最后对各粒度的预测结果进行加权平均,得出预测结果.在浦发银行股票收盘价数据集上进行实验,与传统的BP神经网络进行比对,实验结果验证了BPGC算法的有效性. 
  • 李志,赵大哲
    2019, 40(3): 533-537.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对智能终端室内定位问题,提出了一种综合信号传播模型和卷积神经元网络的指纹匹配定位算法.该方法首先根据室内信号传播模型为每个定位参考点构建接收信号强度(RSS,received signal strength)指纹数据集;其次,将该指纹数据集变换为灰度图像指纹样本;最后,基于图像样本使用卷积神经元网络训练出分类定位模型.使用智能手机在内廊式室内环境中对本算法的有效性进行测试.实验结果表明,本方法大幅的降低了指纹采集和维护的工作量,在信号传输受到一定干扰时仍能较稳定的保持2米左右的定位精度,优于基于最近邻指纹匹配和信号强度测距定位算法. 
  • 胡德敏,廖正佳
    2019, 40(3): 538-544.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来位置感知设备和云计算服务引发了基于位置应用的广泛发展,由此引发了对位置隐私问题的高度关注.差分隐私的位置保护方法应用在连续查询环境时,噪声叠加会导致查询精度下降.针对这个问题本文在Hilbert曲线构建的k-匿名集基础上,提出了基于m叉平均树的差分隐私保护方法,该方法保证隐私保护强度的同时降低连续查询的数据噪声.利用m叉平均树结构拆分匿名集数据以增强数据效用,并通过严密推导得出具有较小误差上界的拉普拉斯隐私预算分配策略.通过实验验证,该方法在较大的范围内有较小的误差,算法运行效率高于同类提高查询精度的差分隐私算法.
  • 樊伟,徐华,李京
    2019, 40(3): 545-551.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在下一代网络协议IPv6中,任意播作为一种新型的一对多的通讯模式,能够实现单个发送者与一组接收者中任意一个主机间的数据通讯,因此在负载均衡方面有重要的应用.而路由选择策略是任意播实现负载均衡的关键,但在传统网络模式下,任意播选择策略存在不够灵活,简单策略无法选择最佳服务器,复杂策略又会增加路由设备负载的缺点.因此本论文利用软件定义网络技术,实现了一套任意播负载均衡路由框架,利用软件定义网络的可编程性和集中化管理,能够有效提升任意播的效率和灵活性.与此同时,论文设计了一种软件定义网络下的基于权值的任意播负载均衡路由选择算法,并引入负反馈机制实现了权重的动态自调节,以增强负载均衡策略对不同应用场景的适应能力.最后论文对提出的负载均衡路由策略进行了性能评估实验,实验将论文提出的算法与轮询算法和基于响应时间的算法进行了性能比较,论文提出的算法的响应时间相比另外两种算法分别缩短了18.1%和17%,证明了本论文提出的软件定义网络下的负载均衡框架和任意播路由选择策略有较好的负载均衡性能.
  • 高丽萍,刘珊珊
    2019, 40(3): 552-559.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    工件设计过程是一个有创意的过程,设计者必须反复地应用undo/redo的操作来修改CAD模型来探索新的用户设计意图.在交互CAD系统中,undo/redo已经成为最重要的功能之一.在协作设计的CAD系统中,undo/redo操作也非常有助于团队协作意识的提高,设计出质量更高满足用户意愿的工品,然而,在一个协作的CAD系统中,设计者需要反复应用Undo/Redo操作来更改CAD模型来探索新的满足用户要求的新模型,undo/redo已经不能满足用户的需求,单步撤销效率很低,操作间依赖关系又很复杂.本文提出了一种在分布式协作CAD系统中的selective undo/redo方法.我们使用站点ID和状态向量来定位每个站点上要undo/redo目标操作.通过将复杂的CAD模型分解成几个独立的子结构模型,构成每个子结构模型的所有操作都有固定的依赖关系,子结构模型之间也有联系,于是提出了一种称为操作组合DOAG的图状数据结构,描述了构成整个CAD模型操作间的依赖关系.基于DOAG,我们很快找到要撤销的目标对象的依赖集及它所构成的子结构,再对该结构进行分解重构边界模型,实现用户意图和在协作系统下的一致性维护的正确性.关于提出的基于DOAG方法已在后面进行了正确性的验证和运用.
  • 王方苏,王高才,彭颖
    2019, 40(3): 560-566.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着移动云计算的发展及用户对移动终端的性能要求的提升,将移动终端复杂的计算和存储需求转移到云端进行处理是移动云计算的必然趋势.因此,如何降低移动终端和云端能耗,提高能量利用率及增强用户体验是绿色云计算急需解决的关键问题之一.本文主要研究移动云计算数据传输过程中的能耗优化问题并提出一种基于最优停止理论的最小化单位数据的平均能耗传输策略:基于秘书问题的最优传输策略.通过构建具有多个应用的数据传输队列模型,在基于所选应聘者的绝对名次均值最小的秘书问题,提出放过k个应聘者后见优则录的规则,并证明该规则存在最优k值.仿真结果表明,本文提出的优化策略具有较小的单位数据平均能耗,更优的能耗效率及较佳的侦测效率.
  • 应可珍,周贤年,毛科技,陈庆章
    2019, 40(3): 567-572.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在开展大规模区域数据采集的无线传感网中,由于相邻区域数据的相似性造成的冗余会使得传感器能量耗费过多而过早死亡.针对该问题,提出一种基于区域生长法的WSN数据采集算法(DAA-RGM),该算法划分传感器网络部署区域,划分后根据子区域采集的历史数据选择一个与该子区域的历史数据变化趋势相似性最高的节点为代表节点.上述方法能够保证区域监测正常的情况下减少大量的冗余数据,因此能够较大幅度的延长传感器网络的生存时间,实验结果验证了该算法的有效性和可靠性.
  • 韩露露,杨波,来齐齐,曹艳艳
    2019, 40(3): 573-578.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    伪随机数发生器(Pseudorandom Number Generator, PRNG)是密码学应用系统的一个重要组成部分.本文利用线性同余发生器(Linear Congruential Generator, LCG)、流密码算法RC4和密码学Hash函数,构造了一种基于软件实现的组合式伪随机数发生器.该伪随机数发生器可以快速生成伪随机数列并且从理论上证明了产生的数列具备不可预测性.同时,采用美国国家标准和技术研究院(National Institute of Standard Technology, NIST)发行的随机性测试包对该新构造的伪随机数发生器所产生的序列进行统计测试.实验结果显示,该新构造的伪随机数发生器产生的序列能够很好地通过各项测试,可以应用于信息安全领域.
  • 史长琼,胡龙平,熊兵
    2019, 40(3): 579-583.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着OpenFlow流表规模的不断增大,容量有限的TCAM资源难以满足OpenFlow流表的存储需求.本文采用TCAM和SRAM相结合,给出了一种OpenFlow流表区分高效存储算法.该算法基于网络包成批特性,将OpenFlow流区分为少量的包成批流和大量的包稀疏流,并设计包成批流识别方法和流表项替换方法,将对应的流表项动态区分存储在TCAM和SRAM中,以解决OpenFlow流表存储空间有限问题,进而提高流表查找性能.采用实际网络流量样本,评估所提的流表区分算法的性能.结果表明:所提算法的TCAM命中率明显高于目前主流的大象流/老鼠流区分算法,增强了OpenFlow流表存储的动态适应能力,有效提高了OpenFlow流表查找性能,从而满足大规模流表的存储需求.
  • 田俊峰,石伟,
    2019, 40(3): 584-588.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着攻击Web应用程序工具的增多,Web服务面临众多安全威胁.目前检测Web攻击的方法主要是规则匹配,难以高效识别Web攻击流量.提出一种基于卷积神经网络的Web攻击检测方法,将Web请求流量转换为灰度图,即流量图像.针对传统卷积神经网络只能处理固定大小输入的局限,搭建基于空间金字塔池化的卷积神经网络,使之适于处理大小不同的Web流量,并从众多Web流量中识别出攻击流量.实验表明,该方法比规则匹配的方式及传统的卷积神经网络在识别Web攻击流量时更加高效准确.
  • 胡博,陈侃松,顾豪爽,阮玉龙
    2019, 40(3): 589-593.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对移动自组网中节点的随机移动致链路中断,网络拓扑频繁变化问题,提出了一种基于网络拓扑变化,结合源路由的按需距离矢量路由算法.根据对相邻节点运动预测链路持续时间结合节点最大速度分析网络拓扑稳定性,并通过不同稳定程度在路由发现过程加入源路由机制和路由维护周期更新机制,从而选择稳定性高的路由.NS2仿真结果表明,与AODV和DSR路由协议相比,在拓扑变化不同的各种环境下提出的方法的平均分组投递率高,且综合端到端时延小.
  • 王成志,杨哲慜,南雨宏,杨珉
    2019, 40(3): 594-600.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    动态分析是通过动态执行来测试评估程序的分析方法.现有的许多工作依靠动态分析来检测软件缺陷或安全漏洞.动态执行应用程序时,应用程序会根据用户的文本输入决定执行路径,缺少或者提供错误的用户文本输入会导致依赖文本输入的代码无法被执行.在动态分析中,这会造成应用的大部分代码无法执行,影响动态分析的覆盖率和效率.现有的工具不能在动态分析中为应用有效地提供相关的文本输入.为了弥补缺少的文本输入,测试人员需要不断和应用交互才能保证应用的代码被尽可能多的被执行,巨大的人工干预严重限制了动态分析的效率.本文提出了一种名为AutoSim的自动化文本生成框架,能够为应用在运行时提供相关的文本输入.AutoSim通过静态分析方法识别应用中控件需要的文本输入类型,并在应用动态执行的过程中将符合控件输入类型的文本注入到控件中,有效的提高了动态分析的覆盖范围.实验结果表明,AutoSim在识别界面控件输入类型的准确率达到了88.68%,并且能够帮助自动化动态测试工具扩大33.7%的界面覆盖率.
  • 卢菁,胡成,刘丛
    2019, 40(3): 601-605.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前真值发现的研究主要利用数据源质量和数据之间的关系,然而实际数据的分布呈现长尾现象,传统算法在处理尾部数据时,准确率大大下降.本文对数据源进行分类,对头部数据源利用属性集相关性,给予正确集更多的置信度补偿,易于剔除错误数据;对尾部数据源,根据误差小的数据源应获得更高的权值分配的理论,将真值发现转化成全局优化问题,通过寻求数据源权值的最佳分配,获得最可能接近真值列表的属性集合.实验表明,本文提出的方法在真实的长尾数据集上,准确率和召回率方面均优于传统算法.
  • 罗达雄,叶俊民,廖志鑫,王志锋,陈曙
    2019, 40(3): 606-611.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    从事软件开发工作的开发者经常会通过技术交流社区提出问题,给问题推荐合适的解决者是解决开发者遇到困难问题时的可行途径.目前的解决方案主要是基于开发者的显性行为(如:回复行为)而极少关注开发者的隐性行为(如:收藏行为),使得方案不能有效地发现潜在的问题解决者.为此,本文提出了一种基于隐性行为的问题解决者推荐算法,通过计算开发者的基于标签的隐性行为变量、解决问题的倾向性变量,并结合能力变量使用贝叶斯多变量回归得到开发者得分,排序后推荐问题解决者.实验过程基于互联网问答社区StackOverflow的数据,实验结果证明本文的方法具有良好的效果.
  • 石磊,丁鑫,陶永才,卫琳
    2019, 40(3): 612-617.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    推荐系统向用户推荐个性化的产品或服务.传统的推荐系统研究中,用户兴趣被认为是稳定不变的,而事实上,因为各种因素的影响,用户兴趣会发生改变,称为用户兴趣漂移.如何跟踪用户兴趣漂移,是提高推荐系统准确率的关键,也是近年来推荐系统的研究热点.本文设计一种兴趣漂移检测方法,从项目的内容信息和协同信息两个角度构建用户的兴趣特征向量,检测用户兴趣漂移;然后依据兴趣漂移构建加权的用户-项目异构图;最后引入元路径来描述用户-项目异构图中不同类型节点间的关联关系,寻找与用户有较大关联度的项目推荐给用户.本文在MovieLens数据集上对该模型进行了验证,较BPIR算法,推荐准确度提高了3.02%.
  • 刘杭雨,于洪
    2019, 40(3): 618-622.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类分析作为一种统计分析方法,以无监督的优势广泛地应用在数据挖掘等领域.随着时代的发展,传统聚类算法不能很好对数据属性增加的情况进行处理.因此,结合人类认知特点,本文提出了一种多粒度增量属性的聚类方法,这是一种新的解决问题的机制,利用多粒度的思想对不确定性数据进行处理.首先利用密度峰值聚类方法对原始数据进行聚类,得到一个初始结果,然后对于某时刻新增加的属性粒集合,将新的属性粒集合对应地增添到原有的属性粒集合的尾部以融合成新的粒度,在不重复聚类的前提下以新粒度为基础,利用邻域的思想动态地更新原有聚类结果以得到新粒度的增量聚类结果.实验结果表明新方法是有效的.
  • 任永功,高鹏,张志鹏
    2019, 40(3): 623-627.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大多数不确定数据库中频繁项集挖掘算法都是基于支持度的限制来剪枝组合搜索空间,因而得到关联性很弱的频繁项集并且对加权相关模式的挖掘效果不显著.本文针对加权不确定数据,提出一种新的策略:基于相关性度量的不确定数据频繁模式挖掘(UFPMCM).首先,本文采用一种新的树结构和一个针对树结构的新的度量来提高挖掘性能.其次,提出了新的不确定置信度度量来挖掘不确定数据库中的相关模式.最后,利用UFPM算法快速挖掘出相关性强的频繁模式.实验研究结果表明所提出的策略产生了较少但极具价值的模式且其效率优于同类算法.
  • 何振邦,徐喜荣,胡旭明,戴鑫邦
    2019, 40(3): 628-634.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    手背静脉识别技术是一种利用手背静脉特征来实现身份识别的技术,作为一种新颖的身份识别技术,近年来得到了一些学者的关注.研制了一套手背静脉识别系统,能够完成手背静脉红外图像的采集、预处理、特征提取和匹配.首先设计了一种改良的手背静脉图像采集设备来获得手背静脉原始图像,然后对图像进行小波去噪、灰度拉伸、NiBlack二值化、图像细化等预处理操作,得到手背静脉骨架图像,最后使用随机投影算法进行特征提取并用最邻近分类器进行匹配.实验测试结果表明本系统有96%的识别率,具备一定实用价值,对手背静脉识别系统的研制有一定的参考借鉴意义.
  • 顾广华,刘小青,
    2019, 40(3): 635-640.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对图像显著性检测问题,本文提出一种融合前景和背景种子点扩散的显著性目标检测算法,扩散即为对种子点进行有效的传播.首先选取种子点,同时选择前景点和背景点作为种子点,丰富了种子点信息;然后,分别对背景种子和前景种子进行显著性扩散,并融合各自得到的显著图;最后,通过聚类优化和抑制函数完善显著图,使显著区域更加突出,背景区域得到更多的抑制,从而得到最终的显著图.本文算法在MSRA-1000和DUT-OMRON数据库上进行评估,并与其它六种算法进行对比评测,实验结果证明了本文算法的优越性.
  • 胡胜元,陈盛双,谢良
    2019, 40(3): 641-645.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    最大间隔矩阵分解是解决矩阵填充的重要方法,它通过将每个项目投影到低维特征空间,构建出每个用户的超平面,对每个项目进行分类来完成矩阵填充.然而传统的最大间隔矩阵分解方法对二值矩阵进行分解时都假设所构造的超平面经过原点.为了使超平面具有普适性,提高分类效果,将超平面移动一定的偏倚量,提出了带偏倚的最大间隔二值矩阵分解方法.对于多值矩阵的填充问题,通过多次采用上述改进的二值矩阵分解方法,对多值矩阵进行分层填充,并采用交替优化的方法进行求解.在真实数据集Movielens上的实验结果优于目前已有的方法,并且在较低维的特征空间中就能够完成矩阵分解,能有效提高矩阵分解速度,减少计算内存.
  • 张哲,孙瑾,杨刘涛
    2019, 40(3): 646-650.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在人机交互技术领域,基于视觉的手部交互技术凭借其良好的舒适性和自然性被广泛研究和应用.手势识别是手势交互技术的核心内容之一.本文提出一种基于深度学习网络的识别方法,构建双视点网络框架,采用支持向量机对各视点下提取的特征进行分类识别,降低手势自遮挡的影响,提高识别精度;同时对各视点卷积网络,根据训练样本卷积特征的累计贡献率实现不同深度层的卷积特征的融合,补充深层网络丢失的浅层特征信息,增强特征鲁棒性.实验结果表明,较传统方法本文方法能有效提高手势识别准确率,同时基于预训练的学习方法能有效提高手势识别的时间效率.
  • 刘洪麟,帅仁俊,陶静,张秋艳
    2019, 40(3): 651-654.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对图像风格迁移(Style Transfer)任务中的空间非对齐图像数据处理效果不理想的问题,提出一种基于语义学的最强引力方法.该方法是将图片与目标图片看作是一些高维度特征点(High-dimensional Feature Points)的集合,通过定义引力(Gravitation)来衡量两张图片中高维度特征点的相似程度.如果两张图片相似,则对应高维度特征点也互相吸引.生成图像的每个特征点在目标图像中找到与自身引力最强的特征点,然后最小化最强引力损失函数.实验结果表明,该方法对两张图片中语义相似的区域有很强的敏感度,生成图片的质量明显优于若干经典的方法.
  • 曾浩洋,张红英,
    2019, 40(3): 655-659.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对暗原色先验去雾算法对大面积天空区域处理不理想等问题,提出了一种基于天空区域分割的图像去雾算法.该算法首先使用最大类间方差法(Otsu)求得阈值将天空与非天空区域分割开,然后再对天空区域求大气光值A,作为整幅雾天图像的大气光值,进而精细化透射率,得到较好的复原效果.为了提高去雾效率,基于 CUDA(Common Unified Device Architecture) 并行编程算法, 通过 GPU 并行处理和 CPU 任务调度的协同, 在保证去雾效果的同时快速去雾.实验结果表明,该方法能很好的解决天空区域去雾出现的光晕和色彩失真现象.优化后的并行算法,针对高清图像基本上达到了实时去雾的效果.
  • 郑红波,左少华,程燕飞,秦绪佳,张美玉,徐晓刚
    2019, 40(3): 660-664.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在实际工程应用中,运动目标的外形、大小直接影响到路径选择,本文针对三维复杂场景的碰撞检测和路径规划问题,提出了一种基于层次包围盒碰撞检测的实时路径规划优化算法.该优化算法在进行碰撞检测时,通过预碰撞筛选检测和精细碰撞检测的方法来规避根本不会碰撞的物体,只检测与视点小半径球有碰撞可能性的物体;在进行路径规划时,在传统A*算法进行路径规划的基础上,结合“粗试探和精搜索”的思想,最终完成路径规划.实验结果表明,本文优化算法在时间效率和效果上有一定的优势.
  • 李昆仑,王琳,李尚然,巩春景
    2019, 40(3): 665-670.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的基于内容的图像检索方法缺少自主学习能力,图像表达能力不强,严重制约其图像检索性能,而深度学习模型为图像检索提供了新思路.本文提出一种深度PCA子空间极限学习机图像检索算法.首先将图像进行分块处理,采用多层级联主成分分析作为卷积滤波层,将图像映射到深层PCA子空间,然后通过深度极限学习机获得深层子空间稀疏特征,实现图像的深层特征提取.最后对特征进行哈希编码,利用编码实现快速图像检索.在MNIST、CIFAR-10和CALTECH256等数据集上的实验结果表明,该算法在训练效果和训练时间上都具有较好的性能,与卷积神经网络等深度学习框架相比,具有结构简洁、收敛速度快等优点.
  • 李社蕾,黄梦醒
    2019, 40(3): 671-675.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于海洋环境对光有很强的的吸收和散射效应,导致水下成像存在对比度低、噪声严重及灰度不均等问题[1,2],在很大程度上影响了水下图像分割的效果.论文研究了几何活动轮廓模型的基本理论,结合水下图像对比度低、图像模糊、偏色等问题,对自适应的GACV图像分割算法进行改进,建立了适用于水下图像分割的改进的自适应GACV图像分割算法的数学模型,并对水下图像进行分割仿真.仿真结果表明,该模型对弱边缘更加敏感,对具有对比度低、图像模糊特点的水下图像实现了完全分割,达到了预期的分割效果,表现出了良好的鲁棒性. 
  • 孙卫真,邱皓月,向勇,张禹
    2019, 40(3): 676-682.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    路口和立交桥作为城市路网的重要组成部分,对于路况计算具有重大的意义.本文为了解决复杂城市道路场景下,低采样率的车辆轨迹数据计算出的路况精度较差的问题,提出一种改进的路况计算精度优化算法.首先针对路况计算精度较差的立交桥区域,将复杂的立交桥抽象成一个路口,通过改进的聚类算法对立交桥进行了自动化定位.然后利用凸包算法划分了立交桥的路口范围,将复杂路口路况简化为转向时间.利用同一辆车经过路口(普通路口和立交桥路口)前后的轨迹点信息来精确推导相关道路和路口路况.实际数据分析表明,该方法可有效提高路况计算精度.
  • 周忠玉,皮德常
    2019, 40(3): 683-688.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统购物篮数据挖掘仅局限于频繁项或频繁模式的挖掘,但大多数频繁模式挖掘不能有效的利用非频繁序列项,通常的做法是将之舍弃.基于此问题,提出了一种面向购物篮数据的稀有序列模式挖掘算法ISM-BD.该算法提出了时间变量和综合权重因子的概念,以此来保证数据的时效性和挖掘结果的区域差异性.首先根据人为指定的环境因子,计算不同区域下的综合权重因子;然后通过设定时间变量的范围来剔除不具时效性的数据;最后计算序列项的支持度,并与综合权重因子比较,从而找出不同区域下的稀有模式.采用公开购物篮数据的实验表明,提出的ISM-BD算法与已有的算法相比能有效的利用非频繁序列,其挖掘结果具有时效性和较强的适用性.