过刊目录

  • 2018年, 39卷, 第7期
    刊出日期:2018-07-01
      

  • 全选
    |
  • 杨振浩,郑启龙,邓文齐,王向前
    2018, 39(7): 1377-1380.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    魂芯DSP(BWDSP)系列处理器由中国电子科技集团第38研究所研制,支持VLIW(Very Long Instruction Word,超长指令字)和SIMD(Single Instruction Multiple Data,单指令多数据流)技术,被广泛运用于各种高性能计算领域.快速傅里叶变换(Fast Fourier Transform,FFT)是数字信号处理、图像处理等领域的基本研究工具.目前由于BWDSP处理器的访存带宽限制,通用的向量化FFT算法未能充分挖掘其计算资源,面临算法性能较低的问题.针对该问题,本文结合BWDSP处理器的体系结构特征深入剖析FFT算法,提出了支持高效访存的并行FFT算法.实验结果表明,在BWDSP100处理器上该算法平均性能达到7.61Gflops,是串行FFT的16.54倍,普通向量化FFT的4.03倍..
  • 卢建云,朱庆生,吴全旺
    2018, 39(7): 1381-1385.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类分析是数据挖掘领域中最重要的任务之一,目前许多聚类算法已经被成功应用到图像聚类、文本聚类、信息检索、社交网络等领域.但面对结构复杂,分布不均衡的数据集时,确定数据集的最佳聚类数目显得尤为困难.因此,本文针对结构复杂、分布不均衡的数据集提出了一种启发式最佳聚类数确定的方法.首先,构建随机游走模型对数据集中的点进行重要性排序,通过k-最近邻距离图谱确定重要数据点的个数,由此排除噪声点和不重要的点对类之间以及类内密度变化的影响.其次,通过设计的启发式规则(k-最近邻链间距和k-最近邻链最近邻间距)构建决策图确定最佳聚类数目并识别出聚类代表点.最后,通过最近距离传播算法进行聚类.实验表明该方法可以快速准确地找到最佳聚类个数,同时,本文提出的聚类算法与流行的聚类算法相比取得了比较好的聚类结果.
  • 王子一,商琳
    2018, 39(7): 1386-1389.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    关于时间序列分类的问题在过去十多年时间里已经引起极大的兴趣.并且已经有实验表明传统流行的分类算法像KNN等,已经很难处理时间序列的分类问题.基于Shapelet和DTW(动态时间规整,Dynamic Time Warping)的这一分类方法的时间复杂度又太高.本文提出一种新的基于子段距离计算的时序分类方法,通过对时间序列进行切分然后对切分后的子段用kshape算法进行聚类,在聚类结果中寻找两类时间序列各自比较有区分性的片段,并以此来作为分类的依据,该方法思路更为简单且时间复杂度不高.通过实验验证了我们算法的分类精度和适用性,并与shaplet算法相比我们算法在时间复杂度上更具优势.
  • 王大伟,崔婉秋,覃飙
    2018, 39(7): 1390-1397.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    XML搜索技术作为当今网络信息获取的一个主要研究方向,构成了信息查询及共享的基础,是实现信息源与用户需求之间匹配和选择的有效方法.随着XML文档在因特网上的快速发展,为了满足大多数普通用户的搜索体验,需要依赖关键字查询的强大搜索能力.本文总结了国内外近年来基于XML文档的关键字检索技术,主要针对不同的查询语义及算法进行了对比归纳,并总结了XML检索技术的发展趋势.分别从用户提供不确定性信息的近似查询和XML存储数据的不确定性上的查询等方面进行阐述,并指出了XML关键字检索面临的新挑战.
  • 刘锐,谭文韬,付园斌,王红,
    2018, 39(7): 1398-1404.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络论坛的分类和正文提取是网络数据挖掘的一项重要技术.传统的网页分类方法没有考虑到论坛网址的结构特性,以内容特征为根据,易受噪声影响,效率较低,难以满足通用性的需求.传统的正文提取方法以文本密度和布局结构为依据,忽视了论坛内容的语义信息,难以从多样化的论坛中有效提取正文.本文提出基于网址结构的聚类方法(Universal Resource Locators′ Structure Clustering,USC)以及基于词汇关键程度的关键词打分筛选方法(Keyword Scoring Filter,KSF).两种方法仅需要对数据集中的少量样本进行解析,提取出通用规则,便可满足大规模提取的需要.实验验证,在相同测试集下,USC方法的F值较传统分类方法高18.99%,KSF方法的准确率较传统正文提取方法高18.46%,适合大规模论坛提取作业.
  • 尚文利,闫腾飞,赵剑明,乔枫,曾鹏,
    2018, 39(7): 1405-1409.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对工控网络异常行为与入侵行为的差异性,为降低漏报率和误报率并且为提高异常检测的准确率,提出基于单类支持向量机的双轮廓模型异常检测方法,模拟工控系统通讯的正常模态和异常模态,通过协同判别机制实现工控系统网络的异常检测.同时,为减小单类支持向量机建模时间与检测时间,选取自编码网络对提取的网络流量数据进行输入自变量降维和压缩处理,并且抑制了单类支持向量机模型的过拟合现象.基于自编码网络的单类支持向量机双轮廓模型的异常检测方法,通过对模型的仿真验证,可以看出工控系统漏报率和误报率明显降低,检测时间有所缩短,对工控系统异常检测的研究有较大的应用价值.
  • 姜丽,姜淑娟,于巧
    2018, 39(7): 1410-1414.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在软件缺陷预测中,缺陷数据集中往往存在冗余或不相关特征,需要对数据集进行特征选择.为了避免软件缺陷预测中常见的基于排序的特征选择方法的不稳定性,提出一种基于排序集成的特征选择方法.首先,分别执行相关系数、信息增益率和ReliefF三种特征选择方法,得到特征排序序列,赋予每个特征一个权重,随后,将三种方法得到的每个特征的权重相加求和,作为该特征的总权重.最后,根据特征总权重对特征从高到低进行排序,并按照特征百分比从前往后依次选取特征.在实证研究中,以NASA的11个数据集为实验对象,采用逻辑回归算法构建预测模型,并采用AUC指标度量不同预测模型的分类性能.实验结果验证了基于排序集成的特征选择方法的有效性.
  • 尹静,李唯唯,杨德红,闫河
    2018, 39(7): 1415-1419.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分类受限玻尔兹曼机(classification restricted boltzmann machine,ClassRBM)在各种分类问题中得到了广泛应用.ClassRBM是一种自带标签信息的神经网络模型,它使用一个神经元标识某类数据的类标.标签神经元总是稀疏的,一个神经元仅能为网络模型参数提供有限的信息.论文在ClassRBM现有的网络结构上,增加标签神经元个数,使每个类标用K个神经元标识,为网络模型参数提供更多的信息,提升模型表达能力,进而改善ClassRBM的分类性能.论文在不同数据集上进行了测试,结果表明改进模型的分类效果可以优于ClassRBM.
  • 杜振鑫,韩德志,刘广钟
    2018, 39(7): 1420-1425.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在人工蜂群算法及其变种中,侦察蜂采用随机初始化的方法生成新食物源,容易造成前期计算资源的浪费和陷入局部最优解.解决这个问题的一个重要方法是引入新的操作算子,弥补算法的不足.最近提出的遗传学习算子(GL)是遗传算法(GA)的最新改进版本,较好的平衡了全局搜索能力与加速收敛之间的矛盾,对比GA具有较大优势,可以作为一个较好的选择.本文将GL算子引入到多种人工蜂群算法变种的侦察蜂阶段,通过有效组合多个优秀个体的信息产生更有希望的新实物源,防止算法早熟.通过在多个精英解上完成GL算子的交叉、变异与选择操作,新产生的食物源具有较高的多样性和较高的质量.在著名的CEC2014函数集上的实验结果表明,GL算子可以作为一种通用框架嵌入到多种最新提出的改进ABC算法中,显著提高这些算法的收敛速度与搜索精度.
  • 张兆晨,冀俊忠
    2018, 39(7): 1426-1430.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有分类模型未充分利用fMRI数据时序特性的问题,提出了一种基于循环神经网络(RNN)的时序fMRI数据分类模型.首先,使用任务态有标注数据训练卷积神经网络模型,得到相应网络参数.然后,将有标注数据和无标注数据按时序组合,共同输入到上一步训练好的模型中,以提取全连接层特征.最后,将提取的特征以一个标签一个时间序列的方式组成有序对输入到RNN中,通过训练得到最终的分类模型.在Haxby数据集上的实验结果表明,使用RNN提取fMRI数据时序特征可有效提升模型分类准确率,并且加入休息态无标注数据后,模型分类性能得到了进一步提升.
  • 高小方,刘杰飞,梁吉业
    2018, 39(7): 1431-1435.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    流形学习已经成为机器学习与数据挖掘领域的一个重要的研究课题.经典的流形学习算法总假设所研究的高维数据存在于同一个单流形上,然而现实世界中的数据往往位于不同的流形且交叉重叠.当前的流形学习算法并不能有效应用于这种高维多流形数据.基于MPPCA模型提出一种面向相交多流形数据的识别算法D-MPPCA.该算法首先通过动态邻域算法计算出每个样本点的近邻关系和切空间,然后通过MPPCA模型将相交多流形数据分解成若干“不相交块”,最后通过切空间扩展分解和识别多流形数据.实验结果表明,该算法能有效地应用于人工数据和实际的高维图像数据,相较于其他算法极大的提高了子流形识别精度.
  • 曹成宏,雷迎科,徐一鸣
    2018, 39(7): 1436-1440.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前,国内外运用经典模式匹配算法及其改进算法进行数据处理的相关研究很多,但面向链路层比特流数据进行频繁统计的算法研究却很少.针对经典的多模式匹配算法如AC算法等计算复杂度高、效率低,同时不能适用于具有二元性的比特流数据这些问题,该文采用一种基于AC-IM (Improved AC)算法的链路层比特流数据频繁统计方法,算法能在避免漏检的情况下,使模式树的最大跳跃距离为最短模式串长度加3.该文先从算法构造原理上进行了理论分析,再通过大量实际数据作对比实验发现该算法能够较好地适应二进制比特流数据环境,准确地提取出频繁序列,效果明显.同时相比于经典的AC改进算法,AC-IM算法具有更大跳跃距离和耗时更少的特点.
  • 张霄宏,王盼盼,王雅萍,翟海霞
    2018, 39(7): 1441-1445.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文主要关注以文件共享为目标的D2D移动社交网络中的影响力分析,提出了一种基于文件类型的多维用户影响力计算模型,并依据该模型对真实网络中的用户影响力进行了评价分析.分析结果表明:1)用户对不同类型文件的影响力不同;2)用户的影响力值成长尾分布.
  • 林思思,叶东毅,陈昭炯
    2018, 39(7): 1446-1450.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    许多图像分类问题具有类内相似而类间差异的特点,然而花卉图像的分类往往存在着类间相似和类内差异的现象,因此,基于传统人工设计的图像特征进行花卉图像分类效果一般不够理想.针对这个问题,本文提出融合深度特征和人工特征的花卉图像特征提取方法并在此基础上实现花卉图像的分类.首先构建基于卷积神经网络CNN的特征提取框架,然后利用 CNN 模型从颜色、亮度多特征角度提取目标对象特征,并利用 CNN 低层级上的特征图设计了一种基于卷积神经网络的纹理特征,最后将上述多个特征与传统的人工设计图像特征经过融合得到一组花卉图像特征. 分类实验结果表明,本文提取的融合特征不仅维度低于传统的人工设计特征,而且具有更好的分类准确性.
  • 黄海燕,彭虎,邓长寿,王晓静,张艳,谭旭杰
    2018, 39(7): 1451-1458.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    布谷鸟搜索(Cuckoo Search,CS)算法是一种简单易实现的全局优化算法,但也存在局部搜索能力弱,求解精度不高的问题.为了克服这些问题,提出一种新的均匀局部搜索和高斯变异的布谷鸟搜索算法.该算法在基于Levy飞行产生新解后执行均匀局部搜索,从而提高算法的局部开采能力,并对被宿主发现的鸟巢采用高斯变异进行重新更新,从而提高算法的寻优精度以及收敛能力.通过对包括单峰函数、多峰函数的13个基准测试函数的仿真实验和分析,验证了新算法的有效性和可靠性,实验结果表明新算法具有较好的收敛速度和收敛精度,是一种具有竞争力的算法.
  • 易磊,潘志松,陶蔚,杨海民
    2018, 39(7): 1459-1464.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络流量分类是机器学习与网络安全领域中的一个研究热点.针对高速骨干网上网络流量的高速性与演化特性,基于在线稀疏学习算法FTPRL,提出一种在线多任务特征选择学习算法-MT-FTPRL.使用了Per-Coordinate学习率,对每个特征的学习率分别考虑,与全局学习率相比更具优势;提出一个在线多任务学习的网络流量分类框架,通过多个网络流之间的信息共享,提取一组拥有良好判别能力的共同特征子集;在实验部分构造了一个基于真实的骨干网网络流量的MAWI数据集,并通过对比实验对提出的算法及分类框架进行验证.实验表明,算法有着满意的分类准确性和检测效率,且能在多个网络流中提取一组共同的特征子集,提高分类系统的鲁棒性,更适应网络流量动态演化的特点. 
  • 邱望,潘善亮
    2018, 39(7): 1465-1470.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    语义网技术为传统社交网络提供一种新的模式,如何高效地提取用户的语义信息,计算并分析站点的重要度对理解网络中用户行为和优化网站系统具有重要意义.提出一种语义社交网络中信息提取与分析的方法,根据语义社交网络的链接模型定义了语义信息的通用特征模式,据此来识别、发现以及验证有效的用户信息,并使用RDF解析器进行提取和筛选;最后提出一种语义加权算法计算用户在网络中的影响力并进行排序.最终的实验结果验证了该方法的有效性和准确性.
  • 谭旭,吴俊江,徐磊,毛太田
    2018, 39(7): 1471-1477.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目前中文网络舆情中的情感分类方法过于依赖人工特征选择,以至于其分类精度难以提升等问题,本文通过拟合人脑对具有较大复杂非线性的中文文本的理解,借助深度学习的方法构建多维度的网络舆情分析模型.在本文所提出的方法中,通过构造中文文本词向量解析模型和RAE深度学习模型来实现文本信息的高层特征提取和情感分类;而后结合LDA主题分析模型和时间序列模型实现多主题的舆情情感分析和舆情情感走势预测;最后,通过对“魏则西事件”的实证分析,验证了本文深度学习模型对中文文本舆情分析处理的优越性和合理性.
  • 王嵘冰,徐红艳,冯勇,郭浩
    2018, 39(7): 1478-1481.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在基于用户的协同过滤推荐算法中,用户相似度计算准确与否直接影响推荐系统的质量.目前,传统的相似度计算方法虽广泛使用,但仍存在较大的局限性,尤其在数据稀疏的情况下很难准确计算出用户相似度,容易出现过分放大或缩小的歧变,从而影响推荐算法的运行.因此,本文使用似然比相似度并结合欧几里得距离加以调整的方法计算用户的相似度,藉此解决推荐系统中在每个用户只有少量评分的情况下计算两个用户间相似度的问题.最后,在MovieLens数据集上,将本文所提计算方法与其他传统计算方法应用到同一基于用户的协同过滤推荐算法中进行对比实验,结果表明,本文所提方法能够更加准确、有效地识别相似用户,从而提高了推荐的准确性.
  • 胡德敏,詹涵
    2018, 39(7): 1482-1486.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于k匿名的位置隐私保护方法已被广泛研究,但该方法需要可信第三方且无法防止有背景信息对手的攻击,容易泄露位置隐私.针对这一难题,提出一种差分扰动的均衡增量近邻查询位置隐私保护方法.向用户的真实位置添加可控的拉普拉斯噪声,生成干扰位置,并将其作为锚点发送给位置服务商.采用均衡增量近邻查询算法,解决SpaceTwist算法中兴趣点围绕真实位置分布不均匀的问题,提高查询准确度.实验结果表明,在考虑数据通信量的情况下,该方法比SpaceTwist方法在查询相似度和响应时间上均具有较高优势,实现了隐私保护度与服务质量的平衡.
  • 陈晶,万云
    2018, 39(7): 1487-1491.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    自底向上的社区发现算法中大多利用局部相似度对网络进行划分,其结果会导致一些节点的错误划分、子社区划分数目比较多以及出现社区结构不稳定等问题.针对这些问题,提出一种基于相似度的双向合并社区发现算法PMCD (Pairwise Merging Community Detection).在PMCD算法中,考虑社区节点间的相似度属性,利用节点之间的共同邻居为节点间的边分配权重,通过边权重将网络划分成小社区;计算未分配社区的节点与小社区之间的相似度,对小社区进行扩展,形成子社区;结合社区结构特性,计算模块度的变化值来判断子社区是否进行双向合并,直到形成最终社区.将PMCD算法在不同的数据集上进行比较与分析,实验结果表明,PMCD算法发现的社区接近真实结果,并且在获取高质量社区及运行时间方面具备一定的优势.
  • 武小年,王青芝,张楚芸,叶志博
    2018, 39(7): 1492-1497.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对云服务信任评估问题,提出一种区间数多属性决策的云服务信任评估方法.该方法先将云服务评估问题层次化,形成一个包括目标层、服务层和指标层的多层次结构模型;对于服务质量指标层,监测云服务运行的实时指标数据并用区间数表示,构建决策矩阵;基于不同层次间指标影响程度的不同,计算云服务层和目标层的指标权重体系;最后,结合决策矩阵和权重体系进行云服务综合评价和优劣排序.实验结果表明,该方法能够客观、有效地对云服务信任做出评估,避免了信任评估中常见的滞后、串谋和恶意评价问题.
  • 金瑜,龚鑫,何亨,李鹏,
    2018, 39(7): 1498-1503.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云存储中云数据的安全和效率问题正广受关注.解决云数据安全问题的方法一般是审计,而解决云数据效率问题(即重复问题)的方法是去重.为了避免暴露隐私,数据一般以密文的形式存储在云服务器上,所以,我们应该考虑加密数据的去重和审计.为了保证云数据存储的既安全又高效,我们需要支持加密数据去重的审计方案.然而目前同时考虑加密数据去重和数据完整性验证的方案存在缺点,如①用户端存储和计算开销大;②需要用户一直在线参与审计过程,并且用户和云服务器计算量大.针对这些问题本文提出了CDED, 一种新的同时支持加密数据去重和数据完整性验证方案:①加密数据去重时,采用了代理重加密的方法来保证数据安全,这样用户端不需要保存大量加密密钥,且省去了上传重复数据之前加密数据的计算量;②在数据完整性验证中,采用了新的公开审计和代理重签名方法,保证用户不用一直在线参与审计过程,也减少了用户端和云服务器的计算量.通过理论和实验分析,CDED克服了现有方案的缺点.不需要用户一直在线,并且用户端和服务器端的计算量都减少了.
  • 张光华,杨耀红,张冬雯
    2018, 39(7): 1504-1511.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    物联网环境下,由于部分节点的移动性使合法节点的丢包概率增加,当使用丢包概率阈值对灰洞攻击进行检测时,合法节点易被误判为恶意节点.为此,基于RPL协议,提出一种能够在节点移动情况下检测灰洞攻击的方法.采用预期传输次数计算节点丢包概率的动态阈值,将每个路由节点的丢包概率与动态阈值相比较,从中筛选出可疑的灰洞节点,将其标记到隔离区.当路由节点被标记的次数达到上限时,汇聚节点对该节点进行序贯概率比检验,进一步确定该节点是否为灰洞节点.最后,通过RPL协议中的全局修复机制将灰洞节点剔除网络.仿真实验结果和分析表明,在节点移动的情况下,本方案能够有效地检测出灰洞节点,且误检率较低.
  • 乐德广,赵杰,龚声蓉
    2018, 39(7): 1512-1517.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对安卓应用容易被恶意逆向工程,引起代码注入、隐私数据泄露和侵害知识产权等安全问题.提出一种结合Java方法抽离和映射的代码混淆技术.其中,Java方法抽离利用了安卓Native化特性,将Java方法从DEX中抽离后封装到SO中.此外,Java方法映射对其指令操作码进行映射混淆构造不透明指令.随后通过Java方法注册和映射解释执行环境,对抽离映射混淆后的Java方法进行Native层的映射解释执行,确保混淆后的安卓应用运行逻辑的正确性.最后,从抗逆向工程有效性和运行性能两方面对安卓应用混淆效果进行实验.实验结果表明本文技术在不影响正常运行性能的情况下,具有良好的抵御逆向工程分析效果.
  • 谢平
    2018, 39(7): 1518-1521.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着网络技术与社会各行各业的深度融合与发展,现代企业数据中心面临海量数据的存储,因此需要在现有存储系统中加入新的磁盘以提升I/O并行性及容量扩展.在扩容过程中为了获得I/O负载的均衡性,需要将旧磁盘中的部分数据迁移到新加入的磁盘,然而现有的RR扩容布局算法需要迁移大量的数据,SemiRR算法在多次扩容后存在数据布局不均匀性等问题.本文提出了一种新的RAID4容量扩展算法USR4,该算法在扩容过程中体现出均匀数据布局性、最小化数据迁移量和快速扩容等特性.相比于RR扩容算法,性能评价结果表明,USR4算法减少了80%88.9%的数据迁移量,缩短了40%62.23%总扩容时间.
  • 张俊松,甘勇,贺蕾
    2018, 39(7): 1522-1526.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    群智感知系统在实际部署中还存在着感知数据泄露、用户参与积极性低等问题.为提升用户积极性,适当的激励是必须的.然而,在实施激励过程中,往往需要用户身份信息来完成奖励发放,而用户一般不愿意泄露身份隐私.为了解决这一矛盾,提出一种基于随机假名和安全哈希函数的匿名认证协议.该认证协议利用随机假名的随机性切断用户真实身份与假名之间的关联.利用安全哈希函数的单向性,防止攻击者从截获的数据包中提取与用户身份以及奖励相关的信息.最后的安全分析和性能分析表明,本文提出的匿名认证协议在安全和计算性能方面符合群智感知环境的要求.
  • 孙家泽,令蓓蕾
    2018, 39(7): 1527-1531.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    软件模块划分是软件工程领域一个重要并且非常复杂的问题,通过软件模块划分可以将规模庞大的复杂软件系统分解为易于理解和维护的子系统.针对现有软件模块划分算法收敛速度慢、划分效果不佳的问题,提出了一种基于复杂网络和群体智能算法的软件模块划分算法.首先对软件系统抽象形成复杂网络图,然后改进粒子群优化算法,使用最短路径初始化种群,使用概率选择的方式更新粒子位置,最后给出概率选择粒子群算法的全局收敛性证明.采用六个典型复杂软件项目实证结果表明,新算法稳定性更好,收敛速度更快,为软件模块划分问题提供了一个有效的工程化方法.
  • 郭帅,刘亮,秦小麟
    2018, 39(7): 1532-1536.
    摘要 ( )   可视化   收藏
    定位技术和文本处理技术的结合使空间关键词查询处理技术成为研究热点.传统空间关键词查询由单用户提出,包含一个查询位置和一组查询关键词.协同空间关键词Topk查询(TKCSKQ)返回离多个查询位置近、文本与多组查询关键词相关度高的Topk对象.针对TKCSKQ中多组查询关键词存在重复和近义关键词,设计了基于查询关键词权重的关键词相关度计算公式.对IRtree进行了扩展,提出了支持近义关键词匹配的SKNIRtree索引,并基于SKNIRtree提出了高效的协同空间关键词Topk查询处理算法(TKCSK).通过维护一个优先队列以及计算每个节点与查询的最小空间文本相关度来达到剪枝目的,快速识别结果对象.实验结果表明,TKCSK算法的性能相比基础算法平均提高3倍.
  • 陈书文,覃华,苏一丹
    2018, 39(7): 1537-1541.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    模糊C均值聚类算法(Fuzzy C-mean,FCM)因随机选取初始聚类中心,造成算法求解过程不稳定 (即存在不适定性问题).针对此问题,提出一种最优正则化参数的核FCM算法,首先在核FCM的目标函数中引入正则化项和正则化参数;然后推导出用L曲线法寻优正则化参数所需的迭代更新公式;最后用迭代更新公式设计最优正则化参数的核FCM算法.在UCI测试数据集上的实验结果表明:本文所提算法的平均稳定性较传统FCM提高了5倍,平均准确率和平均召回率也分别提高了30%和33%.本文用L曲线法寻优核FCM的正则化参数是可行的,能有效地抑制FCM的不适定性.
  • 胡志刚,刘佳
    2018, 39(7): 1542-1547.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前信息系统中存在海量复杂异构数据,极大地降低了数据可用性.为有效地“清洗”数据、提高数据实体同一性,借助云计算平台Hadoop设计并实现了基于超图模型的实体识别算法.算法共分为数据预处理、构造超图模型和实体识别三个阶段:在预处理阶段,通过建立属性值倒排索引表、挖掘频繁项集来对数据进行初步处理;在构造超图模型阶段,改进超边权重的定义,建立超边带权重的超图模型,将所有数据转化为超图模式;在实体识别阶段,改进超图分割算法并基于云平台来完成对同一实体的识别.在Hadoop平台上对真实数据集的实验结果表明该算法在实体识别方面具有良好的准确性和高效性.
  • 郭昆,李国辉,陈羽中,吴伶,许倩
    2018, 39(7): 1548-1553.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的动态网络社区发现方法是对每个时刻的网络分别通过静态算法进行社区检测,进而分析各个社区之间的关系,可能导致较高的时间开销.根据相邻时刻之间的拓扑结构变化不大的特点,提出一种考虑社区结构稳定度和增量相关节点相结合进行社区发现的方法IPCSCDA(Incremental Parallel Community Detection Algorithm Considering The Stability Of Community Structure).算法以前一个时刻得到的社区结构为基础,通过基于Jaccard系数的社区归属判定条件来调整增量相关节点的社区归属,同时考虑每个社区的结构稳定度,以发现动态网络社区.通过增量方法分析相邻时刻网络的变化,避免了对整个网络进行重新划分,从而大大减少了算法的时间开销.在人工数据集和真实数据集上的实验表明,提出的算法具有良好的动态社区发现能力.
  • 黄启成,陈羽中,江伟,刘耿耿,
    2018, 39(7): 1554-1559.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着数据中心规模的扩大,提升资源利用率的问题日益凸显.如何合理部署虚拟机到数据中心的物理机上是提升数据中心资源利用率的关键问题之一.首先提出相应的资源利用率和响应时间模型,并提出一种结合变异算子的多目标粒子群优化算法(Multi-Objective Particle Swarm Optimization with Mutation Operator,MOPSOM)用于解决虚拟机部署问题.该算法以提高资源利用率和减少响应时间为优化目标,采用线性递减惯性权重寻找最优的虚拟机分配方案.仿真实验结果表明,MOPSOM能够在减小响应时间下提高资源利用率,同时在负载均衡度和能耗之间达到了更好的平衡.
  • 何慧
    2018, 39(7): 1560-1564.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对用户行为转移特性和缓解用户行为数据的稀疏性问题,提出了基于Ranking的贝叶斯序列推荐算法(SR-BPR).SRBPR算法利用用户与商品的历史交互序列关系,构造行为转移三维张量,基于用户的转移概率,为每个用户构建商品偏好的偏序关系,最后利用贝叶斯Ranking优化算法进行张量分解,将用户和商品映射到高维空间,生成用户和商品的潜因子向量,通过用户和商品的潜因子向量内积预测用户对商品的喜好程度.利用Book Crossing数据集进行实验,实验结果表明,相比于传统的推荐算法,本文提出的SRBPR算法在准确度上提升了26%,在20%的训练样本,0.93%的数据稠密度上,SR-BPR算法RMSE误差率相比于传统算法降低了11.23%.
  • 熊小兵,杨荣
    2018, 39(7): 1565-1568.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对一些复杂应用,有时需要从大量候选 Web 服务中选出符合需求的原子服务,并组合成增值的服务。 在过去的几年时间内,涌现出了很多关于服务组合的研究.然而,所有这些研究,几乎都没有涉及到服务QoS的相关性,但在现实生活中服务之间的QoS相互关联非常普遍,正如商品的捆绑销售,捆在一起的商品可能在价格属性上非常优惠,有时可能赠送.在此研究背景下,本文首先提出了服务筛检准则;接着借鉴CKY(Cocke-Kasami-Younger)算法,本文介绍了服务流程片段的存储和处理过程;最后,本文通过effectiveness和efficiency评估实验,验证了本文提出的SC_CKY方法的可靠性和高效性.
  • 温梦娜,杨金锋,
    2018, 39(7): 1569-1573.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于光在生物组织内部会产生严重衰减,手指静脉特征的图像质量往往较差,这十分不利于实现静脉区域的稳定分割.为了较为精确地获取手指静脉网络,本文提出了一种新的基于卷积神经网络的手指静脉区域分割方法.首先,利用韦伯定律去除光照变化实现对手指静脉图像的增强.然后,通过自动粗略标注静脉区域与非静脉区域,获得带有标签的像素训练集.利用训练集,训练一个可产生像素属于静脉区域和非静脉区域概率的卷积神经网络模型.最后,利用概率图,通过概率运算实现对手指静脉图像的分割.实验结果表明,通过该方法能够得到较为理想的静脉网络.
  • 张美玉,项小雨,姜晨,简琤峰
    2018, 39(7): 1574-1578.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    如何在存在噪声和类肤色背景的环境中进行高效精确的手部检测,是手部检测研究的一大问题.提出一种基于改进ACF的检测方法.该算法在基于多色彩空间肤色模型和边缘直方图基础上对ACF特征进行改进,以多色彩空间肤色模型来突出肤色物体与非肤色物体之间的差异,以边缘直方图来描述物体间的边界信息.同时为提高算法性能,对物体检测算法框架进行了改进.一方面改进特征计算过程,对于每个图像只进行一次特征计算;另一方面利用Edge Boxes获取候选窗口,以此减少候选窗口的数量.最后使用Xgboost对每个候选窗口对应的特征进行判别.实验证明,在存在高斯噪声和受人脸干扰的情况下,该方法可以有效地进行手部检测.
  • 钟忺,王灿,钟珞
    2018, 39(7): 1579-1584.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着计算机应用和多媒体的不断发展与应用,数字图像变得越来越多,内容越来越丰富.如何在海量的图像数据中获得想要的和有用的信息也变得越来越重要.图像场景分类就是其中一种重要的技术.本文采用了基于独立子空间分析(ISA)网络模型的特征提取方法并结合空间金字塔匹配(SPM)模型和支持向量机(SVM)分类器实现对图像场景的分类.基于ISA(独立子空间分析)网络模型的特征提取方法是一种无监督学习方法,能够获取图像中结构化的特征基元,并在规则网格划分的策略下利用所得的结构化的特征基元获取图像块描述子.然后结合空间金字塔匹配(SPM)模型构建金字塔结构式的整幅图像特征表示.实验在Scene15图像场景数据集的基础上进行,并将本文方法与基于尺度不变特征转换(SIFT)特征提取方法的几种常用经典方法进行对比实验,实验结果表明本文方法在选取了合适的特征基元个数后,提高了提取图像特征的速度和时间以及图像场景的分类准确率.
  • 罗源,张灵,陈云华,曾碧,姜文超
    2018, 39(7): 1585-1589.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对单幅表情图像识别缺乏表情间关联性及单分类器的局限性问题,提出一种基于反向协同显著区域特征的人脸表情识别方法.该方法首先对数据库进行预处理,获取表情图像的纯人脸区域,再选取相同的人七张不同表情图像,利用反向协同显著区域算法对选取图像提取表情之间的变化区域并作为显著区域,然后利用纹理和形状特征对显著区域进行描述,最后采用多分类器决策机制进行分类.在JAFFE和CK人脸表情库的实验结果表明,该方法在降低特征维度的同时,能挖掘出表情的显著区域部分并能对表情进行有效的描述,与其他近似的人脸表情识别方法对比,识别率平均提高了2.5%.
  • 陈广胜,陈守玉,景维鹏,李超
    2018, 39(7): 1590-1595.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对高分辨率遥感影像像素级分类任务中的样本不均衡与召回率低两个问题,提出基于遗传算法和全卷积网络的分类方法.该方法通过遗传算法对训练数据集进行取样,同时结合全卷积网络,对高分辨率遥感影像进行基于光谱空间语义特征的分类.实验结果表明,在影像像素级分类问题中,使用遗传算法均衡化取样的全卷积网络分类器相较标准卷积神经网络分类器,对不同类别样本的分类精度普遍较好;相较标准全卷积网络分类器,能够更加均衡地训练每一类样本数据,进一步提升召回率,解决样本不均衡所带来的问题,并最终达到89.4%的加权平均召回率,增加了遥感影像分类器的性能,减少了作业中的人工干预程度.
  • 刘骊,郑源野,付晓东,刘利军,黄青松
    2018, 39(7): 1596-1601.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目前多目标服装图像存在复杂的背景以及遮挡,导致分割准确率较低的问题,提出一种多目标服装图像的协同分割方法.首先结合辅助数据集提取输入的多目标服装图像的显著区域特征,并对多目标服装图像进行初步分割.然后,对初步分割结果、包含同类对象的小型图像集构建可能区域图结构,并进行协同分割,得到候选多区域服装特征;最后,通过多区域服装特征之间的相似度计算以及共同对象分割,输出图像分割结果.实验结果表明,该方法具有较高的效率和准确率,能有效分割出多目标服装图像.
  • 吴敏,王凯,姚辉,杨樊,张翔
    2018, 39(7): 1602-1607.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有算法对光照变化敏感、非连续区域与纹理区域易出现误匹配的问题,本文提出了一种多特征融合的匹配代价与视差优化算法.该方法首先分两阶段计算匹配代价,第一阶段联合使用三种特征:颜色特征、WCCT特征、LBP特征.基于上述三种特征的互补性,通过加权融合计算初始匹配代价;第二阶段使用SIFT特征代价修正初始匹配代价.然后,使用改进最小生成树聚合匹配代价与初始视差图计算.最后,使用置信度聚合与传播策略进行视差图优化,得到高质量的视差图.实验结果表明,在多种复杂场景中,该算法都能够提高立体匹配精度.
  • 喻一凡,曾道建,李峰,周书仁
    2018, 39(7): 1608-1615.
    摘要 ( )   可视化   收藏
    由于渡船检测过程中,船只的形状与尺度会不断发生变化,所处的动态背景环境也比较复杂.为实现对渡船准确而快速的检测定位,提出采用基于线性回归的方法,根据对渡船进行初定位所得检测框与真实框(ground truth)之间的偏置信息进行回归训练,进一步调整检测框的位置,实现精确定位;另一方面利用上下文帧间信息,采用序列NMS重打分步骤进行置信度分数调整,减少错漏检问题.实验结果表明,经过线性回归与序列NMS重打分后的检测结果在保证实时性的基础上,提高了检测的准确率.
  • 周先春,许瑞,石兰芳
    2018, 39(7): 1616-1620.
    摘要 ( )   可视化   收藏
    由于人脸库中人脸样本的数目有限,远远不能够满足实际生活中人脸识别的需要.新算法提出一种新的多样本扩充的协同表示分类人脸识别算法,首先利用人脸的镜面性生成镜面图像,分别对同一类中任意的两个原始样本与镜像样本,取它们的平滑中值样本构造新的虚拟样本,然后用欧式距离选择出接近测试样本的训练样本.以往的多样本扩充的人脸算法,是将新生成的虚拟训练样本与原始训练样本结合在一起,作为总的训练样本进行人脸识别,新算法是将不同途径构成的训练样本分别进行参数加权融合,采用基于协同表示的分类算法进行人脸识别.实验结果表明,新算法能够在ORL和FERET人脸数据库上获得更好的人脸识别率,具有较好的人脸描述能力.
  • 巫锦铭,程光权,刘忠,黄金才,王琦,罗志浩
    2018, 39(7): 1621-1626.
    摘要 ( )   可视化   收藏
    车辆路径规划问题(VRP)是一个具有现实意义的著名问题.本文提出了一个新颖且在生活中常见的VRP拓展问题,在该问题中客户有自己的道路网络,这些道路是车辆无法行驶的,而且和正常车辆行驶的道路网络共享几种常见的节点.在这种情况下,VRP的任务就转化为一个依赖于车辆和客户方之间信息共享机制的协同运输问题.我们研究的核心目标是当上述情况发生或要满足某些客户的特殊需求时能为提供服务的公司及客户推荐一个最佳的路径规划.为此我们设计了一个改进型遗传算法,显著地优化了我们的实验结果.实验结果表明,本研究能对这个新颖的VRP拓展问题进行很好地求解.
  • 李国,吴长锋,王家亮,王怀超
    2018, 39(7): 1627-1632.
    摘要 ( )   可视化   收藏
    针对机场货站货物信息采集系统中数据传输的可靠性低、实时性弱和丢包率高等问题,提出了一种面向机场货站货物信息采集的WSN拥塞控制调度方法.首先为避免网络拥塞的发生,该方法采用基于滑动窗口的分组控制思想限制分组的大小,并根据机场货站采集的信息类型不同,动态赋予不同优先级,优先发送缓存队列中优先级较高的分组.若根据动态拥塞预测机制判断出拥塞即将发生,即采用基于“垂面”距离的TOPSIS法正交投影法构建选择模型,选择合适的下一跳节点建立分流路径,缓解节点拥塞问题.相关实验结果表明本文算法可较好的应用于机场货站信息采集传输系统中,有效提升和确保信息传输的可靠性和实时性,降低信息传输的丢包率.