过刊目录

  • 2018年, 39卷, 第5期
    刊出日期:2018-05-01
      

  • 全选
    |
  • 程世文,裴丹,王长进
    2018, 39(5): 865-870.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    互联网内容提供商在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将相应的大量错误日志经过聚类后及时反馈给相应的研发人员是排除问题的首要因素.为了有效解决海量非规范的错误日志的聚类问题,本文提出互联网软件错误日志聚类方法.该方法通过引入日志模板提取、日志压缩方法降低日志规模;通过引入计算文档频率提取特征词方法提高聚类准确性并降低数据维度;结合Canopy聚类和Kmeans聚类算法提升聚类效果.通过在某互联网公司运维中实际系统的检验,本文提出的方法不但具有比较理想的聚类效果,而且满足生产环境中的性能要求.
  • 张宇飞(,),沈瑶(,),杨威(,),肖汉(,),黄刘生(,)
    2018, 39(5): 871-876.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    提出一种基于BP神经网络模型的网络时序型隐信道检测方法.该方法将已有检测方法对隐信道的识别能力和神经网络的特征学习能力相结合,克服了已有算法中单一阈值判定标准对于非线性分类场景中的局限性,使已有检测算法对于不同网络环境具有更强的适应性.本文首先简要介绍了目前已有的几种时序型隐信道和时序型隐信道检测算法的相关情况;然后给出基于BP神经网络的时序型隐信道检测模型的体系结构设计,详细介绍检测模型中BP神经网络部分的结构设计;最后,设计实验评估检测模型的性能.通过实验证明,借助于BP神经网络模型擅长处理非线性分类问题的特点,本文提出的检测方法具有检测率高、对于不同网络环境的适应能力强、具有一定的智能和学习能力的优点.
  • 沈专,白光伟,沈航
    2018, 39(5): 877-882.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在无线网络环境中,针对基于云游戏的客户端丢帧现象而导致服务质量差的问题,提出一种云游戏中基于帧率控制的FEC(Forward Error Correction)补偿策略.该策略首先提出帧率控制算法使运行在同一个GPU上的游戏满足服务等级协议(Service Level Agreement)并满足FEC编码所需的视频帧;在保证足够帧率的基础上,提出FEC补偿算法来弥补恢复客户端丢失的帧,该算法能够根据客户端的网络状况来调节冗余包的数量,从而节约带宽,并且保证丢失的源数据帧可从冗余数据中修复.实验结果表明:该策略能够解决由于丢帧所引起的花屏、卡顿等问题,同时提高了云游戏服务质量;并且能够充分利用GPU资源,为云游戏运营商节约了成本.
  • 程珍,赵慧婷,林飞,雷艳静
    2018, 39(5): 883-887.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    扩散的分子通信模型是一种很有前景的纳米级通信典范.由于分子在生物环境中的随机性行为以及考虑发送方纳米机器在前面所有时隙释放的分子对当前时隙的码间干扰,分子通信容易遭受较高的不可靠性和较长的时延.因此,研究扩散的分子通信模型的多跳可靠性和时延显得尤为重要.首先,得到了扩散的分子通信模型在单链路及多跳链路场景下的可靠性和时延的数学表达式,并利用重传机制保证失败链路信息的可靠传输.其次,通过实验仿真结果展示了不同的参数,包括每个时隙发送的分子个数、生物环境的扩散系数以及两个纳米机器之间的距离对可靠性和时延性能的影响.最后,分别与基于病毒的分子通信模型和不考虑码间干扰的分子通信模型相比,在相同的通信场景下,扩散的分子通信模型达到相同的可靠性所花费的时延开销大大降低.
  • 杜威(,),林浒,孙建伟,于波,姚恺丰
    2018, 39(5): 888-892.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    音乐分类在音乐信息检索中占据重要地位,自动的音乐分类方法可以在降低花费的同时取得良好的精准度.传统的平面型音乐流派分类方法主要从全体数据集出发使用若干特征作为分类依据,导致分类效果并不太好.本文考虑了音乐文件本身的属性,结合统计学方面的特征,提出了基于分层结构的分类方法.该方法首先使用KMeans聚类方法以分析不同类别间的关系,并构造类别层次关系图,在此基础上使用支持向量机方法进行分类,通过使用不同的特征集合,保证了分类的准确率.该方法在GTZAN数据集上进行了相关实验,实验结果表明本文所提出的方法能够取得较好的分类准确率.
  • 秦怡,杨云,闵玉涓,姚明,赵晶晶
    2018, 39(5): 893-898.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    IPv6具有128位的地址长度、无分类编址,这使得IPv6网络中的核心路由器路由查找处理负担更重、要求更高,已有的基于IPv4的路由查找算法扩展到IPv6后无法适应新的需求,需要建立新的基于IPv6的路由查找算法.在分析了IPv6地址前缀长度和分布特点的基础上,提出一种哈希表和多比特Trie(retrieval)相结合的IPv6路由查找算法.算法首先根据地址前缀值来进行分类,然后针对常用的地址前缀值,以48比特为路由查找起点,分阶段、高效的进行路由查找,对于非常用的地址前缀值采用直接哈希查找.算法仿真表明,在大多数情况下,只需要一次存储器访问,就能查找到下一跳路由信息,算法查找效率高.算法结构简单,易于硬件实现.
  • 宋成,张明月,彭维平,刘志中,贾宗璞,闫玺玺
    2018, 39(5): 899-903.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对当前车联网匿名认证方案安全性和效率的问题,利用椭圆曲线密码体制密钥短、速度快和安全性能高等优越性,提出一个安全高效的车联网批量匿名认证方案.通过路侧单元(RSU)与车辆共同生成签名,从而进一步减轻可信中心的负担.通过分析表明:该方案不仅能解决隐私保护、不可链接性、抗中间人攻击、抗合谋攻击、前向和后向安全、抗重放攻击等多种安全问题,而且在计算复杂度和通信复杂度方面也存在明显优势,具有更高的认证效率.因此,该方案在计算性能受限的物联网环境中,具有重要的理论意义与应用价值.
  • 周健(,),孙丽艳,陈红琳
    2018, 39(5): 904-909.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    身份对等的群组密钥管理方案不适用成员异构、链路状态非可靠的星内集群自组织网络.针对该问题,提出一种基于K级门限密钥(tk,t(k-1),..,t0,n)的自治群组密钥管理方案,通过多级共享的方式使得高层的密钥碎片被多个解密密钥共享,成员根据自身空间属性选择密钥碎片,满足安全管理的异构性.同时,在群成员加入和退出中,具有密钥独立性的密钥更新操作保证非更新成员密钥碎片的合法性,非更新成员无需与更新成员交互,密钥更新效率与网络规模无关,解决密钥更新1affectn问题.因此建议的方案,在安全性上具有抗合谋攻击、前向/后向安全性;在效率上容忍非可靠端到端链路,减少交互延时.
  • 陶志勇,王和章,刘影
    2018, 39(5): 910-917.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    能量利用率;大规模;泊松混合模型;角度
  • 陆芳,李建波,宋有美,王夫沭
    2018, 39(5): 918-923.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    容延/容断网络(DTN)具有间断连接、时延高和节点缓存受限等特点,因而其路由策略面临巨大的挑战.为了提高容延网络的消息投递率,本文利用位置信息和相遇信息来选择下一跳节点,并基于此提出了受控传染路由算法LPDR.该算法在消息源节点和中继节点上采取不同的策略.在消息源节点上运用局部位置信息,利用节点的局部位置信息来控制消息的扩散范围.在中继节点上,综合利用多种效用信息筛选出最优的节点进行消息复制,从而更好地控制了消息的冗余.仿真实验表明在基于Random Waypoint节点移动模型的网络环境中,与LCEpidemic、Epidemic、Prophet相比,LPDR的消息投递率最高,平均跳数最少,网络负载比LCEpidemic和Epidemic分别低约25%和15%.
  • 陈健康,张昱
    2018, 39(5): 924-929.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着多核处理器的普及,大量基于共享地址空间的虚拟内存密集型多线程程序被开发出来.这类程序的一个重要特征是存在频繁的地址空间操作,例如 page faults 、mmap.为了保证并发地址空间操作的正确性,操作系统使用一个全局读写锁来同步,然而却导致在高并发时因多个线程竞争该锁而使这类程序性能下降.为了解决该问题,本文提出了一个基于隔离地址空间的线程模型PMthreads,可以完全消除线程在该读写锁上的竞争.通过自定义字符设备驱动轻量级更改Linux内核中进程的全局数据区域以及实现IAmalloc堆分配器,PMthreads可以保持线程共享变量.此外,PMthreads采用Pthreads接口以支持现有的Pthreads程序.在32核机器上,本文使用5个应用进行性能评估,实验结果表明:对于虚拟内存密集型应用histogram和dedup,在32线程时PMthreads相对于Pthreads性能提升了2.17倍和3.19倍;在16线程时,非此类应用的linear_regression也因削减假共享带来了8.15倍的性能提升.
  • 罗圣美(,),陆游游,秦雄军,杨洪章,张佳程,舒继武
    2018, 39(5): 930-937.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分布式文件系统的元数据性能是制约系统整体性能的关键瓶颈.尽管固态盘(Solid State Drive,SSD)提供高速的数据访问,但是由于元数据呈现粒度小、更新频繁的特征,SSD的性能表现仍然较差,同时导致寿命损耗加速.基于SSD存储介质的写入特性,提出了面向分布式文件系统元数据的数据管理机制和更新方法,包括元数据内存页面的重新组织和管理、多次变化数据的迭代更新、元数据写入方式的进一步优化等.所提方法减少了元数据更新的写入频次和实际写入量,减少了随机写操作,提高了元数据写入性能.
  • 王铭,王立松,魏欧
    2018, 39(5): 938-943.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    软件产品线的特征选择通常在一个高维且高度约束的目标空间进行.采用多目标优化算法并借助约束求解器可以在满足时间空间要求下得出满意的配置方案.在评价最终解集时,满足所有约束条件的配置(即有效解)才是实际工程所需要的产品配置,这样有效产品率是评价产品最终解集的重要指标.在应用多目标遗传算法作为产品选择的优化搜素方式时,典型的变异交叉算子在很大概率下会引入新的约束违反项,特别地,经过交叉算子后有效解的合法性有可能会被破坏.本文通过设计基于特征树子树的新交叉算子,使得交叉算子环节不再引入新的约束违反项,实验表明这种方法能显著的提高最终解集的有效产品率,在超体积指标和有效产品率指标间找到平衡.同时本文还探讨了优先考虑约束违反目标的方法对提高产品有效率的影响,对环境选择算子进行了新的定义,使得环境选择过程优先挑选出约束违反项较少的个体,这种方法能得到很高的产品有效率.
  • 周泽人,李学俊,朱二周
    2018, 39(5): 944-950.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着无线通信技术的迅速发展以及个人通信需求的不断增长,频谱资源面临严重的短缺问题.与此同时,可用的频谱已基本被分配殆尽,新的频谱需求者难以获取合适的频谱资源.近年来,研究人员们提出了众多频谱拍卖方案以期解决该问题.然而传统的频谱分配方案虽缓解了频谱资源的短缺,却存在着用户的私密信息没有得到有效保护和保护措施不完善等等问题,用户的隐私安全得不到有效保障.为解决此问题,有机结合了同态加密和加密电路技术,提出了一种安全且高效的频谱拍卖方案.仿真实验结果表明,方案能够在较少的计算和通信开销的前提下,形成对用户隐私信息的较高安全保证.
  • 张欣,刘学军,李斌,郭汉
    2018, 39(5): 951-956.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对以套取广告费为目的、实施恶意点击欺诈的不法发布商检测问题,提出一种基于支持向量机(Support Vector Machine,SVM)集成方法的点击欺诈检测系统.该系统首先对几百万条原始点击数据进行一系列数据清洗、整理和统计特征计算等数据预处理,之后利用随机欠抽样(RUS)与合成少数类过抽样技术(SMOTE)相结合的方法处理非平衡数据集得到多个平衡数据集,在每个平衡数据集上分别利用Boosting算法对训练得到基支持向量机迭代生成多个强分类器模型,最后再将多个强分类器以投票方式进行集成得到最终的检测模型.在真实点击数据上完成对广告发布商的点击欺诈检测,实验结果表明,该方法对点击欺诈有良好的检测性能,其检测准确度在90%以上.
  • 武丹凤(,),于思淼,曾广平,张锐文,王乙晴,陈强
    2018, 39(5): 957-966.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大规模网络结构化多Agent系统(Networked Multiagent Systems,NMAS) 在分配任务时,需要考虑 Agent的能力、Agent 在底层物理网络中的位置和彼此之间的实际通信耗费、Agent 在交互网络中的位置和彼此之间的交互距离,因此,任务分配实现难度相对较大.已有的任务分配模型没有有效考虑NMAS底层物理网络拓扑结构和社会组织结构的作用,对NMAS的任务分配协商过程缺乏深入研究,系统中横向通信密集,且 Agent 社会关系资源不能充分利用.针对此类问题,本文以最小化系统的任务执行时间和通信开销为目标,研究了分布式的基于动态综合关系网的任务分配模型(Dynamic Integrated Relationship Network Model,DIRNM).模型包括三个部分:基于物理能力和社会关系资源提供力的任务承包方选择策略、基于动态综合关系网的任务分配协商过程和基于直接社会关系资源的任务再分配机制.对比实验结果表明,所提出的DIRNM在降低任务执行总时间和通信开销、提高任务分配成功率方面具有显著优越性,对网络结构动态变化具有鲁棒性.
  • 李剑锋(,),陈世平(,),段林茂,钮 亮
    2018, 39(5): 967-972.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    移动互联时代,基于地理位置的移动应用程序产生了海量的空间数据.为了管理这些海量的多维数据,产生了各种云数据库管理系统.然而移动用户产生的空间数据通常不是均匀分布的.本文提出了新的多维索引HPRindex.多维索引HPRindex用桶PR四叉树来构建基本索引结构,通过Hilbert值来快速定位数据.设计了新的空间范围查询、插入和删除算法.HPRindex可用于在云数据管理系统如Cassandra上执行范围查询等操作.实验结果表明,多维索引HPRindex具有的较好的查询效率,尤其是在空间数据偏斜的情况下.
  • 张霄宏,侯海杰,任建吉
    2018, 39(5): 973-977.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着信息技术的蓬勃发展,移动社交网络越来越受到人们的关注,尤其是对移动社交网络中的热点分析.以基于DevicetoDevice技术构建的移动社交网络为研究对象,从网络规模、文件分享特征以及用户影响力等方面入手,提出一种预测该类社交网络中热点文件的方法.该方法从信息和用户的角度出发,通过量化文件重要性、文件敏感性、用户参与力和用户影响力四个指标,利用多元线性回归方法建立预测模型,并在真实数据上验证了方法的有效性.
  • 彭云,万红新,钟林辉
    2018, 39(5): 978-985.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着商品评论文本数据的日益增加,需要利用情感分析技术来自动实现商品的情感极性分类,尤其是细粒度的情感分类.LDA主题模型可以实现大规模文本数据的主题词提取,并利用主题聚类功能发现特征词和情感词之间的潜在关系,但LDA模型倾向于提取粗粒度的情感分类知识,难以满足细粒度情感分析的语义需求.本文提出了一种语义弱监督的主题模型,在LDA模型中嵌入词语关联、全局特征词及主题情感隶属语义先验知识来提升LDA对特征词、情感词及其关系的识别能力.主要研究内容包括:从句法分析、词性关系和语境相关等角度进行词语关联语义约束的提取;全局特征词识别和主题情感隶属两类语义约束的获取;设计语义约束对LDA主题分配的影响机制,构建语义弱监督的细粒度情感分析主题模型SWSLDA.实验表明,SWSLDA模型可以改善LDA的语义理解能力,提高局部特征词和局部情感词的提取率,提升主题模型细粒度情感极性分类的准确性.
  • 王文乐,龚俊,曹重华,曹远龙,陈洪琪,柯胜男,涂珍
    2018, 39(5): 986-990.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    抢占式实时任务调度,其任意抢占会浪费系统资源而影响调度性能;有必要尽量减少任务间的无效抢占.针对软实时任务的特点,提出一种基于抢占阈值的动态调度策略PTSTDS.首先,PTSTDS策略考虑软实时任务的空闲时间和价值密度,提出综合两者的优先级构造函数.其次,PTSTDS策略根据任务的响应时间和任务间的抢占关系,确定任务的抢占阈值.通过设置任务抢占阈值减少较低优先级任务被抢占的机率,以提高整个系统任务间的有效抢占和执行完成率.实验证明,在软实时系统环境下,PTSTDS策略能够有效提高任务成功率、减少软实时任务的延迟时间,并提高系统总收益.
  • 陈磊,李俊
    2018, 39(5): 991-994.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本分类的效果依赖于文本特征选择的好坏.传统的特征选择方法,利用特征的词频或者特征与类别的关系,进行特征选择.不仅没有考虑特征的语义,而且大多只能用于标注数据集的特征选择.本文提出LDA词向量特征选择方法和Word2vec词向量特征选择方法,分别在主题空间和词语上下文关系上,学习特征的语义,进行特征选择.语料经特征选择后,利用向量空间模型进行分类.在复旦语料上的实验结果表明,基于词向量的特征选择分类效果相对于传统的特征选择得到了改善.并且,基于词向量的特征选择是一种无监督的方法,无需标注类别信息.
  • 翟社平,郭琳,高山,段宏宇,李兆兆,马越
    2018, 39(5): 995-999.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了适应Web数据信息高度动态化的发展趋势,针对知识图谱的补全更新实时性欠佳的问题,提出一种知识图谱补全的链接预测方法.该方法运用贝叶斯网络概率推理图模型优势并结合本体推理规则,对知识图谱节点间依赖程度进行定量分析,旨在充分挖掘模型潜在因素,实现正确预测.实验结果表明,该方法能有效提升知识图谱的链接预测效率,保证较高的预测准确度,并及时更新知识图谱.
  • 郑诚,王波,洪彤彤
    2018, 39(5): 1000-1004.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于现实中的数据集存在着大量的冗余属性,因此需要对它们进行属性约简.针对传统的属性约简算法不能很好的处理动态变化的数据集,本文运用关系矩阵的形式去表示信息系统的知识粒度,并研究了当数据集属性发生变化时,通过矩阵的视角来展示知识粒度的变化机制,根据这种机制可以快速地对知识粒度进行更新,从而提出了一种基于知识粒度的增量式属性约简算法,在UCI数据集的实验结果中,所提出的算法能够对动态变化的数据集选择出小而优的属性子集,并且有着较高的约简效率,从而验证了该算法的优越性.
  • 李鼎宇,胡学钢
    2018, 39(5): 1005-1009.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    短文本广泛地出现在微博、评论等实际应用领域,其特征的高稀疏性给跨领域学习过程中共享信息的提取带来极大的挑战.为此,本文提出了面向短文本的跨领域情感分类算法.该算法基于谱图理论和特征间的共现,采用两层谱聚类依次对两个领域的共享特征和特有特征进行相似极性的特征扩展并补充到文本中,以降低短文本数据的特征稀疏性以及领域间数据分布的差异性.最后,在扩展后的数据集上训练分类器进行情感分类.实验表明,该算法可以有效提高跨领域短文本的情感分类准确率.
  • 徐华,程冰
    2018, 39(5): 1010-1015.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对以最大完工时间最小化为目标的柔性作业车间调度问题(Flexible job shop scheduling problem,FJSP),提出一种混合遗传蝙蝠算法(HGBA).为了提高初始种群的质量与多样性,采用三种方式相结合产生初始群体;重定义惯性权重,采用动态递减的权值来平衡局部搜索与全局搜索;针对算法易陷入局部最优解的缺点,结合遗传算法的变异操作,提出一种基于变异操作的邻域搜索算法;同时根据编码方式以及位置更新可能造成的无效解情况,利用遗传算法的交叉操作提出混合列交叉方法来完成位置更新;最后,通过三个实例测试了算法的性能,实验结果验证了提出的算法在求解FJSP时的有效性.
  • 何伟,胡学钢,李磊,林耀进,李慧宗,潘剑寒
    2018, 39(5): 1016-1020.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现实世界中的网络往往会随时间推移逐渐改变,社团演化预测通过分析动态网络数据判断社团的发展趋势,对于理解复杂网络演化规律及其应用具有重要意义.社团演化特征构造从历史数据中提取社团结构、时序特征用于预测,其是否准确刻画社团特性直接影响预测结果准确率,是研究中的关键问题.本文提出一种基于多元特征构造的社团演化预测方法,从动态网络中提取社团的结构(微观、介观、宏观)、时序、行为特征,并采取针对多重长度演化链的集成方法进行分类.在两类实际数据集上进行的实验表明了该方法预测准确性优于已有研究.
  • 高丹,彭敦陆,刘丛
    2018, 39(5): 1021-1026.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统文本实体关系抽取算法多数是基于特征向量对单一实体对语句进行处理,缺少考虑文本语法结构及针对多对实体关系的抽取算法.基于此,提出一种基于CNN(Convolutional Neural Network)和改进核函数的多实体关系抽取技术—KMCNN(MultiEntity Convolutional Neural Network Based on Kernel),并将所提技术运用于海量法律文书的实体关系抽取上.KMCNN从抽取大规模历史法律文书的人物关系出发,构建短语有效子树,采用基于改进的核函数来计算短语有效子树的相似度,以实现运用CNN算法对多对实体关系进行挖掘的目标.在真实数据集上的实验表明,所提技术具有较好的抽取效果和较高的计算效率.
  • 余琴琴,彭敦陆,刘丛
    2018, 39(5): 1027-1032.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,大多数文本特征抽取算法是针对特征词集进行抽取的,由于文本数据量大,且内容描述具有多义性和复杂性,以词为单元的特征抽取结果通常存在歧义.为了解决该问题,论文首先将文本生成词序列,综合考虑了词语在词序列中有序性、可重复性和同义性,利用加权关联规则挖掘方法,对频繁词集进行组合生成特征短语.为提高计算效率,针对大规模文本数据特征短语抽取问题,采用MapReduce计算思想对所提算法进行了扩展.实验表明,该算法具有较高的运行效率,而且可以获得较为准确的特征短语.
  • 张涛,李和合,曹海兰(,),刘梦奇
    2018, 39(5): 1033-1037.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    形式背景表示是形式概念分析领域的研究热点之一,而增量式形式背景表示是增量式计算的表示基础.本文针对增量式表示的需要,将属性拓扑概念进行拓展,形成对象拓扑表示.并以对象拓扑为基础,通过分析新增对象对原有结构的影响,构造拓扑坍缩的表示方法.拓扑坍缩突出了新增对象与原结构之间的关系,对数据增量与存量间形成了明确的指向性,从而简化形式背景的增量式表示.实验表明,与原始对象拓扑相比,经过坍缩后的对象拓扑结构简单,易于后期计算.融入拓扑坍缩表示后的增量式概念计算速度得到了不同程度的提升.
  • 邹晓红,郭景峰(,),贺释千(,),陈晶,刘院英
    2018, 39(5): 1038-1045.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate SubGraph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性.
  • 李维娜(,),任家东(,)
    2018, 39(5): 1046-1051.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    互联网模式下,软件之间的交互日益频繁,具有交互特征的软件逐渐形成群体,其个体行为不断地影响着群体的特性.频繁模式挖掘是发现关联规则的一种重要技术,软件交互行为频繁模式对软件的安全性稳定性分析起着至关重要的作用.因此,从软件群体交互的角度提出了一种频繁模式挖掘算法SGFIP.首先,定义了软件群体,构建基于时间段滑动的交互序列挖掘模型;其次,定义了一种基于时间段及交互次数的序列权重,提升了交互模式的兴趣度.第三,定义了约束系数,在预定义的滑动时间段内挖掘得到针对性更强、实时性更高的交互模式.最后,实验结果验证了交互模型的可行性,SGFIP算法的时间消耗在一定程度上优于先前算法,并且精简了先前算法的挖掘结果,提高了挖掘精度,高效地挖掘出了软件群体中的频繁模式.
  • 梁绍宸,徐苏平,窦慧莉,李洪梅,杨习贝(,)
    2018, 39(5): 1052-1057.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在多标记学习中,因为不同的标记拥有与其自身紧密相关的特性,所以可以利用LIFT策略来处理多标记问题,其过程包含两个步骤:首先根据不同标记构建类属属性,然后在类属属性空间上进行分类.然而由于利用LIFT所构建的类属属性维度较高,会致使分类模型训练变慢或泛化能力不足.为解决这一问题,借助传统与稳健的模糊粗糙集模型,提出了对类属属性空间进行特征选择,并在此基础上利用模糊粗糙分类器进行多标记预测的模糊粗糙LIFT方法.实验结果表明,新算法不仅可以有效地降低类属属性空间维度,而且在压缩后的类属属性空间中,分类性能将有所提升.
  • 吴正江,陈如校,张霄宏
    2018, 39(5): 1058-1062.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大规模数据分类时借鉴了大量小规模数据分类的思想,但需要解决两个问题:大规模条件下算法收敛速度及准确性问题.BP算法(反向传播算法)以其良好的非线性逼近能力、泛化能力以及实用性成为了人工神经网络训练算法中应用最为广泛的算法同时使用BP算法训练易陷入瘫痪,收敛速度较慢,算法易陷入局部极小值,造成网络的正确率低下的问题.为了将BP算法用于大规模数据分类问题,本文通过引入Adaboost算法,并对其进行改进以适应BP神经网络在大数据量情况下的应用,改善其性能.基于SPARK平台的实验表明,本文提出的算法具有良好的并行加速性能,且具有较高的分类准确率.
  • 王飞,张楠,童向荣
    2018, 39(5): 1063-1067.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传播路径是社交网络谣言传播动力学的重要研究内容,定义传播路径的特征参数并研究各参数在谣言传播中的作用是十分重要的.基于控制理论知识,通过引入静态增益K、时间常数T与纯迟延时间τ,研究了谣言传播路径的动态特性,提出了基于一阶惯性环节、一阶惯性环节加纯迟延和n阶惯性环节加纯迟延的三种谣言传播路径模型,进行了理论分析和仿真.通过与基于复杂网络理论和基于复杂适应系统理论的谣言传播研究方法进行比较,提出的新方法直观地解释了谣言传播中传播路径的影响.仿真结果验证了模型的有效性.
  • 王星,于江旭,唐晓亮,闫慧斌
    2018, 39(5): 1068-1073.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    哈希算法在大规模的数据检索中得到了越来越广泛的应用,但目前无论是基于学习的哈希还是基于随机投影的哈希都是为静态数据集设计的,无法对动态的数据库或者动态的网页进行近邻搜索.为了解决这一问题,本文提出了基于在线k均值聚类的密度敏感哈希算法ODSH (Online Density Sensitive Hash).首先给出了固定聚类个数的在线k均值聚类公式;然后,根据在线k均值聚类量化后数据簇的表示点来划定超平面,并根据动态超平面推出该哈希算法的哈希函数以及对应的投影向量;最后根据投影向量划分的数据集求得各投影向量的信息熵值,根据其大小选出最合适的投影向量,并通过投影向量对数据集进行映射来获取对应的哈希编码.实验结果表明,与局部敏感哈希、谱哈希等哈希算法相比,本文算法在准确性和效率上均具有一定的优势.
  • 田汝佳,蒋林,邓军勇,张雪婷
    2018, 39(5): 1074-1078.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对嵌入式设备图形处理器(GPU)在实现高性能、高质量图形效果时存在自身资源的限制,为了提高硬件资源复用及提高嵌入式GPU的灵活性,提出一种可重构视口变换单元的并行化设计方案.该方案采用16个轻核处理元(Processing Element)构成的可重构阵列结构,通过重新配置PE的功能,可根据实际需求动态获取图形算法,以较低运算成本灵活地实现视口变换算法.基于Xilinx XC6VLX760 FPGA(现场可编程门阵列)完成了原型系统设计,电路工作频率可达110.09MHz,可重构方法与专用硬件相比,性能相当且更具灵活性.
  • 杨洋,滕游(,),商明将,朱威(,)
    2018, 39(5): 1079-1084.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    运动目标检测是智能视频分析的一个重要环节,现有的检测方法主要是在像素域中进行处理,存在计算复杂度高、检测目标不完整等问题.提出一种HEVC压缩域的运动目标检测方法,利用HEVC在编码过程中产生的运动矢量、划分结构、编码模式等编码信息,首先对运动矢量进行预处理得到运动矢量幅值图,然后利用编码划分结构和编码模式在空间域上对运动矢量幅值进行滤波以及更新Intra编码块的运动矢量幅值,接着对运动矢量幅值图进行膨胀和时间域的滤波,最终得到运动目标.实验结果表明,本方法大幅地降低了计算复杂度,并具有良好的运动目标检测效果.
  • 李志欣,李艳红,张灿龙
    2018, 39(5): 1085-1091.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对图像当中的不同对象,各种特征的优势各不相同,彼此之间存在互补现象.因此,提出一种多特征融合的图像场景分类方法.首先分别提取图像的GIST特征、SIFT特征和PHOG特征;然后将SIFT特征进行局部约束线性编码,并基于空间金字塔模型进行最大池化生成稀疏向量表示;接着采用串联的方法将GIST特征、SIFT特征稀疏向量表示和PHOG特征进行特征融合;最后将融合特征与类标签信息一起输入到线性SVM进行分类.多特征融合的图像场景分类方法,充分考虑了各个特征之间的优势以及图像原有特性和单词空间分布,能够有效的达到特征互补.实验结果表明,与其他分类方法相比,该方法具有较好的分类性能.
  • 罗强(,),吴俊峰(,),于红(,),孙建伟(,),张美玲(,)
    2018, 39(5): 1092-1096.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对偏暗、低对比度图像视觉显著性图提取效果不理想的问题,提出一种基于改进的直方图均衡化的图像显著性图提取算法.作者通过分析发现某些偏暗、低对比度图像的视觉显著性图提取效果不理想的主要原因是由于图像背景与前景差异不明显导致的,因此本文提出采用直方图均衡化方法对图像的质量加以改善,并对传统直方图均衡化算法存在的曝光过度等问题有针对性的进行了改进,并以此提高图像前景与背景之间的差异,使得图像的显著区域更加突出,再对处理后的图像进行显著性图的提取.为了验证算法的有效性,本文在ASD1000数据集和LBE数据集上分别进行了仿真实验,实验结果表明本文提出的算法是有效的,并具有较高的鲁棒性和准确性.
  • 秦绪佳,柯玲玲,范颖琳,郑红波,张美玉
    2018, 39(5): 1097-1102.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    根据图像模糊产生方式的不同,研究人员将最为常见的模糊类型划分为离焦模糊和运动模糊两大类,而本文着重研究运动模糊的去除方法.在Krishnan和Fergus等人提出的基于超拉普拉斯先验的图像去模糊算法的基础上,本文给出了一种改进的基于超拉普拉斯约束的单幅图像去模糊算法.该算法主要分成三个处理步骤:在综合考虑图像边缘幅值和梯度的基础上,筛选出用于模糊核估算的图像子区域;对模糊核的稀疏性进行超拉普拉斯约束,快速且精确地估算出所需的模糊核信息;在对图像进行快速非盲反卷积复原阶段,原有的算法是用超拉普拉斯模型直接对图像梯度进行约束,而本文使用一种新的分布约束,从而生成了质量高,视觉效果好的去模糊图像.实验结果表明,本文算法可获得较好的图像去模糊效果,同时提高了去模糊算法效率.
  • 夏筱筠(,),林浒
    2018, 39(5): 1103-1107.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    过象限误差补偿对于提高工件的轮廓加工精度具有重要的意义,然而过象限误差的机理较为复杂,常规PID控制器及单模糊控制器对于该摩擦力的控制显得无能为力,本文采用了一种双模糊控制算法,针对不同的区间特性,施以不同的模糊参数进行控制,对于过象限误差控制,其控制效果明显好于常规控制器和单模糊控制器,显著提高了工件的加工精度.
  • 赵永彬,陈硕,刘明,王佳楠(,),贲驰
    2018, 39(5): 1108-1112.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    作为描述电网运营状态的重要依据,用户实时用电量数据在各时间段内的均值、方差及离散傅里叶变换(DFT)分量等统计变换结果是用电行为特征提取的重要建模参数.基于密度聚类的DBSCAN算法能够对空间内样本点进行更加准确可靠的类别划分.层次聚类的子域划分、域内聚类和聚类合并的过程为DBSCAN算法的分布式实现提供重要参考.根据DBSCAN算法中的密度参数,保留各子簇的边界特征样本,使子簇合并过程的计算效率进一步提高.以Spark为代表的分布式内存计算系统将数据处理的中间结果存入内存,降低读写开销,为大规模数据的迭代分析提供快捷高效的处理环境.实验结果证明,在内存计算系统中实现的分布式DBSCAN聚类算法能够准确高效的实现大规模用户用电行为分析.
  • 凌萍,荣祥胜,李雪
    2018, 39(5): 1113-1120.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    支持向量分类器的两种分类模型是超平面和超球体,前者在有重叠类别的数据集上表现不佳,后者存在过适应问题.为此,本文提出了双效分类思想,在训练分类器过程中同时学习类间差异信息及类内特征信息,以克服上述问题并提高分类性能.进而,提出了具体实现算法,支持向量双效分类器(DoubledInformed classifier based on Support vectors,DISV).DISV为各类生成收缩远离球,并基于此定义决策函数.收缩远离球的球面穿过类内密集分布区,并保持与其他类的最大远离.DISV辅以训练子集抽取策略和参数自适应调整策略以降低算法代价.实验表明,双效分类思想有效,其在心脏肥大数据集上的诊断结果优于同类算法.