过刊目录

  • 2019年, 40卷, 第5期
    刊出日期:2019-05-01
      

  • 全选
    |
  • 陈正勇,杨崇旭,姚振,杨坚
    2019, 40(5): 913-917.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了在移动流量需求不断增长的条件下提高用户体验,本文针对小基站网络提出了一种基于深度学习的移动感知预缓存策略.该策略采用条件变分自动编码器根据大量历史数据建立用户移动模型,然后预测用户将来可能经过的基站,并且在这些基站上预缓存用户正在下载的文件的一部分.本文定义了缓存效用用以评估缓存策略的性能.通过在真实GPS轨迹数据上的仿真实验,验证了所提出的缓存策略与典型对比策略相比能够为用户提供更高的平均下载速度,具有更大的缓存命中率,产生更大的缓存效用.
  • 胡健,陶丹
    2019, 40(5): 918-923.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    群智感知网络以移动用户携带智能感知设备(如智能手机)作为基本感知单元,通过有意识或者无意识协作实现大规模且复杂的社会感知任务.其中,感知质量优劣是决定群智感知应用成败的关键.群智感知所特有的用户泛在性、节点低成本、数据多模态等特点给感知质量度量与保障研究带来挑战.本文综述了该领域国内外的研究进展,着重分类讨论移动群智感知质量度量与保障的基本理论和方法,最后提出当前亟待解决的问题,并对未来的发展趋势进行展望.
  • 周媛媛,陈文龙,赵成安,唐晓岚,郭思聪
    2019, 40(5): 924-928.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    多径路由在链路负载均衡、提升网络利用效率等方面发挥了很大作用,但现有多径路由机制在实施灵活性等方面不够理想.本文针对互联网的出口流量进行优化控制,提出网络出口流量的多径路由处理机制(MET).在传统流量传输基础上加入二维路由元素,以此控制网络中外访流量的出口网关及路径的选择.并且,针对网络中发生频率较高的单链路、单节点故障问题,提出MET的改进方案:BMET,即通过预先为重要故障设置备份路径及路径切换点,实现备份路径的快速切换.经实验验证,BMET机制虽在内存消耗方面较MET有所增加,但是可以很大程度上减少重要节点及链路故障后的收敛时间.
  • 李丽平,周清雷,李斌
    2019, 40(5): 929-934.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着计算机技术的发展,微软的Office系列软件已经成为主流的文本编辑软件.找到一种高效的恢复被加密文档的口令的方案具有重要的意义.传统的基于CPU和GPU的破解方法破解速度慢,大大限制了破解的应用.为了提高口令的破解速度,本文提出了基于多核FPGA的设计思想.详细分析了解密Office 文档涉及的核心算法SHA1和AES.在全流水线结构下,按照多核并行的设计思想,设计了基于多核FPGA的Office口令破解程序,实现Office口令的高速破解.实验结果表明:在单片四核FPGA上破解Office口令,其破解速度达138600H/s,是普通口令破解软件的62倍,是基于GPU的Hashcat口令破解软件的5倍.基于数据流的设计思想使得流水线上的所有数据块处于高效工作状态,同时多个数据流并行工作.大大提高了破解速度,实现了对Office文档加密密码的快速破解.
  • 江颉,傅超仪
    2019, 40(5): 935-940.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对基于构建k匿名组的位置服务隐私保护方法在实际应用环境中协作用户并非完全可信的问题,提出一种基于查询分片用户协作的位置隐私保护方法.首先采用基于历史用户的锚点生成算法生成锚点代替用户真实位置发起查询,在经过用户自定义的数据安全等级对查询请求进行分片处理后将请求片段分别发送给匿名组中随机选择的不同用户.被选中的用户收集到全部的请求片段后发送给位置服务器.位置服务器收集到全部请求片段后进行重组,并根据用户的锚点信息采用增量近邻算法得到查询结果返回给用户.用户通过计算自身位置与查询结果之间的距离得出精确的查询结果.通过理论分析和实验结果表明该方法在有限的时间和通信开销下,具有较好的隐私保护效果.
  • 张馨月,陈越,严新成,贾洪勇
    2019, 40(5): 941-946.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对云存储中不同敏感度数据安全共享需求,提出一种基于线性几何的层次密钥分配与数据加密方案CloudMLS,实现了满足Bell-La Padula(BLP)模型的多级安全访问控制策略.通过将读写密钥分开的方式,实现了读写权限灵活授权,并根据其安全级限定了用户的加密和解密能力,以满足BLP模型中“禁止上读”、“禁止下写”两大特性.同时给出了CloudMLS方案在访问策略动态变化时密文密钥的更新算法.对安全性和效率对比分析表明,该方案非迭代地计算出低安全级读密钥有效降低了计算开销,同时在选择明文攻击条件下是消息不可区分安全的.
  • 杨佳,顾耀华,许强
    2019, 40(5): 947-952.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在研究经典低功耗自适应集簇分层型协议 (Low Energy Adaptive Clustering Hierarchy,LEACH)和基于蚁群的分簇路由算法的基础上,提出了一种基于量子蚁群的无线传感器网络分簇路由算法.该算法采用在簇间路由阶段引入量子蚁群算法的方式,利用量子蚁群算法在全局寻优和收敛速度方面的优势,更好的搜寻到各个簇头到Sink节点的最佳路径进行数据的传输,从而有效的降低了簇头节点的能耗.仿真结果表明,该算法与LEACH算法和蚁群优化分簇路由算法相比,有效的找出最佳路由路径,从而节约了网络能耗,延长了网络生命周期.
  • 严华,付晓东(,),岳昆,刘骊,刘利军
    2019, 40(5): 953-958.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在QoS不确定条件下,为使Web服务选择结果满足用户QoS属性需求和选择服务时的风险态度,该文提出了一种基于前景理论的不确定QoS感知Web服务选择方法.首先,选取用户QoS需求作为参照点,比较用户需求与Web服务QoS属性关系得出相较于用户需求的收益和损失,并构建风险收益矩阵和风险损失矩阵;然后利用经验分布函数对Web服务QoS属性的不确定性进行描述;最后考虑用户的风险态度,根据得出的风险矩阵和QoS属性的分布概率,分别使用前景理论中的价值函数和概率权重函数计算得出候选服务的综合前景值并进行排序选择.选择结果满足用户需求和风险态度,从而使得选择结果能最大程度上满足用户期望.通过实验验证该服务选择方法的合理性和有效性.
  • 季鹏飞,徐曾春,胡平
    2019, 40(5): 959-965.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无人机编队在野外或灾后作业过程中因外界通信链路不佳且能量有限,面临调度难、续航短的问题.本文针对该问题提出了一种基于边缘计算的多机协同互助作业方案,所有计算任务都在最边缘的设备(无人机)上协同完成.将无人机节点建模为Jackson网络,在任务卸载调度时综合考虑通信成本、各节点的实时计算能力和剩余能量,继而提出了Oracle式(O)、主动集中式(PC)、主动分布式(PD)、反馈分布式(RD)四种调度算法,并设计模拟器进行仿真实验,将几种算法与非协作方法一起进行效率和能耗的综合比较.实验结果显示,协作方法明显优于非协作方法,当外部任务到达率较高时,PC可以在性能和能耗间取得最佳平衡,当任务到达率较低时RD表现更佳.
  • 张建伟(,),王旭辉,蔡增玉
    2019, 40(5): 966-971.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对内容中心网络CCN域内缓存策略所存在的一系列问题,提出了一种基于势能的缓存决策策略PECDS.该策略将物理学中“势能”的概念应用到网络拓扑中,为其中的内容以及节点赋予相应的势能,在保证整个CCN网络性能的前提下,实现内容的分级缓存,解决了CCN默认的TERC策略所导致的缓存内容冗余问题.仿真实验证明,相比于TERC以及ProbC,PECDS有效的提高了CCN网络缓存内容的多样性,降低了网络缓存内容的冗余度,进而减少了用户请求内容的跳数,提高了网络的缓存命中率.
  • 刘翠梅,杨璇,贾刚勇,韩光洁
    2019, 40(5): 972-977.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    闪存具有异地更新、读写代价非对称、写前擦除、读代价小、功耗低等特征,与传统的磁盘存在巨大的差异.所以针对不同的存储介质需要采用不同的管理策略.为了提高闪存效率,缓冲区的管理尤为重要.传统的磁盘缓冲区管理算法不能适应闪存特征,无法满足闪存缓冲区的高效管理.为了优化现有缓冲区替换算法以适应闪存存储介质,本文提出了一种代价敏感的缓冲区替换算法,FSO-LRU,用于提高闪存效率.该算法的优势在于考虑了不同缓存页的不同替换代价和不同重用概率,每次替换对系统性能影响最小的缓存页进行替换,从而保证了系统的性能.因此FSO-LRU算法将传统的缓冲区物理页的LRU列表分为四个LRU列表,热干净LRU列表、热脏LRU列表、冷干净LRU列表、冷脏LRU列表,根据每个LRU列表的特征,考虑四个列表的重用概率,尽量保证优先替换重用概率低的物理页,因为替换重用概率低的物理页所需的代价更低;同时考虑读和写闪存所需的代价差异很大,写闪存的代价远远高于读闪存的代价,优先替换不需要写闪存的物理页,减少系统代价.通过大量的实验结果表明本文提出的FSO-LRU具有很大的优势,对比现有算法,能提升较大的性能.
  • 梁顺攀(,),王辰(,),原福永(,),张付志(,)
    2019, 40(5): 978-983.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着推荐内容的多样化,推荐系统中需要引入隐式反馈信息来加强其适用范围.但是隐式反馈推荐存在着缺少负反馈的问题,并且稀疏的隐式反馈信息会影响推荐结果准确度.针对这些问题,首先,考虑到用户会存在喜欢和不喜欢的内容,提出均值分割方法,并使用均值分割方法改进矩阵分解推荐算法,解决隐式反馈中缺少负反馈的问题.然后,引入了word2vec技术计算相似度,并使用得到的相似度对隐式评分矩阵进行预测填充,以达到降低隐式评分矩阵稀疏度的目的.最后,使用真实世界数据集进行实验,实验结果表明本文提出的推荐算法可以解决隐式反馈推荐中缺少负反馈的问题,并降低数据的稀疏度,提高推荐结果的准确度.
  • 刘承威,杨志斌(,),周勇,袁胜浩,许金淼,薛垒
    2019, 40(5): 984-995.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在航空、航天、交通、能源等安全关键领域中,软件的失效可能导致系统处于危险状态,从而导致财产损失、环境破坏甚至人员伤亡,如何保障这类软件的可靠性和安全性一直是学术界和工业界共同面临的难题.近年来,形式化模型驱动的安全关键软件设计与验证方法逐渐受到重视,并被认为是切实可行的重要手段.然而,形式化模型驱动开发方法的生命周期一般较少涉及需求阶段,主要原因是当前工业界的软件需求主要通过自然语言文本描述.而安全关键软件引起严重事故的问题链的最上端原因往往又是软件需求尤其是安全性需求的问题.AADL(Architecture Analysis & Design Language)是一种广泛应用于安全关键软件领域的建模语言标准.本文针对自然语言需求和AADL模型驱动开发方法之间还存在鸿沟的问题,研究基于限定自然语言的安全关键软件需求建模及AADL模型自动生成方法.首先,提出一种基于限定自然语言的需求规约方法,通过结构化的需求组织方式及受限的自然语言以减少需求表达中存在的二义性.其次,给出限定自然语言需求到AADL模型的自动转换方法.此外,本文给出一种结构化的验证性质描述模板,并自动转换到AADL组合验证附件AGREE(Assume Guarantee REasoning Environment)Annex,从而支持对AADL模型进行形式化验证.最后,在AADL开源工具环境 OSATE中实现了原型工具,并基于航天导航制导控制子系统进行案例分析.
  • 王丹,朱思征,高丽萍,王山山
    2019, 40(5): 996-1003.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文在之前的基于局部复制的结构性文档协同编辑冲突消解算法,即MCPS算法基础之上,提出移动平台下基于用户活跃度的结构性文档意图维护算法,简称MCPS2算法.MCPS2算法利用点对点的网络连接方式,构建协作客户网,各协作客户端通过局部复制策略请求结构性文档参与协同编辑工作.同时结合用户活跃度,赋予站点master属性和结构文档中等级标题Title Creator属性,合理安排节点新增、编辑、请求等权限,更大程度的满足多用户的意愿,提升协同工作意义.我们在之前的研究基础上,对基本操作、文档合并、Title Creator转移流程进行了细化,完善了权限转移动态控制机制,保证用户即来即走的需求.最后给出算法复杂度分析与全面的实例说明,证明策略的有效性和正确性.
  • 杨永洁,钟诚
    2019, 40(5): 1004-1009.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    short-read alignment(短序列比对)在下一代测序技术中得到广泛运用.精确识别测序序列中的gap(空位)是后续基因组解读的基础,而现有的允许空位的short-read比对算法效果并不理想或者不允许插入空位.对于查询序列和参考序列均为short reads的比对问题,通过采取训练查询序列样本数据寻找不同物种和不同read长度匹配的最优插入空位数量的策略,对大规模的short reads进行两两比对,以减少算法的迭代次数,从而减少算法所需的中间矩阵计算量,并用向量存储算法比对过程中的中间矩阵元素值,以降低存储空间需求,提出一种改进的short-read比对算法.数千万的short reads对准实验结果表明:与已有的有代表性的同类算法相比,本文算法在确保short-read比对精确度的前提下,降低了所需的运行时间和存储空间.
  • 李思楠,赵海
    2019, 40(5): 1010-1014.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对于掺杂了不同干扰的脉搏波主播峰值点检测过程,提出了一种以自动多尺度峰值检测和贝叶斯学习理论为基础的改进算法.利用MIT-BIH标准数据库中的脉搏波数据为检测对象,在脉搏波峰值点检测实验中灵敏度(Se)和阳性预测值(PPV)均达到了平均98%以上的水平.脉搏波的形变会使得算法在检测过程中造成峰值点的遗漏或误判,不过本文提出的算法要比自动多尺度峰值检测(AMPD)算法在检测灵敏度上有较大的提升.脉搏波在保持基本的主波峰形态结构条件下,提出的算法能够提供较高的峰值点检测准确率.
  • 张智,王慧,苏丽,聂文昌
    2019, 40(5): 1015-1019.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对室内环境静态人体检测问题,研究了一种能够适应复杂环境的静态人体目标检测方法.将图像分割与统计学习相结合,对分割图块提取梯度直方图特征,并结合人体结构的先验知识进一步对分割图块做针对性地合并处理,快速锁定可能的人体区域、减小干扰,最终采用粗-精两级支持向量机实现人体检测,有效提高了检测成功率.实验结果表明本文方法能够在室内复杂环境下实现静态人体检测,且在训练样本集较小的情况下仍具有较高的可靠性和精度.
  • 康云云,彭敦陆,陈章,刘丛
    2019, 40(5): 1020-1025.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    法律文本的自动生成能缓解我国法律服务行业中的人力资源不足的问题,对抗生成网络模型的出现为法律文本的自动生成提供了新思路.本文提出一种基于对抗生成网络的文本自动生成模型——ED-GAN(Generative Adversarial Networks based on Encoder-Decoder).在该模型的生成器中,首先将案情要素的关键词序列输入至编码器Encoder阶段的LSTM中编码成一隐含层向量,再将这个隐含层向量输入到解码器Decoder的LSTM中,并结合其各时间步的输出生成下一时间步的隐含层向量,进而得到各时间步的输出,生成文本序列.模型最后采用CNN网络来鉴别生成文本和真实文本之间的差距.实验验证表明,采用所提模型能够生成较理想的法律文本.
  • 徐源音,柴玉梅,王黎明,刘箴
    2019, 40(5): 1026-1033.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的情绪分析方法大多针对单语言文本,但类似中英文混合的多语言表达方式被广泛应用于微博、Twitter等网络社交平台中,多语言文本情绪分析成为情感分析研究领域的重要问题之一.本文针对中英混合文本提出情绪分析模型MF-CSEL,首先基于CBOW模型训练词向量,提出新的词向量组合方式学习含有语序信息的文本向量,并针对不同语言分别提取文本情感特征,融合TF-IDF权值矩阵,最后通过代价敏感集成学习方法对多语言文本进行细粒度的情感分析.本文提出基于语义相似度的样本空间重构算法以平衡数据集,降低错分代价,使用代价敏感集成策略去融合基分类器SVM和NB的分类结果以得到最终实验结果.同NLPCC2018多语言文本情绪分析任务的评测结果对比,结果表明本文方法具有有效性.
  • 涂海,彭敦陆,陈章,刘丛
    2019, 40(5): 1034-1039.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    利用司法领域的网络资源对用户所提的法律纠纷问题自动提供有价值的参考解决方案能在很大程度上降低人工成本和社会资源.为了智能化解决用户的法律纠纷问题,论文提出一种seq2seq(Sequence to Sequence,序列到序列)融合注意力模型和双向长短时记忆网络的法律纠纷自动问答深度学习模型——S2SA-Bi-LSTM.该模型从大规模法律纠纷问答对出发,利用Bi-LSTM获取输入序列的上下文信息,结合注意力机制对序列权重进行更新,通过编码得到输入序列的向量化表示.并在此基础上,本文修改了Bi-LSTM中输入门和遗忘门的参数并计算输出序列,以得到与输入序列相对应的输出序列.实验证明,所提模型在真实的数据集上生成的答案具有较高的准确率,MAP值和MRR值也优于已有研究.
  • 陈行健,胡雪娇,薛卫
    2019, 40(5): 1040-1044.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    提出了一种基于位置关系拓展的改进词袋模型.该模型在传统词袋模型的基础上,结合马尔科夫假设对聚类单词提取位置关系图谱,并对关系图谱进行特征转换,将得到的图谱特征与基于传统词袋模型得到的词袋特征融合作为模型最终特征表示,解决了传统词袋模型中忽略特征单词之间的空间位置信息进而导致特征区分度不足的问题.模型采用词嵌入方法对稀疏图谱进行密集表示,并结合卷积神经网络构建特征学习框架,相比于池化等算法,能更加全面地反映图谱特征的分布规律.将改进词袋模型应用于蛋白质亚细胞区间定位预测研究中,实验表明,文中算法分类结果更优.
  • 吴挡平,张忠林,曹婷婷
    2019, 40(5): 1045-1049.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对Bagging、AdaBoost等通用的集成算法对于稳定性分类算法集成效果不是很好的问题,提出了基于Stacking策略的稳定性分类器组合算法.该算法通过构造一个两层的叠加式框架结构,融合数据降维技术处理两层分类器的输入特征,对4种稳定性分类器(LDA、GLM、SVM、KNN)进行组合学习.利用UCI数据集测试算法的性能.实验结果表明:相比一些集成算法(RF、Bagging、C50、AdaBoost),基于Stacking策略稳定性分类器组合模型可以获得更高的分类准确率.同时也为二分类的分类模型提供了一个可行的参考方法.
  • 段雪梅,朱明,鲍天龙
    2019, 40(5): 1050-1053.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文以中国菜作为研究对象,提出了基于双线性模型的菜品识别方法.由于中国菜里很多菜品的相似性,导致分类的难度很大.本文借鉴了细粒度图像识别方法中的双线性模型,然后使用一种基于映射的方法得到一个更加低维的双线性特征表示.并在训练阶段采用一种大裕量softmax损失函数.该损失函数通过增加一个正整数变量,在损失函数里产生一个裕量,使同种类别的学习难度增加,从而使学到的特征更加有区分性.将网络在一个208类的中国菜数据集上的测试表明,与以往的方法相比,该方法提高了准确率,减少了过拟合,取得了更好的分类结果.
  • 吴生宇,李明心,林靖宇
    2019, 40(5): 1054-1058.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在利用数字图像技术检测大型建筑物外墙面裂缝时,墙面上的裂缝宽度过窄,或是被灰尘填充而变得不清晰,又或是图像预处理过度导致提取到的裂缝出现断裂等情况,均会影响到后续如裂缝面积、长度、宽度、走势等参数的测量和评估.为了解决这个问题,本文提出了一种基于山脊线邻域的评价模型(NEAR)来判断和描述裂缝间的连续性,并根据其判断和描述结果,结合二次贝塞尔插值完成裂缝间的平滑连接.此外,本文还进行了对比试验,利用基于Hausdorff 距离的最小二乘法对NEAR算法结果和K-D树算法结果进行评估比较.实验结果表明,该算法能明显提高判断裂缝连续性的准确程度.
  • 杨刘涛,孙瑾,张哲
    2019, 40(5): 1059-1063.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    手势识别技术是实现基于手势的人机交互的关键技术.但人手自由度高,结构复杂,同时由于手势自遮挡会引起信息丢失.本文在卷积网络框架下,提出了一种双视点下使用图像拼接技术的静态手势识手势识别方法.该方法使用3D模型手建立手势库,为解决双视点图像与神经网络的结合问题以及模型手建库带来的网络泛化能力不足,对手势两个视点的图像提出一种剪切拼接方法,在结合双视点信息的同时随机调整模型手的大小及位置来模拟真实情况,提高网络的泛化能力.实验结果表明,本文方法能对单视点下识别错误、存在严重自遮挡的手势进行准确的识别,同时还具有很好的泛化能力,能正确识别未加入训练集的真实手势图像.
  • 李晓莉,张慧明,李晓光
    2019, 40(5): 1064-1068.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于Encoder-Decoder神经网络结构的图像描述生成方法通常假定任何主题下的词分布是一致的,导致解码器拟合了一般意义上的词分布.针对于此,本文提出了一种基于多主题的图像描述生成方法TIC,在传统的Encoder-Decoder结构基础上,引入主题语言模型和图像主题模型拟合图像描述混合概率模型,基于该模型,设计了一种基于多主题的神经网络,并采用独立训练组件的方式.通过大量实验表明,TIC在BLEU,METEOR,CIDER,ROUGE性能上比传统方法表现得更好.
  • 郭伟青(,),汤一平(),袁公萍,鲁少辉,陈麒
    2019, 40(5): 1069-1075.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文针对基于单目全景立体感知的被测物体三维建模问题,通过研究单目单视点折反射全景成像机理,利用二次双曲面镜的光学特性,实现了一种全景立体感知三维测量与三维重构方法.依据单目全景立体视觉感知理论设计具有统一摄像机内部参数和颜色系统的全景感知系统,利用双曲镜面成像技术获取被测物体的激光反射点,得到被测物体全景切面扫描图像,利用空间几何约束关系获取被测物体表面的采样点数据,对采样点进行B样条曲面柔性拟合,改进通用重构方法在拟合非均匀采样点时形状的失真以及运算不稳定现象,避免控制点的大量增加,快速实现被测物体的三维重建.本文提出的基于双曲镜面成像的单目全景立体感知技术可应用于管道、隧道地下交通设施等检测及重构,可满足工程领域全景视觉实时三维测量及几何复制的需要,提高全景视觉几何实体测量及重构效率.
  • 林涵阳(,),詹永照,陈羽中(,)
    2019, 40(5): 1076-1082.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为缩短机动车行驶证识别时间并提高识别准确率,本文提出一种基于复杂场景的机动车行驶证快速检测与识别算法.该算法首先进行区域定位,针对行驶证图片存在的背景复杂、角度倾斜的问题,提出背景模板匹配的区域提取算法对行驶证边缘轮廓的位置进行定位以完成倾斜校正,有效解决传统特征匹配方法检测时间长、正确率低的问题.之后使用关键区域的多尺度检测定位算法对校正结果进行正确性评判,避免错误的校正结果对后续识别的影响.接着对校正正确的图像进行模板分割得到字段区域,再进行区域二值化,由于光照不均和背景底纹导致传统的二值化算法效果不佳,提出融合二值化算法,解决了光照和底纹影响以及文字笔划粘连缺失的问题.算法最后通过识别引擎对二值图像进行识别,得到文字识别结果.实验表明本文提出的算法具有快速、多角度、背景与光照鲁棒等优点.
  • 卢菁,党延领,刘丛
    2019, 40(5): 1083-1088.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数据不一致是关系数据库中普遍存在的问题,利用约束规则进行数据修复是解决该问题的有效方法.现有修复方法主要利用函数依赖和条件函数依赖,所考虑的约束规则不能包含大于或小于的语义约束,且忽视了约束规则之间可能存在的冲突及其对数据集的符合程度.本文考虑否定约束,提出了基于校准否定约束集的数据修复方法(DR-RDC),首先利用符合度记分函数计算出每个否定约束对数据集的符合度分数,并排序,剔除小于阈值的否定约束,再使用关联矩阵对否定约束进行冲突消除,得出校准否定约束集,将其作用于原始数据集,检测出冲突元组对的否定约束放入证据规则集,冲突元组对放入冲突元组集.根据证据规则的符合度分数由高到低地选取证据规则对数据集进行修复,将条件概率最大的属性值作为冲突属性的修复值,直到冲突元组集不违反任一否定约束.实验验证了DR-RDC所获得的精确度优于数据语义置信度方法,DR-RDC比使用原始否定约束集在数据修复方面有显著改善.
  • 胡乃静,游录金,彭俊杰
    2019, 40(5): 1089-1093.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云环境中,由于虚拟机由用户根据自己的需求申请租用,因此在传统的资源分配策略下,可能任务分配过少造成资源浪费,也可也能分配过多又造成过载从而影响服务质量.为了提高资源使用效率,保证服务质量,适当考虑应用特征,进行合理资源分配,是一种可行的解决方案.考虑到云环境下,网络密集型应用与IO密集型应用为最为广泛应用的两种类型的应用,针对这种现状,本文以这两种典型的应用作为切入点,研究了它们在使用过程中的资源偏好性,并提出了基于应用类型的资源优化策略,对这两种类型的应用进行不同的调度,以提高应用的执行效率.本文进行了大量的实验,实验表明,该策略适对于IO密集型以及网络密集型应用可以有效的提高应用执行效率,为更好的提高云计算资源的使用效率奠定了基础.
  • 魏力,张育平
    2019, 40(5): 1094-1098.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    不平衡数据集经常出现于很多应用领域,如果直接使用这种数据集进行分类,会对算法的学习过程造成干扰.而传统的欠采样方案会严重丢失多数类样本的信息.为解决这一问题,通过结合NearMiss算法和K-Means聚类在处理不平衡数据时的优点,提出了CBNM(Clustering-Based NearMiss)算法,该算法通过计算簇中心点的NearMiss距离,赋予该点选择权重.实验通过选择十组UCI数据集,验证在本算法中三类NearMiss算法的优劣,并与NearMiss-2算法进行比较.实验结果表明,CBNM算法在F-Measure和G-Mean上有显著提升,对分类效果的改进明显.
  • 史覃覃,韩文军,陶宁,吉根林(),赵斌,黄潇婷
    2019, 40(5): 1099-1106.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的聚集模式主要研究群体聚集之前的运动形态,无法反映聚集后群体的运动趋势和行为规律.为了追踪聚集群体,研究其在时空上的变化趋势和行为模式,本文提出一种聚集移动模式.该模式从聚集群体的移动规律出发,能够有效识别群体在时空上的运动和变化过程.在挖掘过程中通过簇相似关系来识别群体之间的关联性和变化趋势.对邻近时刻的簇集合进行簇相似连接,实现聚集移动模式的挖掘.利用移动簇之间的成员关系对连接操作进行过滤和剪枝,提升挖掘效率.基于两个真实的GPS轨迹数据集进行实验,结果验证了本文提出的挖掘算法在挖掘效果和算法效率方面是可行的.
  • 杜天保,沈国华(,),黄志球(,),王飞,吴德香
    2019, 40(5): 1107-1114.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于信息检索的需求和代码之间追踪生成方法(以下简称为IR追踪生成方法)根据软件制品之间的相似性识别追踪关系.然而,由于IR追踪生成方法仅仅考虑了文本信息,没有充分利用代码中蕴含的结构信息,当前的IR追踪生成方法准确度较低.针对这一问题,本文提出IR追踪生成方法和代码模式相结合的新方法,以提高IR追踪生成方法的准确性.具体而言,我们利用候选列表和代码依赖获取每个代码元素的代码模式,再利用代码模式对候选列表重新排序.实验结果表明,引入代码模式的IR追踪生成方法的准确性明显高于纯IR追踪生成方法,且具有良好的适用性.
  • 李艳,贺静,武优西(,)
    2019, 40(5): 1115-1119.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    鉴于重叠社区发现通常具有复杂度高或结果不稳定的现象,提出了一种种子节点贪婪扩张的重叠社区发现方法.首先利用网络节点的拓扑特征寻找局部最大度节点作为种子,这些节点中心性好,且较好的分布在整个网络中,然后通过基于适应度函数的贪心策略扩张种子,并在每次有新节点加入社区时清洗社区,以此发现质量高的重叠社区.本文选取了人工模拟网络和真实网络进行了对比实验,实验结果表明,该算法能发现较高质量的重叠社区结构.
  • 王根生(,),黄学坚
    2019, 40(5): 1120-1126.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果.
  • 郭昆(,),彭胜波(,),张瑛瑛,陈羽中(,)
    2019, 40(5): 1127-1136.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现实世界中,网络节点通常会隶属于多个重叠社区,例如社交网络、文献引用网络等.因此,重叠社区发现在复杂网络分析中具有重要意义,如何高效准确地识别网络中的重叠社区是社区发现研究的难点.提出一种基于密度峰值和社区归属度的重叠社区发现算法.首先,提出一种基于节点直接邻居和间接邻居的节点间距离度量方法.其次,给出密度峰值聚类算法簇中心的局部密度阈值和跟随距离阈值计算方法,根据这两个阈值自动选取簇中心.最后,把密度峰值聚类算法应用到社区发现中,并给出社区归属度的计算方法,根据社区归属度对社区边界节点进行社区归属划分.在人工数据集和真实数据集上的实验表明:该算法能够准确的识别重叠社区结构,且具近似线性的时间复杂度,适用于大规模复杂网络.