过刊目录

  • 2019年, 40卷, 第1期
    刊出日期:2019-01-10
      

  • 全选
    |
  • 周航,莫同,李伟平,卢思远
    2019, 40(1): 1-5.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着物联网的发展,很多应用场景下的被动服务提升为主动服务.主动服务无需人来驱动,由系统自动采集数据,根据逻辑进行判断,然后进行服务触发.情景感知(context aware)是实现主动服务的一种主流方式.本文提出了一种面向主动服务的情境感知引擎,相比与开源的规则引擎如Drools,该引擎支持了更丰富的模型描述语言,如场景与属性的定义、数据有效期设定、接入用户函数等.在处理密集传感器数据时,引擎引入了场景赋值以及数据快照的概念,帮助引擎快速定位数据匹配的场景,有针对性的去匹配规则并触发服务,提升了数据处理的效率和准确率.本文通过两个实验,以模拟传感器数据的方式测试了为模型中场景赋值的操作对整体执行效率带来的提升.
  • 吴桂宝,沈瑜,张文帅,廖莎莎,王琦琦,李京,
    2019, 40(1): 6-12.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    高性能计算集群通常使用先来先服务等传统的作业调度方法,它具有良好的公平性,并且实现简单,但容易产生闲置的资源碎片.针对上述问题,一种的策略是使用回填,利用一些短时间小作业来填补系统等待期间的空闲资源碎片.但好的回填方法通常需要知道作业预期的运行时间,而用户或者不愿意提供作业预期运行时间,或者倾向于提供比实际运行时间更长的预期时间以避免作业被系统终止,因此我们有必要自行预测作业的运行时间.VASP是国内应用最普及的高性能计算应用软件之一,本文通过分析VASP作业特性,解析并抽取相应的作业特征集,提出一种基于贝叶斯的二次预测模型IRPA,对VASP作业进行运行时长的预测,最后进一步提出基于径向基网络分支及贝叶斯分类的混合预测模型BRBF,并且利用我校TC4600平台上的VASP作业数据集进行验证.实验结果和其他几个基本方法进行对比,表明IRPA以及BRBF的有效性以及在粗粒度下具有的较高预测准确率.
  • 任胜兵,黄飞,刘媛
    2019, 40(1): 13-19.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对信息物理融合系统(CPS)建模中存在的误差及误差累积问题,本文在数据处理分组方法(GMDH)的基础上,结合区间分析思想,提出了区间GMDH算法.算法首先对基于区间分析的集合反演算法(SIVIA)进行了改进,提出了cSIVIA算法.通过引入收缩算子,在保持解集不变的情况下,对参数估计的区间进行压缩,解决SIVIA算法进行二分搜索时出现的计算量大、耗时长以及死锁问题.其次,将GMDH的输入及计算转变成区间数和区间运算,用改进的cSIVIA算法对模型参数进行估计.最后,取区间参数的中点作为待估参数的点估计,再利用外准则对产生的中间模型进行筛选,以建立最终系统模型.实验表明本文提出的区间GMDH算法与原算法相比在精确度、抗噪性等方面得到明显改善,有效地解决了CPS建模中存在的误差和误差累积问题.
  • 朱征宇,袁闯
    2019, 40(1): 20-25.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文针对传统的局部拓展算法具有较强的随机性和社区发现质量不高的缺陷,在种子拓展和H指数的基础上,提出了一种基于节点重要性和改进适应度的重叠社区发现算法(HDOC).算法采用H指数和局部影响力计算节点重要性,按此对节点排序和选种,使算法具有稳定性;且本文采用了一种新的适应度计算方法,兼顾考虑了节点自身和邻接点重要性,来对社区进行扩展,提高了社区的发现质量.通过在真实网络和LFR生成的人工网络中进行测试,并与其他社区发现算法对比实验表明,HDOC的社区识别能力较强,并且具有不错的时间效率.
  • 肖汉,周清雷,姚鹏姿
    2019, 40(1): 26-30.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵向量乘并行算法,矩阵向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20.86倍、6.39倍和1.49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性.
  • 王建芳,苗艳玲,韩鹏飞,刘永利
    2019, 40(1): 31-35.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的概率矩阵分解算法虽然较好地解决了推荐过程中的稀疏性和用户冷启动问题,但由于没有考虑到用户之间的信任信息,造成推荐精度不高.本文利用用户评分过程中潜在存在的信任关系,提出一种基于信任机制的概率矩阵分解协同过滤推荐算法TM-PMF(Probabilistic Matrix Factorization Algorithm of Collaborative Filtering Based on Trust Mechanism).首先根据用户间的信任关系来构建信任网络以获得信任评分矩阵.然后将信任评分矩阵与用户评分矩阵进行融合构建用户-信任评分矩阵,接着通过概率矩阵分解技术获得最优推荐列表.最终实验结果表明在不同稀疏数据集上,本文提出的TM-PMF算法较传统算法在精度方面有较大幅度地提高.
  • 沈记全,罗常委,侯占伟,刘志中
    2019, 40(1): 36-39.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着Web服务技术的广泛应用,如何从海量功能性相同、非功能性不同的Web服务中,高效地组合出客户满意度高、服务质量最优的组合服务是第四方物流的核心.针对这一问题,建立了基于QoS感知的物流Web服务组合模型,在保证Web服务QoS全局约束和偏好的前提下,提出了一种新型的遗传优化算法.为了提高算法的种群适应度,该算法优化了基因编码方式、选择、交叉以及变异遗传算子.实验数据显示,改进后的遗传算法具备更高的收敛能力与寻优效率,能够用来处理物流Web服务组合问题.
  • 黄张翼,周翊,舒晓峰,刘宏清
    2019, 40(1): 40-44.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,深度学习的研究方法已经成为了语音增强算法的新趋势,而输入的特征是影响增强效果的关键因素.实验表明,输入增强过的语音特征相对原始特征能更好地提升神经网络的语音增强效果.因此,本文首先提出一种改进的Chi分布下基于听觉感知广义加权的贝叶斯估计器,接着将改进的贝叶斯估计器作为深度神经网络的输入特征提取器,进而得到一种联合深度神经网络与Chi分布下基于听觉感知广义加权的贝叶斯估计器预处理的新型网络结构.实验仿真证明,提出的联合算法较传统语音增强算法与基于深度神经网络的语音增强算法在各个噪声环境下,各种性能指标均有了明显的提升.
  • 李芬田,王红梅,潘超
    2019, 40(1): 45-49.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当有大量的事务插入或者删除时,针对pWin算法在窗口滑动阶段反复访问前缀树进行事务的更新;DSFPM算法中DSFPM-Tree中大量的父子之间存在不频繁的关系,因此建立的DSFPM-Tree比较高,特别是在窗口滑动的时候,需要频繁更新DSFPM-Tree带来很大的时间开销等缺点,提出滑动窗口中FP-Tree的频繁项集挖掘算法.算法将数据流分成大小相等的模块来进行挖掘,每个模块均采用上三角矩阵存储,并且设计了一种概要结构NCFP-Tree来存储每个基本窗口中的临界频繁项集,窗口每次滑动一个基本窗口,利用优化的频繁项集挖掘算法,分别把各个基本窗口中的临界频繁项集挖掘出来.用C实现了该算法,实验结果证明了该算法比其他两个算法的时间效率更高,查全率和查准率都优于其它两个算法,具有良好的性能.
  • 李慧林,柴玉梅,孙穆祯
    2019, 40(1): 50-57.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本命名实体识别是信息抽取和预测的基本与关键任务,提出基于深层网络模型的命名实体识别方法,构建多种学习模型.首先对文本进行清洗并规范化,生成基本结构和表示方法,结合边界特征构建深层条件随机场模型,选择最优特征集训练.将文本表示为词向量形式,以向量作为深层神经网络的输入进行模型的训练,提出了基于块表示的BRBiRNN、BRBiLSTMCRF命名实体识别深层网络模型,在I2B2 2006年和2014年评测数据集及妇产科真实医疗文本上实验,结果均比传统的SVM、HMM、CRF的F值高.
  • 张涛,杨剑,宋文爱,宋超峰
    2019, 40(1): 58-63.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来深度学习在各个研究领域取得越来越多的成果,这些都离不开激活函数的发展.但现有的激活函数Tanh、ReLU和PReLU在随着研究的深入暴露出越来越多的问题,比如存在“神经元死亡”和偏移现象,对噪声不具有鲁棒性.针对这些问题,结合Tanh和PReLU的优点,提出了TReLU激活函数,通过参数α控制负半轴非饱和区间获得激活值,输出近似0均值,软饱和性对噪声鲁棒.实验结果表明,TReLU在四种不同的数据集上都取得了最好的效果,对不同优化方法具有鲁棒性,具有一定的实用价值.
  • 刘菊君,姜磊,彭雄,周倩,杨先圣
    2019, 40(1): 64-68.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当今时代传统零售业竞争异常激烈且数据量庞大,因此在大数据平台下挖掘异常并让其辅助决策成为企业提高竞争力的有效手段.目前大多数离群点检测方法仅能对具有可比性的数据进行异常挖掘,但销售数据却受到季节性、节假日等因素影响而失去可比性,且管理层的需求并不仅仅是挖掘异常,其最终目的是定位异常、实现责任到人等实用意义,从而针对销售数据的异常发现与定位方法成为一大难题.为此提出了大数据下的销售数据的异常发现与定位模型.该模型利用权重的思想使数据具有可比性,从不同角度的数据进行离群点检测后通过建立概率模型实现异常定位.由于权重思想及独有的异常定位两个特征,该模型在实际应用于步步高商业连锁股份有限公司时获得了相关专业人员的高度认可.
  • 吕志远,陈靓,冯梅,全成斌,赵有健
    2019, 40(1): 69-76.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着企业网络规模的不断扩大,企业内网的重要性日益凸显,但企业内网面临的威胁却层出不穷.目前业内采用的传统安全策略和常规安全防护技术不能够完全识别和防御这些威胁.在企业内网严峻的安全形势下,本文采用了引起业内广泛关注的拟态安全防御思想,提出了适用于企业内网的拟态网络模型,并基于模型实现了企业内网安全防护原型系统.实验结果表明,企业内网安全防护系统能够防御假冒用户、DDOS、网络蠕虫等多种攻击,并可以有效的阻断未知攻击,从而对于企业内网信息安全防护提供有力保障.
  • 赵玉琦,李兵,熊燚铭,刘晖,王静
    2019, 40(1): 77-80.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    分布式服务的网络环境是影响QoS的重要因素,由于实际网络中路由策略的影响,服务节点间延迟经常出现随机延迟污染和三角不等式违例等问题,从而导致节点坐标的计算产生误差.上述问题影响了服务响应时间和延时预测准确性,本文提出了一种基于分布式服务节点IP坐标系统的QoS评估与推荐策略,通过TO-Filter算法和Vivaldi算法,抑制污染和三角不等式违例从而提高服务质量,实验结果表明本文提出的方法在降低坐标抖动方面性能提升了8.7%.
  • 赵一,李昭,陈鹏,何泾沙,何克清
    2019, 40(1): 81-88.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,互联网中发布的Web服务大都通过自然语言进行描述,这种非结构化的描述方式为机器进行自动分析与处理带来了极大的困难.如何提高服务发现的效率和精确率,已成为服务计算领域的研究热点之一.服务聚类是服务发现的重要支撑技术,通过将语义相似的服务加以聚类和组织,有助于改进服务发现的效果.当前的服务聚类技术主要采用LDA(潜式狄里克雷分布)和K-means等模型在同一领域下进行工作,利用这些方法进行服务聚类时还存在一定的局限性,例如,未充分利用词汇间的语义关系进行降维,从而导致服务发现的效果不够理想.针对该问题,本文使用神经网络模型(word2vec模型)获得服务描述中的同义词表并生成领域特征词集,来最大限度的降低服务特征向量维度;在此基础上,提出S-LDA(Semantic Latent Dirichlet Allocation)模型对同一领域的服务进行聚类,由此构建了一个面向领域的Web服务聚类框架(Domain Semantic aided Web Service Clustering,DSWSC).在ProgrammableWeb网站上发布的服务数据集开展的实验表明,与LDA和K-means等方法相比,本文方法在熵、聚类纯度和F指标上均取得了明显效果,有助于提高服务搜索的准确率.
  • 张润滋,王劲林,陈晓,叶晓舟
    2019, 40(1): 89-92.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在网络安全、网络管理环节,提取流量应用层数据载荷生成数字证据或管理策略有着重要的意义.不同于传统的网络转发处理设备,随着协议处理由低层到高层,所需要的计算资源、内存资源都逐步提升,因此面向应用的网络设备对性能有着更高的要求.本文针对在网络流量的协议解析后,载荷的封装交付任务,提出一种优化的流式协议载荷字段封装交付算法.该算法以实时任务处理为目标,减少应用层载荷在封装过程中的缓存占用,同时优化了字段日志交付的传输效率.在多核网络处理器上的实验表明,该算法能够有效提升系统的性能.
  • 邰滢滢,薄旭,庞影,付云鹏
    2019, 40(1): 93-97.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对大数据时代,实时服务器集群负载平衡问题,本文提出了基于模糊综合评判的服务器负载均衡算法.依据模糊数学的理论,将影响服务器性能的因素作为多参量进行总体评价,即对集群中各服务器先建立因素集和评判集,通过实验评议的方法计算资源权重向量,根据模糊综合评判的基本原理,求出资源权重向量到服务能力向量的映射矩阵,然后利用主因素型公式进行多参量综合评判,从网络集群中选取隶属度最大的服务器作为本次任务重定向的目标.实验结果表明,本算法对服务器的性能评判准确,实时性强,避免了基于单因素评判算法的不足,能够解决实时服务器集群的负载平衡问题.
  • 顾兆军,刘东楠,
    2019, 40(1): 98-103.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对飞机通过廊桥接入点与航空公司进行飞机健康管理数据、电子飞行包等数据传输的无线网络无统一身份认证机制的问题,结合椭圆曲线密码体制与组合式伪随机数提出一种数字签名技术与身份认证方案,同时使用SVO逻辑对该方案进行形式化分析.结果表明,组合式伪随机数生成方案解决了身份认证中随机数的重复值问题,数字签名技术实现了基于身份的认证机制,身份认证方案实现了双向认证,椭圆曲线密码体制保证了密码强度.综合分析表明,该方案满足飞机与航空公司通过廊桥接入点进行数据传输的安全需求,能更好地应用于民航领域.
  • 刘名阳,陈志刚,吴嘉,
    2019, 40(1): 104-110.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在机会网络中,因为节点的移动特性导致网络拓扑结构呈现出动态变化的趋势,使得信息在网络中传输成功率较低,传输延迟相对较高.针对机会网络中存在拓扑结构不稳定的问题,从节点间存在的关系去考虑,提出基于节点间数据分组余弦相似度的高效转发策略(Efficient Forwarding Strategy based on Cosine Similarity of Data Packets between Nodes,CSDP).利用计算文本数据之间相似程度的算法——余弦距离,计算节点间数据分组的相似程度,以此来描述节点之间关系的强弱,然后再对节点间相似度的进行筛选,可以得到多条比较高效的传输路径.经过仿真实验分析,CSDP算法要比传统的机会网络路由算法有着更好的转发效果,可以在降低传输延迟的同时,有效地提高传输成功率.
  • 尹学渊,陈兴蜀,陈林
    2019, 40(1): 111-116.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对虚拟化IaaS(Infrastructure as a Service)环境下的安全隔离及访问控制问题进行了研究,通过系统地研究IaaS环境下的安全隔离与访问控制需求,以安全域划分原则为指导,从网络基础设施、域边界管控、安全支撑性基础设施方面综合考虑,系统地构建了IaaS平台网络安全域模型;并重点针对IaaS平台特有的共享多租户环境,抽象了租户域要素并构建了租户域模型.进一步地,在所构建的安全域模型的基础上,结合云计算环境下资源动态性、云资源具有时效性等因素,从用户业务会话访问控制的角度出发,基于RBAC(Role-Based Access Control)模型及UCON(Usage CONtrol)模型构建了包括用户、角色、权限、资源、授权规则等元素的云资源访问控制模型CloudAC,从而保障虚拟化IaaS环境下用户对云资源访问的安全性.实践表明,依据提出的安全域模型构建的云计算IaaS环境,可以有效地保障不同业务功能网络的安全隔离;利用基于租户域或租户子域构建的隔离网络环境,可以在较小的管理与资源开销下为租户提供灵活的域划分能力,让租户可以依据业务安全需求自主构建隔离与边界可控的网络环境,消除了传统方式下进行网络分段时对物理网络或物理防火墙的配置需求;并使业务环境具有纵深防御能力.同时,依据所构建的云资源访问控制模型,可以灵活构建具有权限分离、用户属性与云资源属性约束、云资源租赁时间约束、虚拟机资源隔离性增强特性的云资源访问控制系统,且相关属性与约束元素可结合业务需求按需扩充,从而能够更好地满足云环境下具有多租户共享、动态特性的云资源访问控制需求.
  • 刘明达,周懿,拾以娟
    2019, 40(1): 117-120.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文团队曾提出基于硬件虚拟化技术构建虚拟化TCM的方法,并设计了硬件虚拟化TCM支撑的可信虚拟环境,但是并未对信任链的扩展提出详细的方案.基于此研究成果,提出了硬件虚拟化TCM支撑下的虚拟环境信任链扩展的方法,对信任链扩展的详细过程进行描述,构建了从pTCM到虚拟机的完整信任关系,并提出虚拟机与可信计算基绑定的方案.实验分析表明,本文方案能够在新型可信虚拟环境中实现信任链的扩展,有效增强计算环境安全,系统开销可接受.
  • 汪海,崔逊学
    2019, 40(1): 121-125.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为提高短基线传感器阵列测向性能,在传统的方位角/俯仰角联合估计基础上提出一种纯方位角估计方案,将三维空间阵列映射为平面阵列,利用平面关系只对三维空间瞬时声源的方位角进行估计.基于克拉姆拉奥下界理论的分析表明纯方位角估计性能优于联合估计的方位角结果,并讨论了纯方位角估计的使用时机.另外本文分析认为,阵列传感器之间高差只影响俯仰角的测向精度,对方位角估计精度不产生影响.仿真结果验证了纯方位角估计的有效性和优越性,为进一步工程应用奠定了理论基础.
  • 宋化志,马于涛
    2019, 40(1): 126-132.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在软件开发和维护过程中,缺陷修复工作有一项必不可少的任务,那就是缺陷分配.在大规模的软件项目中,基于文本分类的自动分配技术已被用于提高缺陷分配的效率,从而减少人工分配的等待时间和成本.考虑到缺陷报告文本内容的复杂性,本文提出了一种基于深度学习的缺陷自动分配方法,在词向量化后通过卷积神经网络对缺陷报告文本进行特征提取,然后完成分类任务.在Eclipse和Mozilla两个数据集上的结果表明,与传统的支持向量机和基于递归神经网络的方法相比,文本所提方法在准确率指标上均优于上述基准方法,而且多层平行的卷积神经网络结构比单层的卷积神经网络结构在预测效果上更好.
  • 孙科,罗奇鸣,李薛剑,陈意云
    2019, 40(1): 133-140.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在一个基于霍尔逻辑和形状图逻辑的C语言自动验证器中,设计并实现了对形状图中所含易变数据结构的形状检查方法.本工作在验证器的形状系统中实现了显式形状检查与隐式形状检查,并通过引入不同的形状级别,使验证器能够根据不同的严格程度及时发现程序中不符合形状定义的易变数据结构,避免对形状图逻辑的相关演算造成影响.此外,为分解易变数据结构中不同指针域带来的复杂性,形状检查方法引入了三阶段处理框架:形状分割、形状分析及形状推断,分别实现形状图的预处理,针对指针指向与节点类型等方面进行分析,以及根据相关规则推断易变数据结构的形状级别.
  • 顾海博,付明,乔磊,冯新宇,
    2019, 40(1): 141-148.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    SpaceOS是北京控制工程研究所自主研发的嵌入式实时操作系统,已被应用于探月工程、空间站等重大航天项目.SpaceOS作为底层系统软件,是影响航天任务成败的关键因素.SpaceOS在设计中提出了一些多个内核模块(如任务管理、调度、通信和时间管理等)相互协同过程中所需要满足的全局性质.本文扩展已有的操作系统验证框架支持全局性质的推理,为SpaceOS内核建立抽象模型,给出主要系统调用的抽象规范,并基于设计需求给出形式化定义描述若干全局性质,通过严格的数学证明保证SpaceOS在抽象设计层面上满足这些全局性质.所有工作都在证明助手Coq中完成.
  • 曹迅,周宽久
    2019, 40(1): 149-157.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大型软件的调试往往需要花费大量人力和时间,因此自动化的软件故障定位方法成为更好的选择.现有故障定位方法大都基于用例的覆盖信息进行分析,没有完全考虑测试用例执行时的顺序信息.针对上述问题,提出测试用例执行轨迹分析的故障定位方法,该方法首先通过控制流分析获得测试用例的执行轨迹,然后将执行轨迹编码成序列信息用于训练循环神经网络,最后将一组虚拟测试用例输入网络中预测代码块的可疑度.通过在Siemens套件上的实验和分析,验证了所提方法的有效性.
  • 许能闯,袁健,高喜龙
    2019, 40(1): 158-163.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    Stack Overflow问答社区已经成为软件开发者解决开发问题的重要渠道.但社区答案多样,信息繁杂,大量问答使开发者难以找到自己问题的匹配项,导致大量时间花费在寻找最佳答案上.为了解决上述问题,提出了含代码的IT社区答案质量评价模型.该模型首先收集所有符合要求的带有源码的问题答案对,分析问题中源码和答案中源码的相似程度,同时度量代码质量,然后结合用户评论对该答案的评价,统计得分,使得答案质量得以量化.最后按分数从高到低对答案进行重新排序,使代码片段质量高、相关程度高的信息出现在前列,方便用户寻找高质量的答案.实验证明,该模型能快速有效地完成IT社区答案质量评价,对答案进行重排序,给开发者迅速定位最佳答案带来非常实用的价值.结果表明,该模型切实可行.
  • 廖志芳,李斯江,贺大禹,赵本洪
    2019, 40(1): 164-168.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了更好地管理GitHub开源软件开发的整个过程,本文构建了一个完整的开源软件开发过程中用户行为分析的模型(简称OUBA-Model).在该模型中,本文首先提出LRF用户行为重要度度量方法对开源软件开发中相关的用户行为重要性进行度量,得到用户行为中的关键用户行为;然后对关键用户行为进行分析.实验结果表明在开源软件开发中与PR和Issue相关的用户行为显得尤为重要,且在开源软件开发过程中这些行为与开源项目的流行度之间存在相关性.同时,分析的结果可以更好地指导GitHub开源软件的管理与开发.
  • 陆成刚
    2019, 40(1): 169-175.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    经典的动态时间规整算法(Dynamic Time Warping,DTW)对长度相差剧烈的两个序列之间的相异(似)性度量会引入长度的影响,这种影响在多对序列之间匹配时造成度量数值上的失衡从而导致DTW度量相似性的失效.该文分析了这种失效性的来源,提出祛除长度差异影响的均值DTW法.和传统DTW法相比,均值DTW是其非平凡的推广,因而无法直接使用基于动态规划原理的算法.基于该文给出的动态规划的匹配路径数目计算,强调了枚举法施加于均值DTW的不可行性.在引入均值的累计计算技巧后,将均值DTW纳入传统的基于动态规划原理的算法框架,实现了等价于DTW计算复杂性、双倍于DTW存储占用的均值DTW算法.该算法相比于DTW在电离辐射时间序列的聚类实验中将算法结果的精度指标至少提升了50%以上.该文的创新性在于:1)首次发现了DTW可能失效的长度差异因素;2)提出了均值DTW的概念;3)首次提出了动态路径数目的定量计算方法;4)给出均值DTW的加窗限制版本.
  • 张硕,赵卓峰,王桂玲,刘杰
    2019, 40(1): 176-180.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    ETL(Extract-Transformation-Loading)作为一种将不同来源的原始数据转换为有效信息的数据集成手段,可为基于综合信息的研判分析提供支持.然而,在当前信息共享和大数据等发展趋势下,各行业研判分析活动表现出多样化、动态性的特征,往往需要面对大量动态、突发的数据抽取、转换及加载需求,传统预定义式的ETL方式难以快速实现.为此,提出一种支持探索式研判分析的动态ETL流程服务,包括探索式研判分析的基本思路、动态ETL流程服务的实现及ETL处理并发性能优化方法,并结合某公安联合作战指挥应用案例对动态ETL流程服务进行了验证,实际应用表明该服务能够支持以“边构造边执行”的方式实现用于研判分析的ETL流程.
  • 段玉聪,邵礼旭,曹步清,周长兵,唐朝胜,宋正阳
    2019, 40(1): 181-185.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    互联网资源存在非确定、不保证、超复杂特性,同时还有高度时效性.本文主要对用户提出的具有正反判定性问题进行有限次数的递进搜索,通过递进搜索逐步提高搜索出的资源的可信度,同时引入数据图谱、信息图谱和知识图谱三层架构,将网络上资源进行组织.本文提出的面向非确定、不保真、复杂资源环境的正反双向动态平衡搜索服务提供方法通过语义分析理解用户检索信息的倾向性,按正反倾向对用户提出的需求进行搜索,根据每次搜索的条目数以及每项条目对应资源的熵值计算该倾向资源的可靠性,虚假信息以及失效信息会随着递进搜索的次数被排除,提高了搜索资源的质量,同时避免面对无穷尽超复杂性问题时搜索陷入死循环的情况.本文应对当前医疗数据的高时效性以及复杂的医疗资源环境,将此搜索策略应用于医疗资源处理系统中,为医疗工作者提供高准确度的医疗资源检索服务.
  • 涂晓敏,石鸿雁
    2019, 40(1): 186-189.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对改进的局部稀疏系数 (Enhanced LocalSparsity Coefficient,简称ELSC)算法在邻域查询过程中存在的不足,以及为了提高算法查准率,提出了一种基于方形邻域和裁剪因子的离群点检测算法.首先采用方形邻域,吸取网格算法的思想,以扩张的方形邻域代替网格分割,快速地排除聚类点,避免了网格算法的“维灾”问题.其次为了提高算法的精确度,引入裁剪因子的概念对候选离群点集进行精选.最后通过新定义的局部稀疏指数确定离群点.试验测试表明,该算法的执行效率与检测精度均优于ELSC算法.
  • 田秋亭,韩德志
    2019, 40(1): 190-193.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在云存储数据共享应用场景下,用户的属性不是一成不变的,因此用户或者属性级的撤销方案就显得尤为重要.本文从云存储中属性撤销的两种分类出发,介绍了属性的直接撤销和间接撤销,回顾了相关的研究历史,并列举了三个不同的属性撤销方案,对云存储中属性撤销机制进行了综述.最后,对本文进行了总结.这些工作将对云存储中属性撤销机制的进一步研究提供理论参考.
  • 冯雨,易本顺,吴晨玥,章云港
    2019, 40(1): 194-198.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于水体对光的选择性吸收以及杂质对光的散射效应,导致水下图像色彩失真以及对比度下降,针对这一问题,提出了一种改进的水下图像复原算法.该方法通过将图像红通道反转来避免红通道快速衰减的影响,将暗通道先验用于红通道反转图像的复原,并利用背景光强度修正各通道透射率,在复原过程中采用了一种简单的自动白平衡算法去除严重的色彩失真.实验结果表明,算法能有效复原出清晰图像,去除颜色失真,且对人工光源照射区域同样适用.
  • 易清明,谢志煌,石敏
    2019, 40(1): 199-204.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了降低高效视频编码(HEVC)的帧内编码计算复杂度,本文提出一种应用于预测模式决策和编码单元大小决策的帧内模式快速编码组合算法.在预测模式选择上,本文根据预测单元(PU)的纹理信息对粗模式决策(RMD)和率失真最优化(RDO)候选列表进行筛选以减少计算复杂度.在编码单元(CU)大小决策方面,根据CU的纹理复杂度,对平滑简单的CU自适应地终止划分,对纹理复杂的CU跳过编码提前进行划分,减少CU深度遍历的时间.实验结果表明,本文算法与HM参考模型相比,能够平均降低38.0%的编码时间,而BDBR仅增加0.33%.与现有的优秀算法相比,本文算法进一步降低了编码时间,且具有更好的编码质量.
  • 陈青,宗偲琦
    2019, 40(1): 205-209.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有的数字图像水印算法在应用于医学图像时过于复杂,接收端定位感兴趣区域处理时间长的问题,提出一种依据特征值自动还原感兴趣区域的双水印嵌入算法.使用Harris角点法提取医学图像特征值,根据特征值分布划分感兴趣区域,使用奇异值分解将认证水印嵌入感兴趣区域经过轮廓波分解后的低通子带的最大奇异值中,病人信息嵌入至经过轮廓波分解后的非感兴趣区域中频子带系数中,并选择一定数量的感兴趣区域稳定特征点值嵌入至高频子带中.实验结果显示嵌入水印前后特征提取匹配程度高,篡改探测实验成功率均大于90%,PSNR值大于42db.算法通过提取特征值实现了感兴趣区域自动选择,提高实际应用效率,充分利用轮廓波分解得到多个子带提高图像水印负载能力,与奇异值分解法结合保证水印具有良好的不可见性和抗攻击能力,增强医学图像传输的安全性和完整性.
  • 谭龙江
    2019, 40(1): 210-214.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对目前存在的单幅图像去雾算法无法有效处理天空区域的缺点,提出天空识别的改进暗通道先验去雾算法.首先利用差分函数与暗通道信息结合的方式来去除天空区域中高亮像素带来的干扰,准确估计的大气光;随后改进暗通道先验中透射率的估计方式,使其能对天空区域和景物区域分别估计,得到初略的透射率图,再联合自适应中值滤波和双边滤波快速地修正细化;最后利用物理散射模型估计无雾的清晰图像.算法与多种存在的图像去雾算法相对比,结果表明算法不但能对图像中景物和天空进行准确的去雾处理,且运行时间还提高了至少29%,能有效用于监控系统中的图像去雾.
  • 夏筱筠,林浒
    2019, 40(1): 215-220.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着我国智能制造技术的发展,预测性设备维护在工业环境中扮演着日益重要的角色.目前大多的健康预警算法针对性较强,自学习能力不足,导致算法的适用性、灵活性存在较大的局限性.为此,本文以滚动轴承为研究对象,基于状态检测的设计策略,完成了滚动轴承健康维护的实施方案;根据以上实施方案,提出并实现了自组织特征映射网络的故障诊断算法及自适应 ARMA 故障预警算法,提高了滚动轴承故障诊断与预警的智能化水平及对健康预警的处理效率.实验结果表明,所研究的算法对于实现可靠的滚动轴承故障诊断及预警具有良好的应用效果.
  • 吴健飞,刘勤明,吕文元,叶春明
    2019, 40(1): 221-225.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    目前,设备健康预测问题的研究大都在样本数据准确下进行,而在样本数据不确定下的研究却很少.因此,针对不确定样本数据下设备健康预测问题,提出了集成Dempster-Shafe(DS)证据理论与马尔可夫模型(MM)的联合优化模型.首先,基于马尔可夫模型,利用DS证据理论建立状态识别框架.其次,用区间数表示不确定的数据,并利用区间数之间的距离和相似度作为产生基本概率赋值(BPA)的证据,为了使预测结果更加可靠,采用Pignistic概率转换将BPA转化为基础状态的概率分布.最后,通过案例分析对模型进行评价和验证.结果表明,提出的方法能够有效解决数据不确定下的设备健康预测问题.
  • 侯晨煜,孙晖,周艺芳,曹斌,范菁
    2019, 40(1): 226-231.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    短时客流预测在为人类构建智慧城市,提供风险预警,保证出行安全中扮演着重要的角色.本文在神经网络算法的基础上,结合卡尔曼滤波,提出了一种新型有效的地铁客流短时预测算法.对于要预测的时刻t,算法利用它之前24小时的客流量作为输入特征.由于实验数据存在噪声,本文利用卡尔曼滤波对实验数据进行去躁平滑处理.最后算法利用BP神经网络和LSTM递归神经网络进行建模与预测.我们利用杭州地铁提供的真实购票数据进行大量实验,证明了BP神经网络(基于adam算法和relu激活函数)以及LSTM递归神经网络(基于adam算法和tanh激活函数的)准确度最高,预测的平均绝对误差最小(5%左右).另外,实验还证明了卡尔曼滤波能够有效减少预测的平均绝对误差.相比于不使用卡尔曼滤波的神经网络,使用卡尔曼滤波后的神经网络算法可以降低相对25%的MAE.
  • 王振飞,陈金磊,郑志蕴,刘冰
    2019, 40(1): 232-235.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着计算机科学技术的发展,将计算机技术应用在医疗方面进行疾病预测已经成为当前研究的热点.针对单一全互连前馈神经网络难以应对心血管疾病预测时的多维数据,并且参数和结构设计需要人工实验确定,泛化收敛的能力差等问题,本文提出一种自适应模块化神经网络结构模型(AMNN).首先,对训练数据集采用概率密度峰值聚类算法确定训练数据集的聚类中心,以此确定每个模块的训练样本集,然后每个模块采用训练BP神经网络算法,该算法可以利用分配来的训练样本数据自适应构建模块结构.实验结果表明,该模型相对标准的随机森林算法和传统单一全互连前馈神经预测心血管疾病准确率高,收敛速率快.
  • 游丽平,陈德旺,陈文,刘林
    2019, 40(1): 236-240.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    合理的地铁站点分类对站点管理和交通规划有重要的意义.针对现有的站点聚类分析研究中均采用单一的聚类方法取得的效果不够理想,鲁棒性不高等问题,提出了基于聚类集成方法的地铁站点类型研究方法,并提出了相应的稳定性判别指标.该方法结合福州地铁1号线工作日客流数据,首先运用层次聚类、k均值聚类和模糊C均值聚类三种方法产生基聚类;其次通过基于共协关系矩阵的集成方法实现对基聚类的集成.实验结果表明,聚类集成相较于其他三种方法在数据集划分上更加稳定.最终将福州地铁1号线站点分为超高流量站点、高流量站点、中流量站点以及低流量站点4类.