过刊目录

  • 全选
    |
    计算机网络与信息安全
  • 计算机网络与信息安全
    彭 臻1,王 田(1),梁俊斌2,赖永炫3,王国军4,贾维嘉5
    2017, 38(2): 193-199.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统固定无线传感器网络在进行目标跟踪过程中面临跟踪质量较低、网络能耗较高等问题.引入移动节点后所组成的异构无线传感器网络提供了新的解决方法,即移动式目标跟踪.目前的研究大多对被跟踪目标的探测和定位混为一谈,本文区分了以探测为主和以定位为主的两类方法,着重介绍以探测为主的移动式目标跟踪方法的研究现状.通过对比现有方法在跟踪质量和网络能耗等方面的优缺点,揭示了现有研究存在的问题.总结了移动式目标跟踪领域存在的研究热点和趋势.
  • 计算机网络与信息安全
    杨晨凯1,黄刘生(1,2),邓 厚1,徐宏力(1,2)
    2017, 38(2): 200-203.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了缓解无线Mesh网络中的网络瓶颈问题,可引入内容分发技术,将Mesh路由器作为镜像服务器,以降低无线网络中的数据请求时延.针对无线Mesh网络中的内容副本分配问题,设计了更合理的网络模型,将各Mesh路由器作为M/M/1排队模型,在此基础上对问题进行形式化定义,并提出了两阶段的内容副本分配算法.在该方案中,根据各Mesh路由器收集到的内容热度信息决定每个内容对象所需的副本数量,然后通过基于贪心策略的启发式算法求解内容副本的分配方案.仿真实验的结果证明该算法较大地优化了无线Mesh网络中的平均时延,负载分布等网络性能参数.
  • 计算机网络与信息安全
    李广野(1,2),雷为民1,张 伟1,张松阳1
    2017, 38(2): 204-208.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络测量是多径传输控制中至关重要的技术,但现有的网络测量技术基本停留在仅对承载网的媒体传输进行测量与反馈,并不适用于多径传输服务模式.提出一种面向多径中继传输控制的网络测量方法,对多径传输路径及中继节点反馈的网络QoS参数进行了量化设计,给出了根据测量结果得到的参数耦合关系.另外,由于基于媒体传输控制的传输报文采用RTCP协议扩展,详细设计了扩展后的报文规范及复合QoS报告格式,为多径QoS参数的反馈提供依据.通过仿真实验与评价,验证了该方法的有效性和可行性.
  • 计算机网络与信息安全
    段元新,倪晓军,章 韵
    2017, 38(2): 209-212.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    如何在规模庞大的数据中心网络内部进行负载均衡,实现网络资源的优化利用,是个亟待解决的问题.OpenFlow技术提供了一种可编程操作的流量控制方法,已成为近期解决负载均衡问题的热门关键技术.针对数据中心常见的Fat-tree网络拓扑,就数据流在OpenFlow网络中的路径设计问题,利用OpenFlow网络控制器集中控制的优势,在控制器上设计并实现了一种动态负载均衡路由策略.该策略首先选出源节点与目的节点间的前K条最短路径,然后根据获取的网络链路实时状态信息,对选出的前K条路径进行多指标综合评价,并从中选出数据流的最优转发路径.最后,采用Floodlight控制器和Mininet仿真平台,对提出的负载均衡路由策略进行可行性验证和性能验证.结果表明,该策略有效缓解了网络阻塞,提高了链路利用率.
  • 计算机网络与信息安全
    陈晓辉(1,2),张银银2,付云霞(1,2),雷帮军(1,2)
    2017, 38(2): 213-216.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对无线传感器网络全节点定位求精问题展开研究,应用自组织映射算法进行定位求精,提出一种优化领域函数,实现快速收敛的双向调整定位算法.利用传感器节点作为神经元节点,通过节点间距离相关度建立自组织神经元网络,通过双向调整邻域函数实现算法对节点间距与测量距离误差的正负性的适应能力,达到收敛性、高定位精度性、快速性要求,最终实现传感器网络的自组织定位.应用MATLAB仿真对本文提出的算法与单向调整算法进行比较,本文提出的算法较大地提高了算法的收敛性和定位精度,较好地反映传感器节点的拓扑结构,且稳定性好.
  • 计算机网络与信息安全
    宋 巍,谢兴波,刘丽珍,王函石
    2017, 38(2): 217-226.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社交媒体的广泛使用,积累了大量的用户数据,为深度挖掘和分析海量异构社交网络带来了巨大的机遇,用户隐藏属性推断应运而生.用户隐藏属性推断,旨在自动预测用户的未知属性与潜在特质.总结了基于社交媒体的用户隐藏属性推断的最新进展.首先介绍了用户隐藏属性推断相关研究;进而将用户隐藏属性推断归纳为三项主要任务,即数据采集与筛选、特征设计和推断方法,并对它们进行了细致的介绍和分析;介绍了用户隐藏属性推断的应用;最后总结并分析了未来的研究方向.重在对用户隐藏属性推断研究的主流方法和前沿进展进行概括、比较和分析.
  • 计算机网络与信息安全
    师尚伟1,黄永峰1,王 烨2
    2017, 38(2): 227-231.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本作为语言的视觉形式是人类最重要的交流工具,基于文本的信息隐藏算法具有很高的实用价值.文本的一个明显特点是高度凝练,信息冗余少,因而文本隐藏的容量较低.另一方面,传统的文本隐藏建立在修改载体的基础上,而文本语义对于修改非常敏感,微小的修改可能引起明显异常,因而文本隐藏的隐蔽性较差.针对以上问题,深入分析了网络文本大数据的特点,据此设计了一种基于网络文本大数据的信息隐藏算法,把对载体的修改转化成对载体的检索,并通过位置信息定位秘密消息,从而不需要修改载体即可嵌入信息,隐蔽性大大提高.另外,实验结果显示本算法具有接近通用字符编码效率的嵌入率(18比特/字符),是一种高效的信息隐藏算法.
  • 计算机软件与数据库研究
  • 计算机软件与数据库研究
    朱亚会1,陈 丹(1,2 ),庄 毅1
    2017, 38(2): 232-237.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云数据中心有大量的服务器,服务器的各种资源利用率不均衡将会导致该服务器不能进一步部署虚拟机,造成资源浪费.现有的研究主要针对某几种资源(例如CPU、内存)来均衡服务器之间的资源利用率以使得云数据中心负载均衡,但很多研究工作没有充分考虑服务器上各种资源之间的利用率均衡问题(例如:服务器上CPU和内存的利用率相差较大),基于此本文提出一种基于资源利用率均衡的虚拟机调度模型VMSM-RB.该模型将虚拟机调度问题抽象为不定维向量装箱模型,其中向量的每一维代表一种类型的资源,本文进一步提出一种自适应粒子群优化算法SA-PSO求解该模型,最后通过仿真实验验证了该模型的有效性.实验结果表明,VMSM-RB模型能够对云数据中心中的虚拟资源进行高效的调度与管理,相比其他同类模型和算法能够更好的均衡服务器上各种资源的利用率,减少资源浪费.
  • 计算机软件与数据库研究
    陶永才1,丁雷道1,石 磊1,卫 琳2
    2017, 38(2): 238-242.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数据倾斜一直是影响MapReduce性能的关键问题之一.为缓解数据倾斜问题,提出一种基于抽样分区的MapReduce在线负载均衡机制:MR-LSP(MapReduce on-line Load balancing mechanism based on Sample Partition).MR-LSP在作业执行之前,通过对源数据抽样分析,预测数据的分布特征,动态采取相应的负载均衡数据分区策略;在作业运行期间实时监控节点负载,进一步动态优化数据分区策略.实验结果表明:MR-LSP能够提高系统3.2%的负载均衡,降低4.3%的作业执行时间,有效缓解了MapReduce的数据倾斜问题.
  • 计算机软件与数据库研究
    吴 丹,杨卫东
    2017, 38(2): 243-248.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    路网关键词查询是近几年关于地图服务的研究热点之一,关键字查询简单易用,但难以“猜测”用户查询意愿.针对城市购物、城市旅游等路径规划问题,提出一种基于聚类的路网上关键字CKR(Cluster based Keyword Route)查询方法 ,不仅能够满足用户购物、用餐等基本要求,还考虑了诸如停车成本、候车成本等相关耗费.给出了问题的形式化定义,提出、设计并实现了基于步行距离的路网聚类算法、基于关键字的最小集合覆盖算法,在满足用户查询需求、减少额外成本(停车、候车等)的同时,有效缩小路网搜索空间,提高了查询性能.在真实数据集上,进行了多个实验,实验结果表明该方法是可行且有效性.
  • 计算机软件与数据库研究
    胡思文(1),李 兵(2,3),何 鹏4,赵玉琦2,刘海洋1
    2017, 38(2): 249-253.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在软件开发过程中,为加快新开发者对系统的了解,往往优先推荐他们关注一些更重要的类,从而快速掌握系统最基本的概念.目前,关于网络节点重要性度量的方法很多,h指数作为一种成功用于定量评估研究人员学术成就的指标却很少应用于软件网络中重要类的识别.以Tomcat、Ant和Jung项目为研究对象,使用h指数来度量软件系统中类的重要性,并与已有的中心性指标进行对比,验证该指标的可行性以及评估的效果.实验结果表明,h指数能够很好的识别出软件系统中更重要类,尤其是考虑节点的连边权重时,且相比已有的中心性指标效果更好.
  • 计算机软件与数据库研究
    张 博(1,2),张 斌1,郭鹏伟1,孙达明1
    2017, 38(2): 254-258.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在同时从点击文档与历史查询条件等多个扩展词来源选取扩展词的过程中,扩展词来源对应的约束值可以影响该来源的扩展词被优先选择的程度.由于现有模型为不同查询条件的相同扩展词来源设置相同的约束值,因此导致所有查询条件优先选择的扩展词来源相同.然而观察日志可以发现,不同查询条件适合从不同扩展词来源选取扩展词.由此,提出一种扩展的带路径约束的随机游走模型.该模型首先对每个查询条件与不同来源扩展词的相关性进行统一尺度的估计,并根据估计结果对不同扩展词来源对应的约束值进行估计,从而使不同的查询条件能够优先选择不同来源的扩展词.一系列实验表明,本文方法构造的扩展查询条件具有更好的性能,更符合用户的查询目标.
  • 计算机软件与数据库研究
    胡启志,颜 娜,谢瑾奎
    2017, 38(2): 259-263.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    深入挖掘社交网络中传播力较强的个体,并利用其进行产品营销往往会达到事半功倍的效果,影响最大化问题就是在特定社交网络中寻找影响力较大的个体.为了更加准确的评估影响力,本文不仅从节点相似度方面进行改进,而且从信息内容本身出发,基于信息在社交网络中的传播,结合信息词频等信息自身特点来刻画节点的影响力,提出了基于信息词频和节点相似度的影响最大化算法(IMFS,Influence Maximization algorithm based on term Frequency and node Similarity).随后,在真实的社交网络中对该算法进行了实验,并与传统的影响最大化算法对比,实验结果表明由IMFS得到的集合的影响范围大于其他启发式算法的结果,同时算法的运行速度也有相应的提高,说明了本文提出的算法是解决影响最大化问题的有效算法.
  • 计算机软件与数据库研究
    张娇鹏1,王 锋1,梁吉业2
    2017, 38(2): 264-267.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中,数据库中数据取值的动态更新也是一种数据集动态变化的类型.特征选择是一种有效的数据预处理工具,面向数据取值动态更新的特征选择方法也已经引起了众多研究者的广泛关注.为此,基于粗糙集理论和信息熵的概念,提出一种面向数据取值动态变化数据集的特征选择方法,可一次处理一组取值发生变化的数据.算法中首先分析了信息熵随数据取值动态变化的更新机制,以信息熵作为特征重要度的度量,设计了基于信息熵的粗糙特征选择算法.实验结果进一步验证了新算法的可行性和高效性.
  • 计算机软件与数据库研究
    徐 李1,董才林1,喻 莹2
    2017, 38(2): 268-272.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为改善Web服务QoS预测效率,向用户提供高质量的Web服务,提出一种融合位置最近邻法则的扩展矩阵分解算法.该方法首先利用用户和服务的位置信息进行用户和服务的最近邻选择,克服了传统的QoS预测算法对Web服务位置信息利用不准确或不足的问题.然后将邻域信息融入矩阵分解框架,改善了矩阵分解技术在QoS预测中本地信息利用不足的问题,同时采用梯度下降算法进行QoS的预测.最后,本文基于真实Web服务数据集WSRec进行了对比实验,实验结果表明了本文所提算法的有效性.
  • 计算机软件与数据库研究
    孙 勇1,谭文安(1,2),张全全1,沈腾腾1
    2017, 38(2): 273-276.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对带全局约束条件的工作流可靠性计算问题,提出一种基于均匀多样性适应度函数的多子群协同进化算法,将工作流可靠性约束优化转化为双目标优化问题;为提高粒子在进化过程中的搜索能力,进化群体被分解为若干子群;综合考虑双目标优化问题的特点,设计了一种新颖实用的均匀多样性适应度函数,让各子群体在不同方向上协同搜索目标解;最后根据其适应度排序构造了基于非支配集合的全局最优解.仿真实验表明所提算法具有良好的效率,求得的最优解集全部满足约束条件,且分布和质量均优于基于非支配档案的混合离散粒子群算法.
  • 计算机软件与数据库研究
    万路康,章倩雯,谢瑾奎
    2017, 38(2): 277-281.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在社会网络中,量化分析用户影响力及用户之间的影响关系已经变得越来越有必要,对精度的要求也越来越高.网络模型构建的好坏,模型预测用户行为的好坏对商业营销、社会影响最大化等应用都有着至关重要的意义.如何从不同方面量化社会影响力?如何量化不同方面下的用户之间的影响力强弱?如何在社会网络中构造这样一个模型?为了解决这些问题,提出一个基于主题概率的从众性模型(Topical Conformity Model,简称TCM),模型从主题层对社会网络进行建模,考虑不同主题概率下的用户影响力以及用户之间的影响关系.将该模型应用在学术网络中的用户关键词预测上,并与前人的方法进行实验对比,各项预测指标都有一定的提升,其中AUC值提高了4.3%,验证了本文提出的模型对于用户行为预测的有效性.此外,本文的工作还解决了如下两个问题:1、寻找某个主题下最可能选择某行为的用户;2、寻找某个用户选择某个行为受影响最大的主题.
  • 计算机软件与数据库研究
    李东静1,李博涵(1,2),张 潮1,夏 斌1,杨 群1
    2017, 38(2): 282-286.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着无线通信和定位技术的不断发展,对移动对象的位置服务提出了更高的要求.由于感知设备的限制以及数据更新延迟,使得实际得到的数据具有不确定性.为了有效的发现大量存在的边界区域内不确定移动对象对广泛分布的全局查询对象所产生的影响,提出了概率反向最远邻查询算法,以解决不确定移动对象的弱影响集问题.给出不确定移动对象数据模型、空间支配定义以及概率反向最远邻查询的形式化定义,检索那些比给定概率值高的查询对象的反向最远邻的不确定移动对象.提出了TSF算法和TSR算法,能够有效过滤候选集,加速查询效率.实验结果验证了算法的有效性.
  • 计算机软件与数据库研究
    曾苏梦,唐明董,唐 兵,曹步清,戴小玲
    2017, 38(2): 287-292.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在面向服务的环境中,如何选择满足用户偏好的高质量服务是一个关键问题.以往的研究大多考虑单个用户选择服务的情形,多个用户协同选择一个共享服务的问题则较少得到关注.使用群决策支持技术,提出多个用户协同选择一个共享服务的方法.该方法首先根据用户偏好计算每个用户对候选共享服务的满意度,然后考虑不同用户的优先级计算多个用户对每个共享服务的总体满意度,最后对候选服务排序,并选择总体满意度最高的共享服务.我们方法的优点是不仅允许用户定义柔性的个性化属性偏好需求,而且可以平衡多个用户的不同偏好引起的冲突.
  • 计算机软件与数据库研究
    黄晓成1,尹建伟(1,2)
    2017, 38(2): 293-298.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在线视频服务是互联网服务的重要内容,存储是在线视频服务提供的基础.HDFS作为面向通用文件的云存储系统,被很多视频服务网站采用,但其负载均衡工具没有考虑利用视频文件在线播放时的带宽消耗特性使集群的带宽资源得到更充分的利用.为解决这一问题,提出视频存储场景下的负载均衡方法VOBM,它对视频文件在线播放时的带宽消耗与视频文件的码率、数据块大小和访问热度的关系进行了分析并建立了新的负载评估模型,在此基础上它在负载方案生成和负载调度两个环节中加入了对带宽消耗因素的考虑.在HDFS原有负载均衡工具的基础上实现了该方法,实验证明该方法能够有效避免高带宽消耗数据块的聚集,在高带宽消耗视频文件作为服务访问热点的实验场景中,该方法在90%的场景中优于原有负载均衡方法,最高能使数据节点集群中瓶颈节点的带宽峰值降低20%.
  • 计算机软件与数据库研究
    孙嘉文1,王志波(1,2),周重邑1,王 帅1,詹 辉1,余 滢1,崔晓晖(1)
    2017, 38(2): 299-303.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着互联网的发展以及社交网络服务的普及,人们使用互联网传播信息的门槛逐渐降低,越来越多的人们通过多种多样的社交媒体来分享自己的个人信息.如今的互联网,充斥着巨量的个人信息,包括用户关注的事物、生活中的新闻、用户对社会事件发表的评论等.且可以发现一个现象,这些个人信息并不是随意的分布在互联网中的,而是有规律的按照社交媒体的特质分门别类的分布在各个社交媒体之中.所以通过任何一个单一的社交媒体了解用户都只能获取该用户一部分的信息,只有通过多个社交媒体共同的去了解用户,才能得到较为完整的信息.在不同的社交媒体之中发现一个人的多个社交账号(亦即个体身份识别)是社交数据融合的前提.个体身份识别是一个从不同的数据来源识别单一个体的过程.提出一种方法使用用户社会网络关系以及用户行为模式进行个体身份匹配.在收集了可能获得的用户社交网络以及用户信息之后,这个方法对这些信息进行分析和比较,包括进行网络之中结点的相似性计算以及字符串相似性计算,最后根据计算结果判定是否匹配.该方法划分为两个模块,分别为相似度计算模块与计算结果优化模块.
  • 计算机软件与数据库研究
    熊丽荣,雷静之,刘 坚,汤 颖
    2017, 38(2): 304-309.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    客观的云服务评价需要综合考虑客观质量指标和用户主观反馈,提出一种综合云服务客观质量分析和用户主观反馈评估的云服务评价方法.针对用户反馈存在的主观性、不确定性和反馈信息的时效性问题,提出一种用户主观反馈评估模型.该模型针对用户反馈存在的主观性,设计一种主观反馈偏好模型,并结合不确定性处理方法云模型实现定性评价到定量评分的转换,降低了用户主观性影响,并体现了用户反馈存在的不确定性.针对反馈信息时效性问题,引入信息价值系数构建用户反馈时效性模型,实现反馈信息的时效性处理,客观地体现了反馈信息随时间的价值.用户主观反馈评估实验和分析验证了文中提出的用户主观反馈评估模型的有效性.最后的云服务排名实验和分析表明主客观相结合的云服务评价方法能够更合理、全面地体现云服务的综合质量.
  • 计算机软件与数据库研究
    于美琪,邝 砾,呙 斌,曹高峰
    2017, 38(2): 310-313.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着移动应用的数量增长,如何在海量应用中为用户推荐其感兴趣的应用受到了广泛关注.传统的协同过滤算法通过提取用户共同评分项目信息来计算用户相似度.然而,协同过滤算法普遍存在数据稀疏性问题,这在一定程度上导致了Pearson公式的计算结果不能准确的反映用户的相似程度.为了改善由于数据稀疏性问题导致的推荐结果不准确,我们使用K-means方法对项目进行基于语义相似的聚类,以实现基于相似项目的用户相似度计算,在此基础上,提出一种融合社会网络和项目特征的移动应用推荐.实验表明:融合了社会网络和项目特征的移动应用推荐能够缓解数据稀疏性问题对协同过滤算法的不利影响,在一定程度上提高了推荐结果的准确度.
  • 计算机软件与数据库研究
    李 征,牛阿茜,鲁 璐,王弯弯
    2017, 38(2): 314-318.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着网络上服务资源的快速增长,如何准确地发现服务、提高已发现服务的可信度成为一个亟待解决的关键问题.有研究表明,Web上以目标驱动的查询方式可以返回更准确的结果.因此,在已获取的领域服务目标基础上,提出一种基于Wiki和WordNet中词汇间关系的服务目标知识扩充方法,并且通过ProgrammableWeb网站提供的真实服务集验证了该方法的可行性和有效性.实验结果表明,该方法可以有效地对服务目标知识进行扩充.基于扩充的服务目标知识,一定程度上可提高服务发现、推荐方法的可信度,并且能够为具有相同角色的用户的需求描述提供指导.
  • 计算机软件与数据库研究
    刘景方1,姜骁宴1,张朋柱2
    2017, 38(2): 319-322.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    根据项目工作分解结构理论,项目可以分解为相互独立的多个工作单元,文章将项目评审人员指派问题看作专家检索问题,提出一种面向工作分解结构的评审人员指派方法,旨在实现评审人员的知识能够尽量多的涵盖项目工作单元.将工作单元信息作为检索条件,使用专家已有项目信息来代表专家,以专家完成的项目信息作为被检索内容,完成检索匹配.文章分析了项目评审人员指派问题;给出了面向工作分解结构的项目评审人员指派方法;描述了实验设计并给出了方法评价指标;展示了方法的评价结果;验证了方法的良好效果.
  • 计算机软件与数据库研究
    林美辰(1,3),冯志勇(2,3),陈世展(2,3),黄科满(2,3)
    2017, 38(2): 323-327.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于语法规则不匹配和功能欠缺的阻碍,Web服务组合及互操作受到挑战.作为一种理想的解决方式,服务适配器用以弥补服务之间的语法限制和功能欠缺,因而适配器的构建尤为重要.借鉴WSDL2Code原理,在Eclipse环境下,构建了一款复用服务网络中知识的语义Web服务开发插件.首先,通过复用服务网络中已有Web服务的描述及其本体概念,生成规格化的服务描述文档.接着,设计实现了从描述文档生成Java客户端和服务器端实现框架的自动化工具.最后,通过两个实验展示并测试了该工具的使用流程及效果.该工具不仅仅提供了构建适配器的服务开发功能,更在于重用和共享服务网络中已有的信息和知识、消除服务语义冲突和歧义方面有着积极的现实意义.
  • 计算机软件与数据库研究
    张 峰,温 彦,魏永山
    2017, 38(2): 328-333.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于数据服务的互联网数据即时集成利用数据服务封装互联网上的数据源,用户根据个性化的需求即时组合服务,集成不同数据源中的数据.数据源服务化后,数据源间的数据关联需要通过服务间的关联实现.由于没有承载数据服务间数据关联的载体,已建立的关联无法得到复用,用户每次集成需手工选择和组合服务,导致组合过程易出错且效率低.提出一种数据服务超链模型,通过一个服务的输出参数与另一个服务的输入输出参数间的关联,表达两个服务之间存在的单向的数据关联;给出一种数据服务超链建模方法,重点实现基于组合案例的服务超链自动建模.通过与其他服务关联模型比较,数据服务超链可全面表达服务间的数据关联;通过实验验证了建模方法的有效性.
  • 计算机软件与数据库研究
    曹 斌,彭宏杰,侯晨煜,杨克宇,范 菁
    2017, 38(2): 334-339.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着电子设备的普及,越来越多的人更愿意在他们的手机或者平板上阅读电子书籍.推荐服务的出现是为了从海量电子书籍中找到符合读者兴趣的书籍,其中协同过滤(Collaborative Filtering,CF)作为推荐系统的主流方法,也被应用在书籍推荐服务中.传统基于CF的书籍推荐在解决用户显性评分缺失问题时,仅考虑了用户对书籍的喜好程度与阅读时长和阅读频次等隐性反馈内容有关,忽略了在阅读书籍时不同用户间阅读速度可能存在差异.从阅读速度出发展开研究,提出阅读速度感知模型(Reading Speed-aware Model,RSA)和书籍阅读权重模型(Reading Book-weight Model,RBW),把用户的阅读时长转换为阅读速度,最后结合上述两个模型提出一个混合的速度-权重模型(Speed-Weight Model),将用户的隐性反馈转换为喜好程度的评分来补全CF评分矩阵.通过对现有方法的实验对比分析,本文所提方法能够在一定程度上提高书籍推荐的准确度.
  • 计算机软件与数据库研究
    薛 霄(1,2),刘东华(1,2),扣彦敏(1,2),孙 浩(1,2),桂 彬(1,2)
    2017, 38(2): 340-345.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了研究电子商务服务运行机制对依靠传统供应链运行的企业的影响,在对供应链进行抽象的基础上建立了服务桥模型,用于验证不同的服务运营策略将产品或服务由供应商到达需求方时难易程度的不同.提出针对电子商务服务运营的计算实验研究,包括模型构建、模型实例化及计算实验三部分.为了验证该方法,对相同市场需求环境下的电子商务服务运营与依靠传统供应链运营的企业进行了实验比较.结果表明,在外界条件相同的情况下,采用电子商务服务运营的企业,通过服务桥的比率较高,企业可以获得更高的利润.
  • 计算机软件与数据库研究
    王红斌,沈 强,线岩团
    2017, 38(2): 346-351.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    命名实体识别是自然语言处理研究领域中的一项很重要的基础性任务,是实体关系抽取和事件抽取等高层任务重要基石.如何在缺乏标注语料或只有少量标注语料条件下,提高命名实体识别的性能是自然语言处理领域的一个重要研究方向.针对这一问题,提出一种基于实例的迁移学习算法——TLNER_AdaBoost.该方法通过自动调整训练集中实例样本的权重和计算辅助训练样本的迁移能力来提高训练语料质量,并选取采用不完全标注语料的自学习方法和采用完全标注语料的基于条件随机场的方法来对该方法进行实验对比分析.经实验对比分析得知,本文方法在提高命名实体识别的准确率、召回率和F值的同时,大大降低了人工标注语料的工作量.
  • 计算机软件与数据库研究
    邓日升,岳 昆,武 浩,刘惟一
    2017, 38(2): 352-356.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    用户偏好是决定用户对商品评分的隐含变量,以构建包含用户偏好的隐变量模型、描述评分数据中相关属性间任意形式依赖关系及其不确定性为主要目标,以贝叶斯网作为各属性间依赖关系及其不确定性表示的基本框架,由商品评分数据构建不含隐变量的商品评分模型,提出基于半团结构向其中插入描述用户偏好的隐变量的方法,从而构建包含用户偏好的隐变量模型,并给出基于EM算法的隐变量模型参数估计方法,进而提出隐变量模型的概率推理算法和相应的商品评分预测方法.建立在MovieLens和Book-Crossing数据上的实验结果表明,本文提出的隐变量模型构建和相应的评分预测方法是有效的.
  • 计算机软件与数据库研究
    张 俊,刘 满,彭维平,闫玺玺
    2017, 38(2): 357-362.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协同过滤推荐算法中,相似性计算对推荐质量起着至关重要的作用.针对传统算法相似性度量方法的不足,提出一种融合用户兴趣相似性和评分相似性的协同过滤推荐算法.算法将用户的评分项目信息映射为兴趣向量,计算用户的兴趣相似性,并使用用户兴趣相似性和评分相似性进行两次融合,从而对传统相似性度量仅仅依靠用户评分进行相似性计算引起的误差进行修正.在计算相似性过程中,通过引入专家信任度的概念对用户未评分项目进行评分预测填充,从而降低由于数据稀疏性引起的评分相似性计算误差.实验结果表明,该方法在推荐覆盖率和准确性上相对传统算法有所提升.
  • 图形与图像技术
  • 图形与图像技术
    陈丽宁1,金一丞2,尹 勇2,唐强荣1
    2017, 38(2): 363-370.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对流体与海浪绘制进行了综述.首先,对流体与海浪的绘制方法进行分类,并介绍了各绘制方法的研究进展.流体与海浪的绘制方法可分为两大类:基于模型的绘制、基于视频数据的绘制.基于模型的绘制可分为基于计算流体力学(Computational Fluid Dynamics,CFD)模型的绘制、基于Perlin噪声模型的绘制、基于Gerstner波模型的绘制.其中,基于CFD模型的绘制又可分为基于Euler 法的绘制、基于Lagrange法的绘制;基于Gerstner波模型的绘制又可分为直接使用Gerstner波模型的绘制、使用快速傅里叶逆变换形式Gerstner波模型的绘制.基于视频数据的绘制可分为可控水体的绘制、大尺度水体的绘制.进而,对上述绘制方法进行比较,分析了各绘制方法的优缺点、适用范围.最后,探讨了各绘制方法的发展趋势.
  • 图形与图像技术
    金 鑫,谭晓阳
    2017, 38(2): 371-375.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    人脸特征点定位(又称人脸对齐)的目标是定位出人脸图片中可以描述人脸部件的特征点,如眼角、鼻尖、嘴角等.受限局部模型(Constrained Local Models)是一类重要的人脸特征点定位算法,其拟合过程通常可以形式化为两步:首先使用局部检测器扫描图片,为每一个人脸特征点生成一张响应图;然后基于响应图优化一个全局人脸形状模型,从而得到人脸形状(即所有人脸特征点)的一次更新.文献中的受限局部模型默认使用主成分分析(PCA)法建立参数人脸形状模型;而非参数形状模型如基于样本(exemplar-based)的方法虽然也被成功的应用于人脸特征点定位,但却没有被纳入受限局部模型的范畴.在这样的背景下,本文的贡献主要有3点:1)成功将基于参数(PCA-based)和非参数(exemplar-based)人脸形状模型的方法统一到概率形式的受限局部模型的框架之下;2)在3个公开的数据集LFW、LFPW、HELEN上汇报了几种典型的参数和非参数受限局部模型的性能;3)总结并讨论了参数和非参数受限局部模型的优缺点,如基于PCA的参数模型拟合速度更快,而基于exemplar的非参数模型精度更高.
  • 图形与图像技术
    李昆仑,耿雪菲,曹静媛
    2017, 38(2): 376-380.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在人脸识别领域中遇到的数据往往是高维的,一般会导致维数灾难问题.近年来稀疏表示(Sparse representation,SR)在处理人脸识别等问题时显示出一定的有效性,而后出现的稀疏保持投影(Sparse preserving projections ,SPP)算法又以保持数据的稀疏表示结构为目的成功应用于人脸识别领域,但仍存在一些问题.本文针对SPP算法在人脸识别中存在的问题进行了改进,提出了一种叫做鉴别稀疏保持投影(Discriminant sparsity preserving projection,DSPP)的算法.该算法有以下两方面的改进:(1)针对SPP算法未能有效地利用类标签信息的问题,本文利用最大散度差准则(Maximum scatter difference criterion,MSDC)重建SPP算法的目标函数;(2)针对SPP算法计算复杂度高的问题,本文利用带有相同类标签的训练样本用于稀疏重构.在ORL库、CAS-PEAL库、IMM库上的大量实验结果验证了算法的有效性.
  • 图形与图像技术
    石祥滨(1,2),厉复圳1,张德园1
    2017, 38(2): 381-385.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对稀疏表示重建精度高但计算速度慢,协同表示计算速度快但重建精度低的问题,提出一种兼顾重建精度与计算速度的算法,即强制稀疏编码算法.强制稀疏编码算法采用协同表示算法生成协同表示系数,并将其经强制稀疏处理后的结果作为稀疏表示算法迭代求解过程中的初始值和字典降维依据,从而达到通过设置倾向性初值和降低字典维数以提高求解稀疏表示速度的目的.在公开可获得的大量数据集上的实验表明,强制稀疏编码算法求解速度快,识别精度高,且所得编码向量稀疏度较高,在保证识别率的前提下,提高了计算效率.
  • 图形与图像技术
    杨 勇1,万伟国1,黄淑英2,姚 丽3
    2017, 38(2): 386-392.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对多聚焦图像融合过程中源图像未精确配准带来的伪吉布斯现象,提出一种稀疏表示和非下采样Shearlet变换相结合的图像融合方法.该方法首先利用非下采样Shearlet变换对源图像进行多尺度分解,低频系数采用稀疏表示进行融合,为了提高算法效率和更好地逼近低频系数,将初始融合的低频子图直接作为训练样本自适应构造过完备字典,高频系数采用改进拉普拉斯能量和取大的融合规则,然后重构低高频融合系数得到最终的融合图像.通过和多种融合方法进行对比实验,本文方法融合结果无论从主观视觉还是客观评价上都能得到很好的效果.
  • 图形与图像技术
    高 洁,吴立锋,关 永,王洪民
    2017, 38(2): 393-397.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    局部线性嵌入(LLE)是一种重要的流形学习算法,已广泛应用于图像处理和多维数据的可视化等领域,但其算法性能一直受邻域选择盲目性的制约.传统的邻域选择算法没有同时考虑高低维数据的分布情况,且没有对无效邻域点做出相应的处理,使自适应结果受初始值影响较大.为此,提出新的自适应流形学习思想,用邻域点到切平面坐标映射函数的一阶泰勒逼近,初步确定出局部邻域值;然后利用关于高低维分布差异性函数的邻域调整策略和权值邻域思想,对初始邻域值进一步调整.该方法提高了LLE邻域选取算法的稳定性,同时减小无效邻域点被选中的可能.仿真表明,基于本文方法确定的自适应结果在不同的初始邻域值下基本一致,在人工数据集Swiss-roll上获得理想稳定的降维效果.
  • 计算机算法研究
  • 计算机算法研究
    黄 山,苏一丹,覃 华,蒙祖强
    2017, 38(2): 398-404.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对量子遗传算法存在迭代次数多、计算时间长、容易陷入局部极值的问题,提出一种低偏差蒙特卡罗序列量子遗传算法,利用低偏差序列良好的均匀性,实现量子遗传算法探索与利用的平衡.首先,提出新的低偏差序列 H_ε 量子门来更新量子态形式的种群,提高算法探索量子态的能力,减少算法的迭代次数;其次,提出Pareto集邻域搜索,在当前近优解上用低偏差序列在当前解上进行邻域搜索,以寻找更优的解.在5个复杂函数优化问题上验证本文算法,实验结果表明:所提算法的寻优能力较传统量子遗传算法更强,解的质量有两个数量级以上的提高;算法的计算时间和迭代次数亦优于传统量子遗传算法,引入低偏差序列实现量子遗传算法探索与利用的平衡是可行的.
  • 计算机算法研究
    赵 佳,王士同
    2017, 38(2): 405-410.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对已有的基于特征加权距离的双指数模糊子空间聚类算法(DI-FSC)没有充分利用数据集中的已知信息,提出利用少量监督信息辅助聚类过程的特征加权距离的半监督模糊子空间聚类算法(SS-FSC).通过在该算法中加入特征加权距离来改善传统聚类中利用欧氏距离计算数据点之间差异的不足;同时向约束条件中引入指数 r和β ,增加了算法的灵活性.实验表明,所提出的算法在少量监督信息的辅助下,在真实数据集上有较好的聚类效果.
  • 计算机算法研究
    吴晓瑛1,魏 巍(1,2),崔军彪1
    2017, 38(2): 411-416.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    维度增加是数据动态变化的重要类型之一.为了快速有效地计算这类数据的属性约简,基于区分矩阵提出了两种维度增量决策表的属性约简方法:一种方法是通过新加入属性集的信息更新决策表的区分矩阵,并根据更新后的区分矩阵计算新的约简;另一种方法则是通过更新一种新提出的压缩决策表区分矩阵来计算维度增量后的属性约简.这两种方法都可以获得与非增量约简方法相同的结果,同时还可以显著地降低计算维度增量数据属性约简的耗时,其中基于压缩表区分矩阵计算维度增量数据属性约简的方法更为快速.理论分析和实验结果验证了算法的有效性和高效性.