小型微型计算机系统

Select

苏育挺,王慧晶

2017, 38(12): 2625-2629.

摘要 ( ) PDF全文 ( )

可视化

情感分析是自然语言处理领域中的一项重要研究任务.本文针对Twitter等社交媒体平台的文本信息,对有监督类和无监督类情感分析方法进行了调查研究,设计了一个利用结构化语言学特征实现基于词典的无监督类情感分析系统.系统由三部分组成:精准且带有情感感知的预处理保证了从情感词典中成功检索词语的情感分值和识别各类表情及其对应极性;结构化的语言学特征对情感分值进行逐级优化;最后通过情感分值计算器得到文本情感分值从而实现情感分析.模块独立性使其便于被单独修正、完善及扩展,此外,系统允许改变特征提取模块的配置进行情感分值计算从而优化在不同应用环境下的情感分析.

Select

低复杂度的HEVC帧内编码模式决策算法

朱威,张晗钰,易瑶,张桦,

2017, 38(12): 2630-2636.

摘要 ( ) PDF全文 ( )

可视化

新一代视频编码标准HEVC虽然显著提升了视频压缩效率，但也大幅增加了视频编码的计算复杂度，其中模式决策部分消耗的编码时间最多.为了降低HEVC编码的计算复杂度，提出一种基于纹理划分特征和方向特征的低复杂度帧内编码模式决策算法.首先根据编码树单元（CTU）的纹理划分特征与最佳编码单元（CU）划分的相关性，通过分析CTU中所有16×16 CU的纹理划分特征，自底向上计算不同尺寸CU的纹理划分标识；然后利用这些标识预测当前CTU的深度范围，以及判定是否提前终止CU划分；接着根据预测单元（PU）纹理方向特征与最佳帧内预测模式的相关性，对候选帧内预测模式进行两级选择，以减少进行哈达玛优化的预测模式个数；最后利用哈达玛代价减少进行率失真优化的预测模式个数.实验结果表明，本文算法与HEVC参考模型相比，能够平均降低49.72%的编码时间，而码率只增加0.59%、峰值信噪比仅下降0.04dB，保持了良好的编码率失真性能；与现有的两种模式决策快速算法相比，本文算法进一步降低了约8%和9%的编码时间，并具有相近的编码率失真性能.

Select

采用弧形映射函数的二进制粒子群优化算法

李浩君,刘中锋,王万良

2017, 38(12): 2637-2640.

摘要 ( ) PDF全文 ( )

可视化

针对二进制粒子群优化算法（BPSO）,采用S形映射函数,将粒子在空间中飞行速度的正负值大小映射为其位置向量取1的概率,易于陷入局部最优解的问题,本文提出了采用弧形映射函数的二进制粒子群优化算法（ABPSO）.该算法采用弧形映射函数取代BPSO中的S形映射函数,将速度平方值大小映射为位置向量改变的概率大小,当粒子具有较低的速度平方值时能够维持在原位置,较高的速度平方值时改变位置,从而使算法更好地收敛于全局最优解;同时,采用了无强制性位置更新程序,符合弧形映射函数使用速度平方大小映射为位置改变概率大小的需要.通过六个基准函数的仿真实验发现,ABPSO具有更好的收敛精度和更高的收敛速度;ABPSO采用更加符合粒子运动规律的弧形映射函数,表现出更好的收敛于全局最优解的能力和更高的收敛速度.

Select

面向阿尔茨海默症的脑皮层厚度的特征选择方法研究

乔迎芳,胡斌,谢元伟,高翔

2017, 38(12): 2641-2644.

摘要 ( ) PDF全文 ( )

可视化

在本文中，以阿尔茨海默症患者的脑皮层厚度作为数据集，利用mRMR特征选择方法对SVM-RFE特征选择方法进行改进，以提高轻度认知障碍人群和正常人群分类的准确率.SVM-RFE特征选择方法是根据SVM在训练时生成的权向量来构造排序系数，并在每次迭代时去掉排序系数最小的特征.该方法只考虑到特征与类标的相关性未能考虑到特征间的冗余性，鉴于此，在生成权向量后，引入mRMR里计算相关的算法来重新构造排序系数，并在每次迭代时去掉排序系数小的特征.实验使用留一交叉验证进行评估，结果表明本文方法要优于SVM-RFE特征选择方法、mRMR特征选择方法和F-score特征选择方法.

Select

结合非负矩阵填充及子集划分的协同推荐算法

袁卫华,王红,杜向华

2017, 38(12): 2645-2651.

摘要 ( ) PDF全文 ( )

可视化

针对协同过滤推荐中评分矩阵极度稀疏问题,以及很多应用对数据存在非负约束要求,提出一种结合矩阵填充及用户兴趣子集划分的协同推荐算法.首先提出非负约束下的低秩矩阵填充模型(Non-negative Constrained Low Rank Matrix Completion,LR-NMF),以及有效求解该模型的迭代算法.该算法不仅可以利用重构矩阵填充原始矩阵中的缺失项,而且可以得到评分矩阵的非负分解表示.在此基础上,提出一种结合LR-NMF的基于群组的协同推荐方法.利用矩阵非负分解结果,通过块模型近似算法划分用户-兴趣子集或物品-特征子集,最终产生top-N协同推荐列表.实验结果表明,提出的方法不仅有效填充评分矩阵的缺失项,而且推荐精度优于其它协同推荐算法.在大规模稀疏数据集中,仍然具有很好的性能.

Select

阿尔茨海默病在脑皮层厚度中的集成分类方法研究

崔书华,胡斌,胡涛

2017, 38(12): 2652-2657.

摘要 ( ) PDF全文 ( )

可视化

本文使用Adaboost集成学习方法基于大脑皮层厚度的结构磁共振图像数据（SMRI）来区分轻度认知障碍患者以及正常健康人.本文分别选取100名健康人和104名轻度认知障碍患者作为正常对照组和实验组，主要针对两组人群的结构磁共振图像数据进行分析.首先利用基于两独立样本T检验的特征选择方法对噪声特征进行筛选，再通过离群点检测方法对异常数据进行分析并加以排除.最后使用Adaboost集成学习方法进行分类，并且通过留一交叉验证评估分类的准确率高达89.37%.通过实验证明，上述方法对区分轻度认知障碍患者和正常健康人具有显著的效果，这将有助于实现对阿尔茨海默疾病早期的自动诊断.

Select

结合字典序和排序线性拟合的音频隐藏方法

谢贤文,邵利平

2017, 38(12): 2658-2667.

摘要 ( ) PDF全文 ( )

可视化

传统音频隐藏方法通常是将秘密音频或信息直接嵌入到待隐藏的载体中，由此带来了较大的信息嵌入量也会对嵌入载体造成较大影响，导致嵌密载体听觉质量下降和易于受到攻击.针对此问题，提出一种结合字典序和排序线性拟合的音频隐藏方法.在嵌入时，首先将秘密音频和公开音频划分为不等长小段序列并一一对应；然后取与秘密音频小段序列等数量的公开音频小段序列起始元素和秘密音频小段序列进行排序线性拟合并通过字典序记录秘密音频排列位置索引以及对应的拟合变换参数；最后将位置索引和拟合参数进行q进制存储并通过改进EMD方法嵌入到公开音频小段序列中.在提取时，首先从公开音频小段序列中提取出位置索引和拟合参数，然后将与秘密音频小段序列等数量的公开音频小段序列起始元素恢复为秘密音频小段序列并重构秘密音频.理论和实验表明，同现有方法相比，采用排序拟合使得信道中公开传输音频具有较高信噪比，同时仅对字典序、q进制表示的变换参数按改进EMD方法进行嵌入，在减少对载体音频修改的同时也降低了秘密音频被泄露的风险且恢复出的秘密音频拥有一定的可辨识听觉质量.

Select

精英学习的多维动态自适应人工鱼群算法

戴月明,姚凌波,王艳

2017, 38(12): 2668-2672.

摘要 ( ) PDF全文 ( )

可视化

针对人工鱼群算法存在易陷入局部最优、鲁棒性差以及寻优精度低的问题,提出了精英学习的多维动态自适应人工鱼群算法.传统人工鱼群用欧式距离度量视野、步长,无法体现不同维度上鱼群的搜索进度.提出的算法为每个维度设定独立的视野和步长,从而定义了视野向量、步长矩阵及多维邻域,以此改进了鱼群的4种基本行为,使人工鱼个体能够根据鱼群分布情况自适应调整寻优范围.为了增加鱼群的全局性,降低人工鱼陷入局部最优的可能性,提出了一种人工鱼精英学习策略.仿真实验结果表明,该算法能有效地提高人工鱼群的寻优精度、寻优质量及鲁棒性,且提高了人工鱼群的全局搜索能力.

Select

一种非对称相似度矩阵约束的群组协同过滤算法

王建芳,谷振鹏,张朋飞,刘永利

2017, 38(12): 2673-2677.

摘要 ( ) PDF全文 ( )

可视化

针对传统协同过滤算法无法处理社交网络中逐渐形成的以群组为中心的群体行为且很少考虑用户间普遍存在的不对称关系，提出一种非对称因子约束相似度矩阵的群组协同过滤算法.首先通过构建虚拟用户作为群组特征，把多维数据降维成与用户特征等价的虚拟用户，以替代群组进行相似度计算.其次引入影响因子和偏移因子两种相似度限制因子来构建非对称相似矩阵，影响因子表示用户相互影响力的大小关系，偏移因子则考虑用户评分习惯间的差异.实验结果表明该方法与传统推荐算法相比具有收敛速度快、预测精度高的优势，提高了推荐质量并解决了群组特征处理问题.

Select

MapReduce并行化压缩近邻算法

翟俊海,郝璞,王婷婷,张明阳

2017, 38(12): 2678-2682.

摘要 ( ) PDF全文 ( )

可视化

压缩近邻(CNN:Condensed Nearest Neighbors)是Hart针对K-近邻(K-NN:K-Nearest Neighbors)提出的样例选择算法,目的是为了降低K-NN算法的内存需求和计算负担.但在最坏情况下,CNN算法的计算时间复杂度为O(n3),n为训练集中包含的样例数.当CNN算法应用于大数据环境时,高计算时间复杂度会成为其应用的瓶颈.针对这一问题,本文提出了基于MapReduce并行化压缩近邻算法.在Hadoop环境下,编程实现了并行化的CNN,并与原始的CNN算法在6个数据集上进行了实验比较.实验结果显示,本文提出的算法是行之有效的,能解决上述问题.

Select

Pareto熵鸡群算法求解多目标柔性作业车间调度问题

吴定会,许世鹏

2017, 38(12): 2683-2688.

摘要 ( ) PDF全文 ( )

可视化

针对多目标柔性作业车间调度问题，提出基于Pareto熵的鸡群算法.首先，建立了多目标柔性作业车间调度模型，优化目标为最大完工时间、最大机器负荷和所有机器总负荷.其次，将Pareto熵的概念引入鸡群算法，通过计算Pareto前端的熵值和差熵值判断目前种群的进化状态，动态调节惯性权重，使得调节过程具有针对性和目的性，同时为了避免算法陷入局部最优，加入基于Pareto熵的精英学习策略作为局部扰动策略，精英学习率步长可根据Pareto差熵和进化状态动态调节，从而形成一个闭环调节的进化过程.最后，对多目标柔性作业车间调度的经典算例进行求解，并与相关算法对比，仿真实验证明所提算法在收敛精度和机器分配均匀度方面具有明显优势.

Select

多特征融合的混合模型视频跟踪算法

王琳,陈志国,孙俊

2017, 38(12): 2689-2693.

摘要 ( ) PDF全文 ( )

可视化

为克服传统目标跟踪算法特征表示单一、局部结构信息利用不足等问题，提出了一种多特征融合的混合模型跟踪算法.算法首先将像素的局部外观模型和全局颜色直方图、方向梯度直方图模板进行融合，构建一种鲁棒性强的混合外观模型，然后提出一种新的离群检测策略，该策略将系数矩阵分成两个相关的部分并采用l2，1规范求解.标准测试集上的实验结果表明，本文算法在处理光照变化和遮挡等场景时具有更高的跟踪精度和鲁棒性.

Select

UTRS：一个面向出租车的拼车推荐系统

刘相言,杨威,黄刘生,陆潇榕,邓厚,

2017, 38(12): 2694-2698.

摘要 ( ) PDF全文 ( )

可视化

目前针对出租车的推荐系统主要从增加载客概率或减少空载里程的角度为司机推荐一系列载客点或行驶路线.然而从最大化司机收入的角度而言，他们大多数没有考虑出租车载客后车内仍可继续载客的情况.因此，该文在考虑出租车可拼车情况下，提出了一个出租车综合推荐系统UTRS（Unified Taxi Recommender System），该系统为空载和载客状态下的出租车推荐利润最大的行驶路线，设计了拼车情况下的费用分摊机制和拼车决策，达到使出租车司机利润提高和乘客的乘车费用降低的最终目标.仿真实验采用苏州市一个月的出租车GPS记录数据，最终实验结果证实了该文提出的推荐系统的正确性和有效性.

Select

一种基于多基表示的标量乘扩展算法

李艳梅,殷新春

2017, 38(12): 2699-2702.

摘要 ( ) PDF全文 ( )

可视化

标量乘是椭圆曲线密码体制操作中最耗时、最主要的工作，所以椭圆曲线密码体制的快速实现问题的关键归结为椭圆曲线标量乘法的计算.为了提高椭圆曲线密码的效率，在已有的二进制域椭圆曲线标量乘算法的基础上，结合扩展系数集和半点运算方法，提出一种新的形如d（1/2）a3b5c7z的标量k的多基表示算法和相应的多基标量乘算法.在美国国家标准技术研究所推荐的椭圆曲线NIST B-163、NIST B-233和NIST B-283上进行实验，结果表明，新算法以增加少量预计算存储为代价，有效降低了算法复杂度，提高了标量乘算法的效率，使标量乘法的运算更高效.相比于相关工作，提高了约14.4%~41.4%.因此，新算法可以较好地应用到智能卡等计算资源、存储资源受限的领域中. 

Select

一种支持高并发的感知数据接入服务

王继业,丁维龙,高灵超,陈涛,赵卓峰,

2017, 38(12): 2703-2706.

摘要 ( ) PDF全文 ( )

可视化

随着物联网技术的广泛应用,体现物理世界运行状态的感知数据被大量前端传感设备采集;为了在云端有效存储、管理及后续分析这些数据,迫切需要支持海量前端设备接入不同种类、持续不断的异构数据.当前相关技术和系统在接入大规模高并发数时存在吞吐量和执行效率的瓶颈,为此设计实现了一种支持高并发的感知数据接入服务.该服务面向异构感知数据的通信,通过可定制数据结构和异步I/O多路复用,实现了大规模异构感知数据的高并发接收、解析和分发处理.相关的实验表明,该服务即使在低配虚拟机中也可以支持万级并发的数据接入能力.

Select

路网上范围受限的Top-k空间关键字查询

陈子军,李盛阳,刘文远

2017, 38(12): 2707-2713.

摘要 ( ) PDF全文 ( )

可视化

空间关键字查询是现在数据库领域的研究热点，查询时同时考虑对象与查询点的位置相关性和文本相关性.本文提出了路网上范围受限的Top-k空间关键字查询，查询返回在约束范围R内，满足关键字要求，并且距离查询点最近的前k个对象.尽管范围受限的近邻查询在欧式空间已经被研究过，但在路网中并没有关于这方面的研究.基于此，本文提出一种有效的算法.首先，为路网中的顶点建立标签索引，然后，为对象建立网格索引，查询时利用网格索引锁定查找范围，利用标签索引计算查询点与对象间的距离.最后，通过实验验证了该算法的有效性.

Select

智能医疗环境下一种可证明安全的RFID离线互认证方案

周志彬,刘琴,王国军,贾维嘉

2017, 38(12): 2714-2718.

摘要 ( ) PDF全文 ( )

可视化

RFID技术在物联网医疗领域得到了广泛的应用,由此而产生的患者隐私泄漏以及医疗记录伪造等问题成为研究热点.已有方案要求阅读器（Reader）与后台服务器保持实时连接,对网络环境要求较高,也会给系统带来一定安全隐患;提出了一种智能医疗环境下基于椭圆曲线加密的RFID离线互认证方案(EMAH),并进行了安全性证明,该方案采用HIS授权Reader进行离线互认证的方式来确保协议参与方的合法性,并将椭圆曲线加密以及数字签名算法应用到数据加密中,确保了医疗数据的安全性以及完整性,同时保护了患者的隐私;通过安全与性能分析,相对于其它方案,EMAH在离线身份认证、位置隐私以及医疗数据信息保护等方面具有较强的安全性,而性能开销与其它方案相当.

Select

分簇和多目标自适应的和声搜索定位算法

孙子文,申栋,孙崇

2017, 38(12): 2719-2723.

摘要 ( ) PDF全文 ( )

可视化

针对集中式多目标优化定位算法计算复杂、容易陷入局部最优等问题,采用一种基于分簇和多目标自适应和声搜索分布式无线传感器网络定位算法.将无线传感器网络节点进行分簇定位,建立局部多目标定位模型,其目标函数为根据簇内节点间距离信息构建的空间约束目标函数,以及根据拓扑关系构建的拓扑结构约束目标函数,使用多目标自适应和声搜索算法进行定位,以解决多目标定位算法容易陷入局部最优问题,其中和声记忆库更新方法采用非劣排序和拥挤距离排序方法.仿真结果表明本文的定位算法,与PAES定位算法相比有较高的定位精度.

Select

云环境下融合恶意用户过滤机制的信誉评估方法

胡玉琦,房小温,张付志

2017, 38(12): 2724-2728.

摘要 ( ) PDF全文 ( )

可视化

针对云服务供应商和云用户实体双方交互过程中提供虚假或恶意信息的问题，提出了一种融合恶意用户过滤机制的信誉评估方法.首先，运用统计过程控制理论中改进的指数加权滑动平均方法对目标云服务有过反馈评级的用户进行检测，并过滤恶意用户；然后，在目标云服务的信誉计算过程中，利用多数共识理论和反馈相似度确立良性用户反馈评分的聚合权重，以提高信誉计算的准确性；最后，用户根据云服务供应商的服务和信誉情况与其进行协商，屏蔽掉信誉较低的云服务，从而确定最后的交互对象.实验结果表明，本文提出的方法不仅能够有效防止云用户的欺诈行为，而且能够杜绝云供应商的不诚信行为，使服务中心能够将信誉好的云服务推荐给用户.

Select

利用最优停止理论研究最优能效数据分发策略

彭颖,王高才,王淖

2017, 38(12): 2729-2735.

摘要 ( ) PDF全文 ( )

可视化

随着数据分发应用在移动网络中广泛普及,移动终端的能耗迅猛增长,减少数据分发能耗成为移动网络的重要研究主题.本文研究在信道质量随机变化的移动网络中多个发送终端使用相同信道进行数据分发的能耗优化问题.发送终端以一定的概率传输数据来竞争信道,并在获取信道后根据信道质量好坏决定是否分发数据,从而节省能量.本文首先构建具有延时要求的数据分发平均能效最大化问题,然后转化为最优停止规则问题和获得最优近视停止规则,最后利用最优停止理论求解每个周期的最优传输速率阈值,实现基于最优停止理论的最优能效数据分发策略.模拟实验结果表明,本文提出的策略具有较大的平均能效和较高的平均传递率,获得较好的能耗优化效果和网络性能.

Select

一种支持隐私保护的云数据完整性验证方案

谭跃生,范文婕,王静宇

2017, 38(12): 2736-2740.

摘要 ( ) PDF全文 ( )

可视化

针对云用户需要求助第三方审计（TPA）进行外包数据的检查而带来的用户数据泄露问题,提出一种支持隐私保护的云数据完整性验证方案（PPCDIV）.方案在基于格的完整性验证方案框架下,采用随机掩码技术对云服务器生成的证据进行掩盖,从而使TPA无法得知用户数据内容.方案支持TPA同时为多个用户进行有效的审计,支持数据动态操作.在随机预言模型下证明了本方案是安全的.安全性分析表明该方案能有效地保护用户数据的隐私.

Select

隐私敏感的服务选择方法

曾苏梦,唐明董,刘建勋,曹步清,张婷婷

2017, 38(12): 2741-2746.

摘要 ( ) PDF全文 ( )

可视化

用户在使用互联网服务时，服务提供者可能要求用户提供一些必要的个人数据，因此给用户的隐私安全带来隐患.以往的服务选择研究大多关注服务的质量或信誉，对服务引起的隐私代价很少考虑，因此可能无法满足用户的需要.本文提出了一种隐私敏感的服务选择方法，旨在为用户选择隐私代价最低的服务，以降低用户暴露隐私所产生的风险.该方法考虑了服务信誉对用户隐私敏感度的影响，允许服务提供者和用户定义柔性的隐私需求和隐私偏好，使用模糊逻辑结合服务信誉、隐私需求和用户隐私偏好来计算用户的隐私代价，最后按隐私代价高低对候选服务进行排序.文中使用一个例子阐述了方法的可行性，并且用实验评估了方法的有效性.

Select

一种针对软件缺陷自动分派的开发者推荐方法

刘海洋,马于涛

2017, 38(12): 2747-2753.

摘要 ( ) PDF全文 ( )

可视化

开源软件的缺陷管理是其软件质量保障的一种重要手段,而缺陷的高效分派是大型开源软件缺陷管理的一个棘手问题.为了提高缺陷分派的效率,本文提出了一种简单易用的针对软件缺陷自动分派的开发者推荐方法,其核心思想是利用LDA主题模型（刻画开发者技能）、开发者合作网络（刻画开发者之间的合作关系）构造（内容+关系）混合策略.针对大型开源软件项目Eclipse和Mozilla的十万级已修复缺陷的实验表明,在选取合适的参数和分派策略情况下,本文所提方法的开发者推荐的准确率分别达到了46.7%和33.4%,比基准的LDA+kNN方法的推荐准确率分别提高了209.3%和131.9%,从而验证了其有效性.

Select

融合矩阵分解的多臂赌博机推荐算法

成石,王宝亮,毛陆虹,常鹏 

2017, 38(12): 2754-2758.

摘要 ( ) PDF全文 ( )

可视化

近几年，随着推荐系统广泛应用在各个领域，冷启动问题受到了越来越多的关注.本文针对只可获得用户对商品评价的情况，解决冷启动难题.大部分已有研究通常先构建用户和商品的静态特征，再采用多臂赌博机策略进行推荐，其缺点是没有深入提取和更新特征，限制了推荐性能.本文提出一种新的算法来解决特征提取问题，具体来说，根据用户对商品真实评价与预测评价的误差，使用矩阵分解算法更新用户和商品特征；再对新的特征使用多臂赌博机策略进行商品推荐.新算法很好地将多臂赌博机策略和矩阵分解算法结合起来，并有很强的通用性和可扩展性.最后，采用真实的数据集Movielens和Last.fm将本文算法与其他不采用上下文信息的最新方法进行比较，实验结果表明该方法在一定程度上提升了推荐性能.

Select

从事件序列中发现一般阶段过程模型

杨荣,李兵,吴谋,王忠友,王电化,钱涛,邓树文

2017, 38(12): 2759-2761.

摘要 ( ) PDF全文 ( )

可视化

生活中存在很多随时间推进而形成的事件序列,比如用户在购物网站上随时间而进行的浏览事件,以及病人随时间而呈现出的各种病症.如果能从这些海量的事件序列中发现规律,找出具有代表性的事件序列模型,并能合理推断序列中的各个独立阶段过程事件,这将具有非常大的理论和实际意义.针对此问题,提出一种从事件序列中发现一般阶段过程模型的方法.首先,详细介绍了本文所用的模型,包括阶段过程模型和事件序列类型模型推断.最后,利用本文所介绍的数据集,通过两大组实验验证了本文模型在预测精度和时间成本方面都具有很好的性能.

Select

一种集成用户画像与内容的服务重定向方法

熊伟,杭波,李兵,吴钊,谷琼

2017, 38(12): 2762-2765.

摘要 ( ) PDF全文 ( )

可视化

随着互联网的发展，网站应用的规模正不断扩大，常规的垂直应用架构已慢慢无法应对这样的场景，而应用的大规模服务化则应运而生.大规模服务框架通常会建立一个服务注册中心，动态的注册和发现服务，使服务的位置透明.消费方通过获取服务提供方的地址列表，实现软负载均衡和Failover.而随着服务的累积，在候选服务集合越来越大的情况下，加快重定向的响应速度是其中的一个关键问题.本文旨在通过cookies跨域采集用户行为信息并对用户分群画像，用LDA分析网页内容并建立主题模型，进而提出一种基于用户画像与内容的服务重定向方法.该方法基于人群特征与内容修剪候选服务，可以大大减少搜索空间，降低计算量，以提高响应速度.实验结果验证了本文方法的有效性.

Select

一种改进的数据库Sharding方法

李甜甜,于戈,王智,宋杰

2017, 38(12): 2766-2771.

摘要 ( ) PDF全文 ( )

可视化

Sharding是用于开源数据库的一种水平扩展解决方案，包含两个主要步骤：逻辑划分和物理映射.对于前者，现有机制通常根据Shard Key采取基于Range或是Hash的方式来实现.然而，基于Range的方法不能够保证数据值域的均衡；基于Hash的方法不适用于范围查询，且当Shard Key不均匀时无法保证数据量的均衡.对于后者，现有机制通常采用一致性哈希来确保存储节点的动态扩展，然而该方法并未考虑数据增减导致Chunk大小变化时的数据均衡机制.为此，提出一种新的负载均衡的Sharding方法：一方面综合考虑上述两种划分方式的优缺点提出一种新的逻辑划分方法，另一方面给出一种Chunk大小变化而导致的不均衡处理机制.实验证明本文提出的方法能够有效保证数据的负载均衡.

Select

障碍空间中基于密度的不确定数据聚类算法

何云斌,王霄,万静,李松

2017, 38(12): 2772-2776.

摘要 ( ) PDF全文 ( )

可视化

为解决传统聚类算法无法有效处理障碍空间中不确定数据的问题,本文提出了障碍空间中基于密度的不确定聚类算法解决此类问题.本文第一步利用三角模糊数和R树的性质提出TF-Initialseeds算法来解决数据的不确定性问题.在基于密度聚类方法的基础上,本文第二步,利用Voronoi图剪枝策略可以有效减少计算量的特性,提出了障碍不确定密度聚类算法VPS-DBSCAN.最后结合第一步与第二步算法提出了TVDBSCAN算法,用于处理障碍空间中的不确定数据.实验分析表明TVDBSCAN算法在处理障碍不确定数据时具有更高的效率,得到更好的聚类结果.

Select

一种面向动态偏好的交互式多目标查询

郭成盖,秦小麟,丁有伟,王潇逸,项哲慧

2017, 38(12): 2777-2784.

摘要 ( ) PDF全文 ( )

可视化

同一问题的迭代查询之间存在关联,且不同查询间用户偏好动态变化.但现有查询算法只是将不同查询独立处理或默认查询间偏好固定不变,本文提出一种可有效利用查询间关联关系且支持动态偏好的查询处理算法IMQD;定义一种结果集质量度量方法,取值在［0,1］区间内且取值越大越优.IMQD算法旨在使结果集质量更高,将查询处理过程分为三个步骤:首先确定初始候选集;然后通过用户交互获取调整后的偏好阈值,对当前候选集进行调整,使结果集质量取值更大;用户根据当前结果集质量判定是否终止查询.在模拟和真实数据集上验证IMQD算法可提升结果集质量且拥有良好交互性能.一旦用户偏好发生变化,算法可在毫秒级内完成对结果集的自适应调整.

Select

一种多维多粒度用户兴趣模型研究

陈辉

2017, 38(12): 2785-2790.

摘要 ( ) PDF全文 ( )

可视化

人们在享受网络服务带来便利的同时,也不得不面对“信息过载”和“信息迷航”的问题.发现用户兴趣并推送用户感兴趣资源是解决这一问题的有效途径.通过分析用户兴趣特点,设计了一种多维多粒度用户兴趣模型UIM.该模型采用概念分类树维护用户兴趣主题的多粒度性,用倾斜时间窗口维护用户兴趣时间的多粒度性,用时间衰减模型区分用户当前兴趣与历史兴趣的权重.采取增量更新UIM以及对UIM剪枝,保证UIM结构精简与高效,从而可快速查找出用户的top-k兴趣概念.仿真实验结果显示,UIM模型具有存储效率高,可发现用户不同时间窗口内兴趣的特点,其正确性优于其它同类模型.

Select

一种QoS收益感知的服务请求动态调度算法

张中一,孟凡超,初佃辉,钱斌

2017, 38(12): 2791-2796.

摘要 ( ) PDF全文 ( )

可视化

随着云计算产业的发展，云计算逐步走向实际应用，许多传统企业正在将其应用向云服务模式迁移.云服务模式中能够有效减小应用负载，降低服务成本的方法就是多租户模式.在云环境下多租户模式中如何合理安排各个租户的服务请求，通过动态调度租户服务请求来保障各租户的服务质量（Quality of Service，QoS）成为了亟待解决的关键问题.服务请求动态调度是为了保障租户的服务质量，提高服务提供商的资源利用率，因此，需要制定合理的调度方案来达到双方满意的效果.该文从服务请求的服务类型以及租户两方面入手，制定了多租户服务请求动态调度策略，提出了一种以动态QoS收益值为优化目标的服务请求调度算法，该算法能够根据不同租户对服务各种QoS指标的性能需求，对各种类型的多租户服务请求按照动态QoS收益值划分优先级，按照优先级进行调度，与一些常用的方式进行调度相比，能够让平台处理更多重要性较高的服务请求，从而使平台整体的动态QoS收益值更高.

Select

相似聚类的二级索引重复数据删除算法

王青松,葛慧

2017, 38(12): 2797-2801.

摘要 ( ) PDF全文 ( )

可视化

针对重复数据删除算法指纹对比I/O瓶颈问题，提出一种基于相似聚类的二级索引重复数据删除算法.首先计算所有数据块的Simhash值，基于Simhash值之间的海明距离，提出一种自适应的相似聚类算法，所有聚类中心信息形成一级索引存放在内存中.然后计算每个类中数据块的MD5值，将其信息形成二级索引存放在聚类中心.当需要进行重复数据块检测时，计算待检测数据块Simhash值到一级索引中所有聚类中心Simhash值的海明距离，并将海明距离最小的类的二级索引调入内存中进行MD5指纹对比.实验结果表明，算法没有误判率，在较大提高了指纹对比速度的同时，每次检测只产生一次I/O操作，具有更高效的性能.

Select

一种利用前景模型的水下图像增强算法

徐岩,马硕,王权威

2017, 38(12): 2802-2806.

摘要 ( ) PDF全文 ( )

可视化

在水下图像成像过程中，由于水体对光线的选择性吸收和光的散射作用，水下图像经常出现颜色失真以及图像模糊，传统的去雾算法和简单的色彩校正用于水下图像时效果欠佳.根据先去除图像模糊后去除颜色失真的思路，结合人们对水下图像的认知，本文提出了一种基于前景模型的水下图像增强方法.利用光在水中的衰减特性，根据各颜色通道衰减系数之间的关系修正通道增益，提出适用于水下图像的色彩校正方法.另外，改进的背景光估计方法可以有效的避免水下图像出现过曝光.主观和客观的实验结果均表明，该方法在增强图像对比度和提升清晰度方面效果良好，有效的解决了图像模糊和颜色失真的问题.

Select

新的似零范数的分块压缩感知图像重构

聂栋栋,弓耀玲

2017, 38(12): 2807-2811.

摘要 ( ) PDF全文 ( )

可视化

针对提高压缩感知图像重构精度的问题，提出新的近似l0范数的函数，并结合牛顿算法实现图像重构.首先选用冗余脊波变换矩阵作为稀疏表示图像的基函数，利用正交匹配追踪算法对图像进行稀疏化.重构过程基于压缩感知理论，结合似零范数算法思想，用一个简单的分式函数来近似估计l0范数，并通过牛顿迭代算法求得稀疏解，从而实现了二维图像重构，融合了似零范数算法快速收敛和牛顿迭代法高精度的优点.仿真实验结果表明，在相同的条件下，相比于现有的其他同类算法，该算法重构的图像精度更高，有效地提高了压缩感知图像重构的质量.

Select

采用改进的属性拓扑图探索形式背景属性约简之方法

毛华,苗会茹

2017, 38(12): 2812-2816.

摘要 ( ) PDF全文 ( )

可视化

形式背景的属性约简可以使概念格的结构更加简便,从而有利于数据的规则提取.首先,从图论的角度研究形式背景的属性约简问题,即结合有向图的性质,提出了改进的属性拓扑图,并给出了在此图下的关联矩阵.其次,通过对属性拓扑图的分析,给出了净化形式背景中的关于概念和交不可约元的判断定理.进而,利用概念中属性特征和交不可约元之间的关系,提出了不必要属性的判别定理,并在此基础之上,给出了求形式背景属性约简的算法.最后,实例分析表明新的属性约简方法在一定程度上提高了概念格的构造效率,从而验证了该算法的可行性和有效性.

选择文件类型/文献管理软件名称

选择包含的内容

过刊目录

作者投稿

专家审稿

编辑办公

主编办公

编委审稿

下载中心

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

过刊目录

作者投稿

专家审稿

编辑办公

主编办公

编委审稿

下载中心