过刊目录

  • 2018年, 39卷, 第6期
    刊出日期:2018-06-01
      

  • 全选
    |
  • 李峰,苗夺谦,张志飞,罗晟
    2018, 39(6): 1121-1125.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    问题转化型方法和算法适应型方法是多标记学习中主要的两类研究方法,其中问题转化型方法因其独立分类算法得到了广泛的关注,而已有的问题转化型方法存在或忽略标记间相关性,或算法复杂过高,或算法性能不稳定的问题.针对上述不足,基于粒计算的思想,本文提出了一种粒化集成的多标记学习算法.该算法为每个标记划分出一个相关性最大的标记子集,称为关系粒,将标记空间粒化为多个标记子集,该方式考虑到并最大化保留了标记间的相关性,避免了算法复杂度过高,提升了算法性能.随后为每个关系粒训练一个分类模型,最终将各个分类模型的结果集成.实验结果表明相较于对比的三种方法,本文所提算法能取得较好的性能.
  • 罗国华,龚欣哲,王英奎,何东晓,金弟
    2018, 39(6): 1126-1129.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    复杂网络社团发现是当前多学科交叉的研究热点.已有社团发现方法主要是针对网络拓扑,且难于处理大规模网络.基于此,Ruan等提出了CODICIL算法,不仅通过引入文本内容提升社团发现质量,且适用于大规模网络聚类问题.然而该方法采用TF-IDF对网络中结点的文本内容进行处理,由于TF-IDF算法维度较高,故难于精确刻画结点的内容表征,且计算量较大.本文对CODICIL算法进行改进,通过提出可有效处理结点内容的高斯混合模型,更好的融合了复杂网络上的内容信息,进一步提升社团发现的精度和效率.在五个真实网络上对提出的新方法进行验证,性能明显优于CODICIL算法.此外,由于新算法可采用不同参数拟合高斯混合模型中的数据点,故具有更好的可扩展性.
  • 邹鹏,李凡长
    2018, 39(6): 1130-1134.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    提出一种鲁棒谱多流形聚类算法(Robust Spectral Multi-Manifold Clustering,简称RSMMC).现实生活中许多数据都是带有噪声的,先前许多聚类算法在直接处理带噪声的数据,聚类效果受了很大影响.为了减少数据噪声,在谱多流形聚类(Spectral Multi-Manifold Clustering,简称SMMC)的基础上引入一个噪声消除项,能够在迭代优化的过程中输出一个降噪稀疏投影,该投影进而可用于提取“干净”数据进行训练.实验结果表明,本文算法对复杂非线性数据聚类结果优于相关对比算法,而且对噪音具有较强的鲁棒性.
  • 王丽萍,丰美玲,邱飞岳,章鸣雷,
    2018, 39(6): 1135-1141.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于分解的多目标进化算法(MOEA/D)在求解多目标优化问题时,有着较强的搜索能力、高效的适应度评价、良好的收敛性等优点.然而,在更新子问题时,新解在固定邻域内替换所有较差的解,导致解集副本过多,一定程度上丢失解集的多样性.为维持多样性的同时提高解集的收敛性,提出一种基于递归替换寻优策略的分解多目标进化算法.首先,根据解到对应方向向量的垂直距离确定替换邻域,保持解在目标空间中的均匀分布,维持解集的多样性;进而,提出递归替换寻优策略,被新解所替换的解不立刻丢弃,而是在当前邻域内替换比该解还差的解,尽可能快速引导解集朝Pareto前沿进化,提高解的收敛性.将该算法在WFG系列和DTLZ系列测试函数上进行仿真实验,并与MOEA/D、MOEA/D-DRA、MOEA/D-GR、MOEA/D-DU四个算法进行对比,实验结果表明,本文所提出的MOEA/D-LR算法解集的整体质量明显优于其他算法,且该算法在维持多样性的同时其收敛性显著提高.
  • 文坚,史绍亮,文益民,高文翔,庞承杰
    2018, 39(6): 1142-1148.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着移动互联网的流行,人们在旅游过程中留下的位置数据越来越多,给旅游景点挖掘提供了很好的数据来源.微博签到数据不仅有位置坐标、对应的签到用户和时间信息,而且签到位置在地理上分布极不均匀.现有聚类算法大多只是从距离和密度属性出发进行聚类,应用在签到数据上效果不理想.针对这个问题,通过定义权重和可扩展邻域,并在局部中心点的选取条件中引入用户和时间属性,提出了一种基于局部中心点权重递减的聚类算法(CWDC).通过在桂林市2015年的微博签到数据集上进行实验,相比其他聚类算法,本文提出的算法在准确率、覆盖率等指标上均有提高.实验结果表明:CWDC能够更加准确地挖掘旅游景点及其位置、流行度.
  • 李敏,傅仰耿,刘莞玲,吴英杰
    2018, 39(6): 1149-1155.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    置信规则库(belief rule base,BRB)中参数的选取直接影响着推理的精度.为了得到更加有效的参数训练方法,本文基于群智能算法中的布谷鸟搜索(Cuckoo Search,CS)算法进行改进拓展.针对布谷鸟搜索算法中Levy飞行后期出现的搜索速度慢和精度低的问题,引入自适应扰动函数进行优化,进而提出一种新的BRB参数训练方法.在多极值函数的拟合实验中,以均方误差与运行时间作为比较指标,验证本文改进方法的有效性.在输油管道泄漏检测的问题实例中,以平均绝对误差和运行时间作为比较指标,与其他现有的参数训练方法进行比较,实验结果表明,本文提出的算法具有更好的推理效率和准确度.
  • 邹国锋,傅桂霞,高明亮,尹丽菊,王科俊
    2018, 39(6): 1156-1162.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对卷积神经网络结构设计依赖人为经验,网络深度、特征图个数设置缺乏理论依据,网络训练需大量训练样本支持,并结合姿态变化人脸识别存在的问题,提出姿态变化人脸底层特征图的样本扩充方法和深度卷积神经网络模型的自学习方法.首先,根据姿态人脸分布规律,将姿态人脸非线性流形空间划分为不同流形层和局部子空间,针对局部子空间内姿态人脸定义人脸底层特征构建方法,实现姿态变化人脸样本扩充.然后,通过网络结构初始化、网络结构全局和局部自适应扩展,获得自学习深度卷积神经网络,实现姿态变化人脸的深层非线性特征提取和识别.实验表明,本文所提方法丰富了卷积神经网络的理论研究,有效改善了姿态变化人脸识别的准确率.
  • 余思成,杨习贝,陈向坚,窦慧莉,王平心
    2018, 39(6): 1163-1167.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了进一步提升邻域分类器的性能,提出基于属性约简的集成邻域分类策略.首先在启发式求解约简的过程中,通过放宽属性选择的条件,从而在一定范围内利用随机选择的方法获取多个能够降低邻域决策错误率的属性子集,然后借助这些属性子集在对应邻域分类器上得到的结果进行投票集成,得到最终的分类类别.在12个UCI数据集上的实验结果表明,所提出的基于属性约简的集成邻域分类策略不仅能够有效地提升邻域分类器的分类精度,而且亦能增强邻域分类结果的鲁棒性.这一研究为从集成的视角研究粗糙集理论提供了技术支持.
  • 张新明,康强,王霞,程金凤
    2018, 39(6): 1168-1177.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为增强生物地理学优化(Biogeographybased optimization,BBO)算法的优化性能,降低其运行时间,提出了一种差分迁移和趋优变异的生物地理学优化算法(DGBBO).首先,将两种差分扰动操作与BBO算法的迁移操作有机融合,形成差分迁移算子,提升全局搜索能力并平衡探索和开采;其次,将趋优操作融入到BBO算法的变异算子中,替换原变异操作,形成趋优变异算子,克服了原变异算子存在的缺陷,加快收敛速度;此外,还从多个角度降低算法的计算复杂度.在一组常用的基准函数上进行了仿真实验,实验结果表明,相较于其它state-of-the-art算法,DGBBO算法寻优能力显著,稳定性强,收敛速度快,运行时间少,验证了其优秀的优化性能.
  • 孙艳歌,王志海,白洋
    2018, 39(6): 1178-1183.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可能会随着时间发生变化,即概念漂移.本文针对数据流中的概念漂移和类不平衡问题,提出了一种基于集成的不平衡数据流分类算法.在分类之前加入采样方法应对类不平衡问题,并采取有效的基分类器更新和加权策略应对概念漂移现象,从而提高分类器的性能.针对本文所提出的算法,和几种经典学习算法,在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明本文所提出的算法,其整体分类性能优于其他算法,更能适应存在概念漂移和类不平衡的数据流环境.
  • 沈华东,彭敦陆
    2018, 39(6): 1184-1189.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本摘要是文本主要内容和核心思想的最小化表达,对从海量文本数据中快速寻找有价值的信息具有重要意义.利用深度神经网络EncoderDecoder基本框架,通过引入注意力模型,提出文本摘要抽取的深层学习模型——AMBRNN.论文先根据中文文本的语言特点,构建句子特征向量抽取算法,形成文本特征向量矩阵,再将其输入到AMBRNN深层学习模型中,双向循环神经网络编码出中间语义向量,最后利用注意力模型与单向循环神经网络解码中间语义向量,实现摘要句子的抽取.实验结果表明,AMBRNN能较准确且稳定的抽取摘要句子,相比其他模型具有更好抽取效果.
  • 汪舟,何军,胡昭华
    2018, 39(6): 1190-1194.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对智能监控领域精确运动检测的高实时性的需求,本文提出两种基于RPCA背景建模方法.方法I 提出平均网格化背景建模法,该方法通过对视频每帧图像进行网格化切分,对每一网格视频帧图像运用多线程并行进行背景建模;方法II提出基于RPCA的多ROI背景建模法,由于视频监控中,往往只有几处感兴趣的目标区域,该方法通过设定多ROI区域级联后进行背景建模,则无须对整个视频帧图像进行背景建模.实验表明,两种方法检测时间上相较与Online RPCA背景建模方法时间大大减少,并且检测效果上保证目标检测的精确度,能够满足对于高清视频的实时监控.
  • 贾声声,彭敦陆
    2018, 39(6): 1195-1200.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本中蕴含的信息具有重要的应用价值.如何将文本进行聚类挖掘有价值的信息成为自然语言研究领域当前的热点.针对文本信息的层次聚类问题,提出基于动态词窗口的卷积神经网络(Convolutional Neural Network,CNN)文本特征提取算法和基于森林结构的自组织映射神经网络聚类算法(Forest Growing Self-Organizing Maps,FGSOM).首先,结合领域词性模板和特征模式对CNN特征提取算法进行改进,实现文本特征向量的自动提取.然后,将文本特征向量作为FGSOM算法的输入层,结合生长阈值和局部最优策略,实现文本分层聚类.通过将所提算法应用于法律案件文本聚类,通过与现有同类算法进行比较表明,所提算法具有较好计算效果.
  • 殷岩,付晓东,刘骊,岳昆,刘利军,冯勇
    2018, 39(6): 1201-1207.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    如何让消费者在评分信息不完整,消费者偏好不一致和评价标准不一致的情况下从海量在线商品中做出正确选择,成为消费者关注的问题.为此,提出利用Copeland社会选择理论的在线商品群体评价.首先基于消费者历史评分间的相似性填充不完整消费者商品评分矩阵;其次建立每个消费者对在线商品的偏好关系,并表达为商品商品偏好比较矩阵;最后利用社会选择理论的Copeland方法将偏好比较矩阵中的商品被偏好次数两两成对比较,并记录比较的赢输差值作为Copeland评价值.评价值越高,则在线商品群体评价越高.理论分析验证了方法满足在线商品评价的基本准则.实验结果也表明方法可有效解决不同用户间评分不可比较的问题,并提高在线商品群体评价的操纵复杂性.
  • 陈家俊,苗夺谦,
    2018, 39(6): 1208-1212.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有决策树模型在分类过程中不能充分考虑决策精度、决策者的属性偏好以及决策风险因素的影响问题,提出一种决策风险代价与属性偏好融合的适应性决策树算法.算法结合决策粗糙集和代价敏感学习问题,引入用户偏好程度和决策风险损失函数的概念,根据贝叶斯最小风险决策原则,计算决策风险代价,通过构建适应度函数作为启发式函数选择划分属性,从而建立决策树模型.在决策树构建过程中,使用置信因子概念对决策树进行剪枝,以防生成的决策树过于庞大.实验结果表明该决策树算法是有效的,能充分考虑决策者的属性偏好和因决策的不确定性产生的误分代价,实验参数的设置可以增强算法的适应性,满足不同应用领域的需求.
  • 刘伍颖,王琳
    2018, 39(6): 1213-1217.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在很多亚洲语言书面文本中,词与词之间没有明显的分隔符,因此这些文本的自动分词任务依然具有挑战性.相应的分词算法能够被广泛用于各种自然语言处理应用当中.本文针对越南语分词问题,提出了一套完整的有监督集成学习框架,并且实现了一种新的基于有监督集成学习的分词算法.在二元音节频率索引数据结构支持下,我们实现的分词算法能够综合多个基本分词器的优势,形成一个集成分词器.公开数据集上的越南语分词实验结果表明我们提出的框架在统计、计算和表示上具有良好的表现,算法最终能够达到最优的分词效果.
  • 李晓雨,聂秀山,董飞,尹义龙,
    2018, 39(6): 1218-1222.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    视频指纹技术在解决互联网视频版权保护、重复视频检索、监管视频非法拷贝等问题上有广泛应用,因此,本文提出一种Delaunay三角剖分下的视频指纹算法.该算法首先将视频帧分块,然后将每块看作视频帧的一个特征点,每块的灰度均值视为对应特征点的特征描述值,其次对特征点的集合进行Delaunay三角剖分,最后对三角剖分后得到的各个四面体求四个顶点的特征值均值作为视频指纹,该方法得到的视频指纹既包含空域信息又包含时域信息.实验结果表明,与传统算法相比,该算法具有更优的鲁棒性.
  • 翟俊海,张素芳,周昭一
    2018, 39(6): 1223-1227.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    用极限学习机重复训练单隐含层前馈神经网络可得到不同的网络模型.受极限学习机这一特点的启发,提出了一种用模糊积分集成重复训练极限学习机的数据分类方法.该方法分为3步:第1步,用极限学习机重复训练单隐含层前馈神经网络.在训练时,不仅输入层权值和隐含层结点的偏置随机生成,隐含层结点的个数也随机生成.第2步,用软最大化函数将训练的单隐含层前馈神经网络的输出变换为后验概率分布.第3步,用模糊积分集成重复训练的单隐含层前馈神经网络,并用于数据分类.提出的方法具有2个优点:1)网络模型具有良好的多样性,理由是重复训练得到的单隐含层前馈神经网络具有不同的结构和不同的参数.2)具有良好的泛化能力,理由是模糊积分能很好地刻画基本分类器之间的交互作用.此外,提出的方法提供了一种网络结构选择的替代方案,利用提出的方法解决实际问题时,可以不用考虑网络结构选择问题.与其他2个算法在10个数据集上进行了实验比较,实验结果及对实验结果的统计分析显示提出的算法在分类精度上优于这2种算法.
  • 李真,胡谷雨,潘志松,张艳艳
    2018, 39(6): 1228-1233.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社团发现是社交网络分析的重要任务,有助于理解网络结构.目前基于网络拓扑的社团发现算法无法对发现的社团进行语义分析,例如社团的成因或属性等.拓扑结构和语义分析从两个角度对社团进行描述,但目前很少有研究同时分析这两个特性.本文提出基于联合非负矩阵分解的方法,将网络拓扑和节点内容信息(如节点属性等)结合起来,同时挖掘社团及其属性标签.该方法通过约束从拓扑和内容信息挖掘出的社团的相似性以及社团间关系的相似性,提高社团发现的准确率,并且从节点属性信息中挖掘社团的属性标签对社团进行语义分析.真实数据集上的实验结果表明,该方法能够有效地发现社团并对社团进行语义描述.
  • 梁鹏,黎绍发,林智勇,郝刚
    2018, 39(6): 1234-1238.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于数据驱动的异常检测方法需要大量标签样本用于训练分类模型,当标签样本数量不足时,此类方法通常难以取得令人满意的预测结果.为此,提出一种结合迁移学习的深度神经网络异常检测方法,用以提高标签样本数量不足情况下的异常检测性能.本文方法的核心思想是:在深度神经网络中通过共享编码层将源域和目标域的数据映射到同一特征空间(即,共享域特征),减少源域数据与目标域数据的概率分布差异,进而从源域和目标域中选择具有共同域特征的数据实现有效的迁移学习.在真实能耗数据集上进行了验证,实验结果表明,与未使用共享域特征的传统深度神经网络方法相比,本文方法可将异常检测准确率提高2%.
  • 王映龙,华佳佳,钱文彬,柳军
    2018, 39(6): 1239-1244.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在现实应用中许多数据往往呈动态变化,非增量式约简方法处理此类数据需消耗大量的计算时间和存储空间.增量式技术能有效处理动态变化的数据.针对集值决策信息系统中数据的动态变化情况,研究了新增对象对信息系统中原有知识的影响,分析了新增对象对分布约简的更新机制,提出了一种增量求解分布函数的计算方法,在此基础上,设计了集值决策信息系统的增量式属性约简算法,当新增对象加入到决策信息系统时,算法能够利用原决策信息系统的约简知识,快速更新分布协调集,通过计算极小析取范式得到属性约简;最后,通过实例验证分析了算法的可行性和有效性.
  • 闫鑫,景运革,
    2018, 39(6): 1245-1249.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    实际生活中很多数据集每时每刻都在发生变化,如何快速更新动态数据属性约简是信息科学领域中研究的一个热点课题.针对决策信息系统对象属性值被细化且对象增加时如何快速获得约简问题,分析了基于矩阵方法计算决策信息系统等价关系矩阵和相对知识粒度的增量更新机制,提出属性值细化且对象增加时增量属性约简算法.最后下载了4组UCI数据对所提出的增量属性约简算法的性能进行了测试,实验结果验证了所提出的增量属性约简算法能够有效处理动态属性约简的问题.
  • 田琳琳,李明楚,金星,王震
    2018, 39(6): 1250-1254.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社交化P2P应用常利用空间互惠机制激励用户积极互动,分析网络群体中合作行为如何涌现成为自组织协作系统研究热点之一.为探讨个体特性与系统状态的协同演化现象,本文构建用户内在属性、行为策略与网络结构共演化模型,探讨基于动态标签的伙伴选择机制对合作演化的影响.作为社交网络中个体的代表性属性,年龄通常影响个体的行为方式及社交关系.本文度量个体间的关系强度时引入年龄相似度,并提出考虑系统年龄与策略年龄的结构演化模式.蒙特卡洛仿真实验结果表明,静态与动态年龄规则下这种断边重连方式形成利于利他个体的网络结构,其中策略年龄规则对网络群体中合作的促进作用最为明显.
  • 芦天亮,张璐,蔡满春,杜彦辉,刘颖卿
    2018, 39(6): 1255-1259.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了解决特征码匹配技术对于未知或多态shellcode检测效率较低的问题,提出一种基于人工免疫系统的shellcode检测算法AIS-SDA.提取shellcode的静态和动态特征,通过反汇编获得汇编指令序列,通过模拟执行获得API函数调用序列,基于n-gram模型编码生成抗原.利用超椭球对免疫检测器编码提高非我空间覆盖率,检测器经历阴性选择算法的免疫耐受后成熟.对成熟检测器克隆和遗传变异,运用超椭球改变朝向、迁移中心和伸缩半轴等手段实现检测器的优化,生成更加优秀的抗体后代.最后,对收集的shellcode样本进行实验验证,结果表明,该方法对非编码和多态shellcode均具有较高的检测准确率.
  • 姚培,黄培煌,郭龙坤
    2018, 39(6): 1260-1265.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    栅栏覆盖是当前无线传感器网络研究的一个重要研究热点.给定一个移动传感器集合与传感器的初始位置和半径,最小化最大传感器移动距离的栅栏覆盖问题的目标是计算这些传感器的新位置,使得给定的栅栏能够被完全覆盖且传感器移动距离的最大值达到最小.对于传感器感知范围不同的情况,该问题已被证明多项式时间可解.设计了一个基于贪心策略的算法,计算了所有传感器在栅栏上可达的覆盖最左端点与最右端点,并依据这两个端点从左到右选择覆盖栅栏的传感器.本文证明该算法可在O(nlognlog(M+dmax))时间返回最优解,其中为栅栏长度,dmax为传感器到栅栏的最大距离.最后,通过实验对比了所设计算法与已有算法的实际性能.实验表明,本文算法的解与最优解一致,并且运行时间优于已有算法.
  • 申栋,孙子文,
    2018, 39(6): 1266-1270.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对异构无线传感器网络中密钥管理方案中的安全连通性差、节点抗攻击能力不强、存储开销大等问题,采用了一种基于节点分组部署的异构无线传感器网络密钥管理的方案.该方案将部署区域划分为六边形分组,对各个分组分别部署密钥,以提高节点的安全连通率;不同分组区域内节点存在共享密钥概率减小,增强节点的抗捕获能力;簇头节点之间共享密钥建立采用Hadamard矩阵密钥预分配方案,使相同存储开销下,任意两个簇头节点之间都存在共享密钥,以实现安全通信.通过仿真实验表明,本文方案能够有效提高节点的安全连通率,增强节点的抗捕获能力,减小存储开销.
  • 周翰逊,王鹏祥,任佃武,郭薇,李晓光
    2018, 39(6): 1271-1275.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于不同的漏洞编制出不同的沉默型P2P蠕虫对于网络可能造成巨大危害性.提出多种沉默型P2P蠕虫共同传播的数学模型.首先,对多种沉默型P2P蠕虫的传播进行了建模,主要分为共存和不共存两种情况.在共存情况下,推导多种沉默型蠕虫的瀑布型模型;在不共存情况下,分别推导多种沉默型P2P蠕虫的直线型、直角型和渐进型模型.然后,分别讨论了各种情况下蠕虫不会泛滥的条件、无病平衡点、地方病平衡点以及达到平衡点时的稳定性分析.最后,通过仿真实验对于模型进行了验证.
  • 刘志雄,黎梨苗
    2018, 39(6): 1276-1280.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在传感器网络中,攻击者可以利用妥协节点注入虚假数据.已有安全机制仅能以较低概率过滤假包,使得假包须传输较大跳数才能被过滤,不利于节省网络能量;此外,它们无法检测由地理上不相邻的妥协节点协作伪造的假包.提出一种基于双重认证的过滤机制DAFS.节点间基于全局密钥池共享对称密钥,并通过建立关联以形成封锁区域,接下来将密钥与部署区域进行绑定.转发节点同时对数据包中两类MACs(Message Authentication Codes)的正确性,以及位置关系的合理性进行校验.理论分析及仿真实验表明,DAFS比已有机制在过滤效率,能耗及妥协容忍等方面具备明显优势.
  • 刘久兵,张里博,周献中,黄兵,李华雄
    2018, 39(6): 1281-1285.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于直觉模糊数的标准海明距离和相异度,分别定义了直觉模糊信息系统下对象间的相容度和相异度概念,并给出相关的性质.进而分别定义了直觉模糊相容关系下的(α,β)水平截集Rβα和决策目标概念下的(α,β)水平截集Xβα,并验证水平截集Rβα为直觉模糊相容关系及其具有的性质.以定义的粗糙隶属度作为评价函数导出目标集的上下近似集及其三个域:正域、负域和边界域,进一步研究了一些性质.根据贝叶斯决策理论构建一种基于直觉模糊信息系统下的三支决策模型及其规则提取算法.最后通过算例说明方法的可行性和有效性.
  • 李春春,李俊
    2018, 39(6): 1286-1290.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协同过滤算法是推荐系统中应用最为广泛和成功的推荐技术,本文针对协同过滤推荐算法中的评分预测问题,对包含正则项的传统BSVD、SVD++模型进行分析改进,详细分析SVD模型的理论方法,加入用户历史行为记录的潜在信息,利用包含用户喜好(如浏览)的隐性特征向量矩阵替换原SVD模型中的用户特征向量矩阵,提出非对称奇异值分解(Asymmetric singular value decomposition,ASVD)模型,并将项目的特征矩阵也进行扩展形成相应的对偶模型,最后将二者的结果进行融合作为最终的预测评分.在MovieLens数据集上进行实验验证,结果表明基于ASVD的评分预测算法与传统BSVD、SVD+[KG-*3]+相比,能有效提高推荐系统的预测精度.
  • 许祎娜,王旭仁,苏红莉
    2018, 39(6): 1291-1298.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决时变公路网络的路径规划问题,以地标导向技术和动态最短路径树为基础,提出一种改进的三角启发式算法.在预处理阶段构造各地标的最短路径树,并计算地标与其它节点之间的距离;在点对点的启发式路径规划过程中使用最短路径树优化查询;当网络发生边权值变化时,动态更新最短路径树,同时利用树的结构特性减少冗余计算.实验结果表明,所提算法不仅在查询效率上取得了比三角启发式算法等经典静态最短路径算法更好的表现,并且拥有比传统动态最短路径树更新算法更高效的更新策略.理论分析证明了此算法在动态应用场景中的鲁棒性和准确性.
  • 杨洁,王国胤,庞紫玲
    2018, 39(6): 1299-1304.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    云模型是在概率论和模糊理论基础上提出的一种认知模型,可以实现定性概念与其定量数值的双向转换模型.自适应高斯云变换(Adaptive Gaussian Cloud Transformation,AGCT)是云模型最常见的一种粒计算机制.AGCT从数据拟合的角度实现了不同概念层次、不同粒度的概念提取.但是,由于AGCT进行概念跃升需要从最细粒度的数据开始,导致时间复杂度较高.本文借鉴密度峰值聚类算法的思想,为AGCT跨层提供先验知识,提出一种利用关键信息粒加速高斯云变换机制 —AGCT_acc,从而避免了迭代次数过高,加速变粒度的过程.通过图像分割实验显示,本文提出的方法AGCT_acc与AGCT在不同数据集上最终生成的云概念参数几乎相同,即分割效果很接近,而AGCT_acc的时间损耗却比AGCT减少很多.
  • 王卫涛,,钱雪忠,曹文彬
    2018, 39(6): 1305-1311.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对近邻传播算法的偏向参数以及聚类类数对聚类结果准确性的影响.本文提出了自适应参数调整的GKAAP算法.首先,为了选取更合适的偏向参数,在传统AP算法的基础上,利用灰色狼群优化算法(GWO)自适应调节偏向参数;然后,为了使得偏向参数能够在合理的区间内搜寻,利用二分查找算法动态更新偏向参数的上限、下限、中间值;最后,为了使得聚类个数更接近真实类数,同时不影响聚类结果的准确性,在算法迭代完成后,通过数据集的真实簇数k来对聚类结果进行约束调整.本文通过10个UCI数据集和ORL人脸数据库来做对比实验,然后从准确率、算法时间、聚类个数三个维度去分析,最终实验结果证明本文所提出的GKAAP聚类准确性更好,算法时间复杂度更低.
  • 郭星,陈姗姗,张以文,李炜,
    2018, 39(6): 1312-1316.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大数据环境下,服务组合问题已经引起极大关注.然而,随着服务数量的增多,如何在动态环境下找到满足用户需求的组合服务已成为亟待解决的问题.为解决大数据环境下大规模服务组合优化问题,提出一种改进的粒子群优化算法,有效克服了传统粒子群算法对于离散优化问题多样性低、易于陷入局部最优的缺陷.首先,采用粒子活跃度检测机制,增加种群多样性,从而有效增强服务组合优化方案的多样性.其次,在粒子学习过程中,引入烟花爆炸机制,加强种群粒子的搜索能力.同时,引入粒子反向学习理论,显著提高了服务组合全局寻优能力.实验结果表明,所提出的方法可以解决不同规模的服务组合问题,与已有的方法相比,有可较好的性能. 
  • 袁钟,张贤勇,冯山
    2018, 39(6): 1317-1322.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    离群点检测具有广泛应用.传统粗糙集的离群点检测方法不能有效处理数值型属性数据,故提出邻域粗糙集中基于序列的混合型属性离群点检测方法.该方法采用每个属性值的均匀性来构建属性序列,以此定义属性集序列并构建邻域类序列;进而,通过分析邻域类序列中对象的变化情况来检测离群点,并设计出相应的离群点检测算法(Sequence-based Mixed Attribute Outlier Detection,SMAOD),该算法在计算单属性邻域覆盖的方式上改进了传统的逐一比较计算模式.最后,在UCI标准数据集上与主要离群点检测方法进行实验比较与分析,结果表明所提方法的有效性.
  • 姚晟,徐风,赵鹏,汪杰,陈菊,
    2018, 39(6): 1323-1327.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    邻域粗糙集是粗糙集理论中一种处理数值型数据的重要模型,而规则提取是数据挖掘中最重要和最关键的环节,由于数值型数据取值连续,目前在邻域粗糙集模型中的规则提取并没有系统化的方法,本文针对这一问题提出一种特殊的决策规则模型,首先通过对象集的形式来定义决策规则的前件,然后通过求取下近似的方法在邻域粗糙集模型中进行决策规则诱导,最后,通过距离度量来给出决策判别的方法.UCI实验结果表明本文提出的模型具有一定的可行性和合理性.
  • 邵小十,王铁旦,彭定洪
    2018, 39(6): 1328-1334.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对高度不确定环境下的多准则群体决策问题,提出一种基于梯形区间二型模糊的多重处理隶属函数中模糊不确定信息的群决策综合比较法.首先,利用群决策发生算法处理个体决策的聚合问题;其次,利用改进的重心比较法和区域截集法分别处理隶属函数中隶属程度问题和模糊不确定程度问题;最后,根据对隶属函数的处理结果得到综合比较计分值并作为方案选择的依据.通过对隶属函数的主隶属区域和模糊不确定的离散区域的双重挖掘,并以不同数量级形式记录在结果中,使得该决策方法更加契合人类决策行为、决策结果更加真实有效、决策风险更小.文末通过实例分析和比较,证明了本文提出方法的可行性和有效性.
  • 肖卓宇,何锫,李港,杨道武,彭逸凡,董泽民
    2018, 39(6): 1335-1341.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决经典GOF设计模式扩展后不便于恢复的问题,结合Petterson提出的设计模式变体思想与Scanniello提出的设计模式复用概念,提出一种注入间接线索的设计模式变体检测方法,在遵循GOF标准设计模式与其变体意图一致性原则基础上,以类及其关系为基础,关注参与角色间有价值的间接联系,给出了创建型、行为型、结构型模式变体的具体实现,并依次以Factory Method、Command、Proxy模式变体为例,通过6种主流工具与4种经典开源系统对三种设计模式变体进行了检测比较,实验结果表明,本研究有助于设计模式解决方案的恢复. 
  • 简兴明,游进国,梁月明,贾连印
    2018, 39(6): 1342-1348.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着社交网络规模的持续扩大,社交网络中社会关系的计算正逐渐成为数据挖掘研究的热点.如何高效获取社交网络中有价值的信息,如社交网络中适于投放广告的团体、客户关系中具有紧密关系的客户,具有重要的现实意义.对此,提出一个基于影响力的框架,来分析社交网络.首先,提出一种基于相似度的顶点间的权重度量.其次,通过顶点间的相似度来分配权重,改进PageRank算法计算每一个顶点潜在的影响力.最后,通过设置阈值,量化两点之间的影响力得分发现社交网络中的紧密子图.实验结果表明,基于影响力的紧密子图发现算法不仅在计算个人影响力和成员顶点间的共同影响力之间展现了很好的平衡,而且对于真实的社交网络也同样适用.
  • 吴高宇,邵振洲,渠瀛,施智平,关永,
    2018, 39(6): 1349-1353.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于鲁棒主成分分析(RPCA)的运动目标提取对背景变化具有良好的鲁棒性,但传统的基于交替方向法(ADM)的鲁棒主成分分析方法存在计算量大、耗时长等缺陷.为了克服这些问题,一种对称交替方向法(SADM)被提出来,该方法优化了原ADM迭代策略,在一次迭代中对线性约束乘数更新两次,减少了计算成本很大的奇异值分解(SVD)执行的次数,同时加入了新的均衡参数和停机准则,以提高运动目标的提取精度,避免多余的迭代以减少运行时间.通过F测度这一衡量指标对实验结果进行量化,提出的算法比对比算法的提取精度平均提高33.04%,运行时间相对原ADM提高了98.8%.
  • 徐久成,王煜尧,董婉,
    2018, 39(6): 1354-1358.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,基于图像尺度空间提取的描述子在特征匹配中取得了不错的结果.但是,尺度空间的划分方式通常却被主观地判定.因此,本文引入粒子群优化(PSO)算法来找寻更加合理而有效的尺度划分.首先,采用粒子群算法,自适应地寻找到更加合理而有效的尺度划分方式;然后,基于新的尺度划分,结合累积稳定性投票(ASV)描述子提取方法,生成最终的PSO-ASV描述子;最后,通过在Oxford和Fischer图像匹配数据集上进行对比实验来验证其有效性.实验结果表明,PSO-ASV描述子能够获得很好的匹配结果,验证了本文方法的有效性.
  • 黄耀钦,邓玉辉,
    2018, 39(6): 1359-1365.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于NAND的闪存中由于其特殊的物理读写特性,使得固态盘内部广泛存在非对齐的数据存储,而这部分非对齐数据会导致系统产生额外的性能损耗和造成物理可用存储空间的浪费.基于固态盘中存在非对齐写更新操作提出一种MFTL缓存架构,其核心的思想是利用写更新数据存储不对齐的特性,通过重新设计页级映射的FTL将缓存中不同逻辑数据页存在的非对齐更新数据合并为闪存页规格的大小后写回至闪存阵列中,可以节省由于写更新操作导致的额外读取操作的同时也充分减少实际的闪存写入次数,因而降低了底层处理请求队列的负载压力和相应增加了闪存的物理可用容量.通过SSDsim实现并测试相关负载后实验结果表明,与原FTL系统相比,提出的MFTL结构能够省略100%的非对齐写更新导致的额外读操作开销,并且充分减少了固态盘写入次数,从而扩大了可用存储容量和提高固态盘的写性能.
  • 王凌峰,陈兆荣,陈浩,陈宏盛
    2018, 39(6): 1366-1371.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着各领域对卫星遥感数据需求的日益深入,用户不再满足于卫星对地面目标单次观测所获得的遥感数据,而是希望组网卫星能够对目标进行周期性持续观测,以实现目标态势定期刷新.这对卫星任务规划研究提出了更高的要求,传统的多星多目标任务规划方法均假设目标一旦被观测即任务完成,难以适应周期性持续观测任务规划场景.本文分析了组网卫星周期性持续观测任务规划问题,建立了约束满足问题模型.基于分解的多目标进化算法框架,提出了组网卫星周期性持续观测任务规划方法,从观测周期超时程度和卫星能量消耗等两个维度进行多目标优化求解.最后,通过仿真实验,验证了该方法的可行性和有效性.
  • 涂斌斌,谷丽华,揣荣岩,许会
    2018, 39(6): 1372-1376.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对步态特征提取与识别性能过度依赖所采集步态加速度信号质量和周期划分的问题,提出一种使用小波去噪和SIFT描述符的步态识别方法.首先,根据小波去噪质量评价指标自适应地选择最优小波基函数进行小波去噪.其次,采用SIFT算法提取关键点,以K-means聚类方法计算关键点描述符集合的聚类中心,经拟合得到步态特征进行识别.实验结果表明,该算法能有效地去除高频噪声,避免周期划分偏差对步态特征准确性的影响,经自采和公开数据集实验,最短响应时间为0.52s,最大识别率为91.7%,证明了该方法在小样本范围达到对步态信号的有效识别.