过刊目录

  • 全选
    |
    计算机软件与数据库研究
  • 计算机软件与数据库研究
    余东,申德荣,寇月,聂铁铮,于戈
    2016, 37(8): 1633-1638.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在Web数据集成中,常出现多个数据源对同一实体对象的描述存在冲突.解决冲突,发现真值有助于提高数据集成质量或构建高质量的知识库等.已有的解决单真值数据冲突的方法存在数据源评价指标不充分,无法区分数据源的数据缺失和假真,以及无法处理数据源间传递复制、共同复制等高阶复制的局限性.因此,本文采用召回率和假真率度量数据源质量,提出能处理数据源间复杂数据复制的真值发现算法.三个真实数据集和人工数据集上的实验结果表明,本文算法能有效降低错误数据复制带来的真值计算偏差,提高真值发现的准确率.
  • 计算机软件与数据库研究
    郑美光,胡志刚,杨柳,赵锦元
    2016, 37(8): 1639-1644.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对截止期约束的工作流费用优化问题,逆向分层算法利用同步结束特征优化调度取得了较好的效果.然而,现有此类算法缺乏有效的宽裕时间分配策略容易产生无效时间碎片.通过定义邻服务级差性价比,以及对分配避免活动集的特性分析设计了宽裕时间有效分配启发式算法(slack-time effective allocation,SEA).SEA使宽裕时间分配给所需的逆向分组以产生最大的费用优化效果,避免无效时间碎片.同时基于对工作流截止期的不同分区属性的分析设计了改进的时序一致性工作流费用优化算法(slack-time effective allocation extended TCDBL,SATCDBL).实验结果表明了SATCDBL相比典型逆向分层算法DBL和TCDBL,平均费用分别降低了25.9%和12.7%.
  • 计算机软件与数据库研究
    张昌理,王一蕾,吴英杰,苏斌勇,王晓东
    2016, 37(8): 1645-1650.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于标签传播思想的重叠社区发现算法,利用标签的传播特性可有效挖掘潜在的重叠社区结构,但是挖掘过程中采用的随机策略造成传播过程中的不确定性,最终导致结果的不稳定性,因此本文提出一种基于信息熵和局部相关性的多标签传播重叠社区发现算法.该算法在标签传播阶段,采用异步更新策略,利用信息熵产生更新序列指导标签更新,解决社区划分结果不稳定的问题.同时在标签选择阶段,根据节点与自我网络中其他节点的相关程度选择标签,提高所发现社区的质量.基于多个真实数据集和人工网络图的对比实验,结果表明,本文算法有效可行.
  • 计算机软件与数据库研究
    王振飞,刘凯莉,郑志蕴,李钝
    2016, 37(8): 1651-1655.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着在线社交网络的快速发展,越来越多的人开始利用微博等交流工具来传播信息或分享观点.微博已经成为一个表达公共舆论的重要传播媒体,研究微博中的信息转发规律对于热点挖掘、舆情监控、品牌营销等有着重要意义.以新浪微博为例,从发布用户、接受用户、微博内容三个方面进行特征提取,结合支持向量机SVM分类器进行用户去重、垃圾用户滤除,将提取的特征输入到预测算法中,建立逻辑回归模型,实现对微博转发预测.与传统同类预测模型进行对比试验,验证本文方法的正确性与有效性.
  • 计算机软件与数据库研究
    王芳芳1,王文剑(1,2),范小芹1
    2016, 37(8): 1656-1660.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着SOC(Service-Oriented Computing)的广泛应用,Internet环境下越来越多的资源以服务的方式进行封装.服务组合可以通过组合不同的资源来满足用户需求,而服务选择是服务组合的重要组成部分,其选择结果在很大程度上影响了组合服务的可信性.本文针对现有服务选择方法中存在的时间效率低下和查准率不高的问题,提出一种基于Petri网的Web服务选择方法,对服务库中的服务从功能和过程两个方面进行聚类预处理操作,缩小服务选择过程中的匹配范围,同时本文采用的基于Petri网的服务过程相似度计算方法,可以更准确地计算服务之间的相似度,进而在保证聚类效果的前提下提高服务选择的时间效率和查准率.仿真实验验证了本文所提方法的有效性.
  • 计算机软件与数据库研究
    承骁1,白光伟(1,2),华志翔1,黄中平(1)
    2016, 37(8): 1661-1666.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统云辅助的移动消息推送服务可以改善手机续航能力,但是只能支持特定的应用程序.针对该问题,本文提出云代理的移动消息推送服务(CBMMP),将移动终端应用程序卸载到云端,由云服务器代理其消息推送服务,避免系统休眠缺陷.与传统云辅助方案不同,CBMMP通过应用卸载支持现有应用程序,增强了方案的兼容性.在此基础上,设计动静态代理决策和应用增量迁移机制优化应用卸载框架,提高资源利用率.通过建立原型系统对提出的方案进行验证,实验结果表明,在多种应用场景下,CBMMP均可以有效提高移动终端续航能力,增强云端并发能力.
  • 计算机软件与数据库研究
    经海东,张丽平,郝晓红,李松,崔环宇
    2016, 37(8): 1667-1671.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对已有的在路网中的组k最近邻(group k nearest neighbor,GkNN)查询方法存在的不足,提出了利用网格Voronoi图(Network Voronoi Diagram,NVD)的NVD-GkNN算法,具有较好的效果.该算法采用了三个步骤:处理数据集、过滤过程和精炼过程.处理数据集主要是计算查询点集Q的质心q.过滤过程主要是提前存储可能的查询结果.精炼过程主要是从可能的结果集合中找到查询结果.并且进一步给出了处理新增加点的ADDNVD-GkNN算法和处理删除点的DENVD-GkNN算法.实验表明所提算法在处理路网中的组k最近邻问题有明显的优势.
  • 计算机软件与数据库研究
    海沫,郭庆
    2016, 37(8): 1672-1679.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    通过对在线社交网络信息的传播过程和传播路径图的介绍,根据研究对象的不同,将学者们近几年提出的信息传播模型分为基于传播路径图节点和基于传播路径图规模两类模型.根据传播路径图节点模型所研究的影响因素的不同将其划分为线性阈值模型及其改进模型、独立级联模型及其改进模型、多因素模型、博弈论模型共四类模型.根据传播路径图规模模型中采用的理论方法的不同将其划分为SIR模型及其改进模型、马尔科夫模型、场强模型、神经网络模型、回归模型共五类模型.文中对九类模型的建立思路、关键点、改进方向等方面进行了详细分析,并根据提出的模型评价指标,对九类模型进行了定量比较.
  • 计算机软件与数据库研究
    吕杰1,关欣1,李锵1,张立毅(1,2)
    2016, 37(8): 1680-1685.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协同过滤推荐技术是应用最广泛、最成功的推荐技术,但面临着数据稀疏性问题和冷启动问题的严峻挑战.同时传统协同过滤算法在相似度计算中忽略了用户个人上下文信息对相似度的影响.提出一种基于用户上下文信息和动态预测的协同过滤算法.首先引入用户上下文信息来改善相似性度量方法,更加真实的反映用户相似度;然后在推荐生成阶段,采用能够充分利用最近邻居集的动态预测方法来进行评分预测.通过在MovieLens-1M数据集上的实验结果表明:该算法能够缓解评分数据稀疏性对协同过滤推荐算法的影响,显著降低平均绝对误差,提高推荐准确率.
  • 计算机软件与数据库研究
    崔婉秋1,李昕2,孟祥福3,崔岩4
    2016, 37(8): 1686-1691.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于用户对关系数据库内容了解不够充分,使他们很难找出合适的关键字表达自己的查询意图.因此提出一种语义相关关键字推荐方法,通过分析关系数据库中的词条与用户初始查询所提供的关键字之间的语义相关性,为用户提供top-k个与初始查询语义相关的候选关键字来拓宽用户对目标数据库内容的了解,从而帮助他们表达出有效的关键字查询条件.为了评估数据库中词条与查询关键字之间的语义相关性,提出反映词条之间显式和隐式关联的词条耦合关系.然后,利用阈值算法快速返回前k个与其语义相关的候选关键字.实验证明了提出的词条耦合关系评估方法能够有效捕获到词条之间的复杂语义关系,同时也验证了top-k相关关键字选取算法的性能.
  • 计算机软件与数据库研究
    孟祥福,张霄雁,唐延欢,毕崇春
    2016, 37(8): 1692-1696.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前的Web数据库查询系统返回的top-k个查询结果之间在内容上通常非常相似,而现实中用户希望看到彼此有一定差异且具有代表性的查询结果.提出一种基于元组之间语义相似度的top-k典型化查询方法,该方法在离线阶段首先根据属性值的关联信息评估不同属性值之间的耦合关系;然后根据属性值之间的耦合关系,评估不同元组之间的语义相似度.当查询到来时,根据结果元组之间的语义距离,利用概率密度估计方法评估每个元组的典型程度,然后利用top-k近似选取算法从中获取top-k个典型元组返回给用户.实验结果与分析表明,提出的元组典型程度分析方法具有较高的用户满意度,提出的top-k典型元组近似选取方法具有较高的准确性和执行效率,能够有效适用于大规模查询结果集的top-k典型化查询.
  • 计算机软件与数据库研究
    高良友,黄梦醒
    2016, 37(8): 1697-1701.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对传统协作过滤推荐算法在相似性度量环节所存在的不足之处,提出一种利用属性重心剖分模型的时间调整协作过滤推荐算法,通过对项目属性矩阵填充用户所在群体所对应的普遍评分值,进而对用户—项目评分矩阵填充评分预测值,再在填充后的用户—项目评分矩阵的基础上,利用属性重心剖分模型度量出初步相似性,并结合传统相似性,得出复合相似性,最后对复合相似性进行时间维度调整,得到最终的相似性.仿真实验结果表明,与传统的协作过滤推荐算法相比,该算法可以获得更高的推荐精准度,并能够很好地适应于数据集极度稀疏、冷启动、用户兴趣漂移等特殊情形.
  • 人工智能与算法研究
  • 人工智能与算法研究
    黄玲琳,刘青,杨楠,李亚平,肖林
    2016, 37(8): 1702-1706.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    发现基因模块是生物信息学数据分析的一个重要研究内容.本文定义基因模块为一组基因,其表达水平在一个样本子集中的每一样本上都有完全相同或相反的大小顺序.为了从高维度的基因表达数据中发现有意义的基因模块,提出一种基于Rank(序)的双向聚类算法——RABBIC(RAnk-Based BIClustering algorithm).RABBIC算法对模拟数据集和真实数据的聚类分析都获得良好的性能评价,RABBIC算法发现了TCGA提供的卵巢癌基因表达数据的451个基因模块,其中93个同时满足显著性、准确性和相关性的要求.经基因集功能富集分析,得到了25个可能具有重要的生物医学意义的基因模块.
  • 人工智能与算法研究
    洪华剑,叶东毅
    2016, 37(8): 1707-1711.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在粗糙集理论中,最小属性约简未必是对应决策规则数最少的约简.为了从属性数和规则数两个维度消除数据表的冗余信息,提出一种以最少提取规则数和最少属性个数同时为优化目标的多目标属性约简问题及其相应的多目标遗传进化求解算法.该算法在NSGA2(Non-dominated Sorting Genetic Algorithm 2)算法的基础上,以多目标之间的支配关系确定种群个体优先级,并有针对性地引入了精英保留策略、分散进化策略和去重策略.实验结果表明,该算法能够有效地求解本文提出的多目标属性约简问题,其中的分散进化策略、去重策略和精英保留策略增强了进化种群的多样性和收敛性.与NSGA2算法比较,本文算法能获得更多的非支配多目标约简,具有更优的求解能力.
  • 人工智能与算法研究
    张玉连(1,2),郇思思(1,3),梁顺攀(1,2)
    2016, 37(8): 1712-1716.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    Slope One算法是一种基于内存的协同过滤推荐算法,在计算时,内存消耗过大,尤其当数据集稀疏时,预测结果的准确度不高.基于此,将一种基于模型的算法融合到基于内存的Slope One算法中,提出一种使用机器学习中最小二乘法改进的加权Slope One算法,该算法简单直观且计算高效,可以克服传统基于内存推荐算法的诸多缺点.最后,在Filmtrust和Movielens数据集上的对比实验结果表明,融合偏差因子的加权Slope One算法在这两个稀疏度不同的数据集下,均能获得较高的推荐准确度.
  • 人工智能与算法研究
    黄琴,魏玲
    2016, 37(8): 1717-1720.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    序信息系统的属性约简是粗糙集理论与信息系统知识发现中的重要问题.现已有学者给出了粗糙集理论中概念与运算的布尔矩阵表示.在此基础上,介绍了序信息系统的布尔矩阵表示,并定义了布尔矩阵表示下序信息系统中属性的区分能力.给出了序信息系统上的一种基于布尔矩阵的属性约简方法,并证明了该方法与基于辨识矩阵的传统约简方法的等价性,同时还给出了判断核的等价命题以及求核方法.最后给出了基于布尔矩阵的属性约简的具体算法并通过实例分析证实了其有效性.
  • 人工智能与算法研究
    徐晨初,张燕平,刘国涛
    2016, 37(8): 1721-1724.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚焦爬虫是一种只对特定主题的相关和必要信息进行检索的网络爬虫.因其对抓取的内容只限于搜索主题,在检索过程中无须对整个网络进行遍历,大大降低了搜索过程的复杂性.但是,现今大量算法的改进集中在满足普通用户对快速搜索的要求,较少考虑对特定主题准确性的需求.为此,提出一种优化爬行路径的聚焦爬虫算法(OPFA).算法通过计算主题和页面、页面和页面间语义相似性,获取页面相似性排序及分类结果,最终形成爬行优先级并优化爬行路线.实验结果表明,OPFA能一直在与搜索意图相似度相对较高的页面中搜索,有效的提高了检索的准确性.
  • 人工智能与算法研究
    徐斌(1,2),刘弘(1,2)
    2016, 37(8): 1725-1729.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对复杂场景下的人群疏散运动,提出一种改进的社会力模型与人工蜂群算法相结合的方法.利用改进的人工蜂群算法进行实时宏观路径规划,底层结合修正的社会力模型指导个体运动.考虑到视角对个体运动的影响,在原始社会力模型基础上引入视觉影响因子,同时消除互不可见个体间的社会心理力;依据行人疏散过程中出现的结伴、从众现象,在人工蜂群算法中引入分组策略,同时将疏散时间作为适应度评判标准,符合现实疏散中行人的心理特征,提高了算法的收敛速度及寻优精度.实验结果表明,该方法下人群运动流畅自然,能够实现更真实的仿真效果,对紧急情况下的人群疏散具有指导意义.
  • 人工智能与算法研究
    方宝富,李勇,王浩
    2016, 37(8): 1730-1734.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在多机器人系统中,任务分配是一个重要的研究课题.文章对任务分配中的机器人情感因素进行研究,提出基于情绪感染的情感机器人任务分配算法.根据OCEAN模型定义情感机器人个性,并结合机器人在情绪感染中行为的不同将个体分为四种类型,定义情感机器人个性到行为的映射,提出情绪感染算法,将情绪感染与任务分配结合.任务分配中首先依据定义的领导能力参数选择团队领导者,然后根据情绪感染机制选择出任务团队中的其他合作成员,形成满足任务需求的团队.最后实验分析了情绪感染模型的影响因素和不同个性机器人个体对一般群体的影响,并验证了本文所提出算法的有效性.
  • 人工智能与算法研究
    柳广鹏(1,2),刘弘(1,2),吕蕾(1,2),李焱(1,2)
    2016, 37(8): 1735-1740.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在人群行为的运动仿真研究中,人群的分组行为是不能忽略的因素.家庭成员、同事、朋友等关系较密切的人会依据亲密度形成分组,这种现象在整个疏散过程中一直存在,并且个体之间的关系越密切,他们在组内的聚集度越高.目前在人群运动仿真方法中,要么没有考虑分组,要么只根据距离进行分组,而不考虑个体间的关系.本文针对上述不足,在运动过程中同时考虑个体间距离和个体间关系这两个因素对运动的影响,提出了一种改进的K-Medoids算法,该算法加权考虑两类不同的特征值.为验证本文方法的有效性,设计了多组实验.实验结果表明本文方法能够较好地提高疏散效率,并且由于分组过程中考虑了人与人之间的距离以及亲密程度等因素,能够使得虚拟环境中的人群疏散效果更加贴近真实环境下的人群疏散行为.
  • 人工智能与算法研究
    胡凌超,于洪
    2016, 37(8): 1741-1745.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    聚类集成通过综合多个聚类结果得到最终的类簇划分,在保证与每个被集成的聚类结果尽量一致的前提下,提高了聚类算法的稳定性.但是目前少有专门针对二支决策聚类结果集成为三支决策聚类结果的集成方法,而三支决策以其更符合人类认知与决策模式的优势正被学术界广泛研究.为此,提出一种新的基于三支决策的聚类集成方法,并用区间集的形式表示最终聚类结果,即用区间集的下界、边界与上界分别表示聚类结果中类簇的正域、边界域和负域.首先,通过已有的聚类算法得到相同数据集不同的二支决策聚类结果,然后通过聚类成员类簇标签匹配以及求交集的方式得到一部分数据的类簇归属,最后通过基于投票的三支决策方法,对剩余部分数据进行类簇划分.实验结果表明文中提出的基于三支决策的聚类集成方法是有(效的.)
  • 人工智能与算法研究
    马恒1,丁世飞(1,2)
    2016, 37(8): 1746-1750.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着科技的发展,人们在生活中产生了大量的数据,其中部分数据具有数值型和分类型两种属性类型.现有的大多数聚类算法只能处理单一属性类型的数据,对这种混合属性的数据往往难以处理.针对这个问题提出一种基于混合数据相似度测量的谱聚类算法,首先对两种属性数据分别进行相异度度量,然后用一种相似性度量表示出混合数据之间的相似性关系,把相似性关系映射成无向图两顶点之间边的权值,最后通过谱聚类算法实现聚类划分.从UCI标准数据集选取几个混合数据集进行实验,并与其他算法进行了比较,验证了本算法对混合数据聚类的有效性.
  • 人工智能与算法研究
    魏昕宇,张涛,白冬辉
    2016, 37(8): 1751-1754.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    属性拓扑是形式背景新的表示方法,其以属性及属性间的耦合关系为基础精确、可视化地刻画形式背景,有效降低概念计算的复杂度;属性拓扑是形式概念分析中的基础理论,而形式概念分析是粒度计算的重要应用方向;本文结合属性拓扑与粒计算,提出拓扑粒概念,并给出其生成方法与结果分析.其以属性拓扑为基础,以属性关联紧密度为切入点,通过分析属性拓扑顶点连接特性分析属性拓扑的粒度结构,并基于拓扑分裂提出一种属性拓扑粒结构分析算法,结合形式背景的阐述属性拓扑粒结构的实际意义,为属性拓扑粒结构分析提供一种思路与方法.
  • 人工智能与算法研究
    肖宪翠(1,2),郑向伟(1,2),张宇昂(1,2)
    2016, 37(8): 1755-1759.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着设备间通信数量的增多,网络的稳定性和资源的利用率成为评价网络性能的两个重要指标.现有的可生存性算法使用备用资源来提高网络的稳定性,但资源浪费问题严重.本文提出了一种支持路径切割和资源共享的可生存性算法(GSBKE-Pc-Yshare),此算法支持虚拟请求的不同链路共享同一条物理链路来减少备用资源的使用量.由于现实中物理资源有限,任意两个物理节点之间很难找到一条资源数量能完全满足虚拟网络请求,同时与主用流不交叉的备用路径,因此网络接受率较低.本文中提出的GSBKE-Pc-Yshare算法支持路径切割,允许两条物理路径同时为虚拟链路提供备用资源,即通过降低对备用路径资源数量的限制来提高网络的接受率.此外,本文用群搜索优化算法(Group Search Optimizer,GSO)来优化目标函数以获得较好的映射方案.仿真实验表明,与现有的可生存性算法相比,GSBKE-Pc-Yshare算法的接受率提高30%,网络平均收益提高50%,网络成本降低超过30%.
  • 人工智能与算法研究
    张浩(1,2),叶东毅(1,2),郭文忠(1,2)
    2016, 37(8): 1760-1764.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    直角斯坦纳树问题是大规模集成电路物理设计中重要的基本模型.现代集成电路设计需要同时考虑障碍和多层布线等约束条件.通过构造布线图,提出一种多层绕障直角斯坦纳最小树启发式算法.为了避开障碍和连通各布线层之间的引脚,本文引入了三种候选通孔位置.在同一布线层内,通过扩展满直角斯坦纳树网格来构造单层布线图,再使用候选通孔互联成多层布线图.在多层布线图中,引入候选斯坦纳点来构造斯坦纳树,并以标记的引导点执行局部搜索策略来提高求解质量.实验结果表明,本文算法能够有效求解多层绕障直角斯坦纳最小树问题.本文算法所得总布线权重与最新的两种算法相比,改进率可达2.34%和5.48%.
  • 人工智能与算法研究
    曹春萍,王松
    2016, 37(8): 1765-1769.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对不同媒体形式的数据进行内蕴知识分析,对其一致性进行表示,是跨媒体时代重要的研究目标之一.传统的知识表达方式大多是基于多媒体文档,对跨媒体数据很难准确表达其之间的知识结构,为了解决跨媒体知识表示的特殊性,研究出一种语义网络支持下的跨媒体的一致性表示方法.详细阐述建立数学模型过程,在主媒体与子媒体之间构建映射语义空间,然后进行语义关联计算,对多媒体对象进行属性感知,完成对跨媒体的单一信息载体进行有效性辨识和属性抽取,最后利用本体知识,构建语义网络,从而进行一致性表示分析.数据集实验结果表明,该方法能够克服多媒体文档知识表示的局限性,具有较好的实用性及准确度.
  • 人工智能与算法研究
    张波,徐蔚鸿,陈沅涛,朱玲
    2016, 37(8): 1770-1774.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有算法在大数据背景下聚类效果差,以及由于迭代等原因导致处理性能低等问题,提出一种在Hadoop平台高效并行的聚类算法PAClustering.先提出一种基于权重的方法,将整体数据按分布划分成若干数据块,并针对每个数据块将紧凑的数据抽象成一个向量,形成微团,最后通过树形合并进行聚类,在提高聚类准确度的同时有效避免了传统算法在聚类过程中的迭代运算.在不同大小数据集上的实验表明,PAClustering算法不仅具有较高的聚类准确度和稳定性,同时具有良好的处理性能.
  • 人工智能与算法研究
    徐天贺,马媛媛,徐久成
    2016, 37(8): 1775-1779.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对基因表达谱数据高维度、低样本和数值型的特点,为了选出对分类有用的特征基因,提出了一种基于邻域互信息最大化和粒子群优化的特征基因选择方法.该方法首先基于邻域互信息最大化对基因进行排序,然后选择出排序在前且冗余较少的基因构成初选特征基因集合,最后用初选特征基因集合对粒子群优化算法的部分种群进行初始化,能较快的搜寻到较优的特征基因子集.实验结果表明,该算法可快速有效地选择特征基因,并获得较高的分类精度.
  • 人工智能与算法研究
    黄健恒,于军琪,赵敏华
    2016, 37(8): 1780-1785.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对移动社交网络社区管理问题,研究提出聚类分析框架,并设计相应的节点信息交换数据结构,该结构能够存储节点相遇过程中的节点间相似度信息,并适用层次聚类进行分析.但存在数据处理量随节点数量增加而大幅增加的问题,对此为解决大型移动社交网络数据维数灾难问题,利用采样构建数据子集方式,并结合Mapreduce计算模型实现并行移动社交网络均值聚类中心选取方式.同时,为提高算法稳定性和便于设计信息转发方案,采用一种分布式层次聚类方式,对个体进行聚类分析和基于层级的转发方案设计.最后,通过实验,验证了所提算法在保持聚类精度前提下,有效提高了大型移动社交网络聚类分析效率.
  • 人工智能与算法研究
    张凯英,张裕,陈泽华
    2016, 37(8): 1786-1789.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    状态化简是指通过一定算法消除时序逻辑电路中的冗余状态,进而降低电路复杂性、减少功耗和提高系统可靠性.完全确定时序逻辑电路指是指输出和次态不存在不确定状态的电路,其状态化简的本质是根据等价关系,寻找最大状态等价类的过程.本文将粒计算理论应用到传统的状态化简问题中,提出基于粒计算的状态化简算法.在定义输出矩阵和状态转移矩阵基础上,根据迭代原则,从粗粒度到细粒度,利用等价关系对论域元素持续进行分层粒化,直到分类不再改变得到所需的最大等价类(粒子).实验结果与分析表明,该算法准确有效.
  • 人工智能与算法研究
    黄苑华1,郝志峰(1,2),蔡瑞初2,谢峰(1)
    2016, 37(8): 1790-1793.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    距离度量是聚类算法的基础,它对算法的效果有很大的影响.然而分类型数据的聚类是学习算法中重要而棘手的问题.传统的k-modes算法采用0-1匹配方法定义每两个对象属性值之间的距离,忽视了属性间的相互关系对距离的影响.针对这个问题,本文基于相互依存冗余度量定义了一种新的距离,该距离由内部距离和外部距离两个部分决定.这种度量方法不仅表现出某个属性本身的差异性,而且表现出其他属性对该属性的影响程度.本文与基于其他距离度量的k-modes算法进行实验比较,结果表明基于相互依存冗余度量的k-modes算法能有效地提高算法的聚类精度.
  • 人工智能与算法研究
    祝燕青,祝峰,林姿琼
    2016, 37(8): 1794-1797.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    二元关系在数学中是一种非常重要的结构,并且这种结构已经被作为一些领域的基础.拟阵论是线性代数理论和图论的推广,其具有完善的理论体系且被广泛应用到许多领域.类比上近似数,通过二元关系提出了关系近似数的概念.证明了关系近似数满足次模性,同时通过计算前继邻域的基数的方法给出了关系近似数的计算方法.此外,通过引入多重集族的概念,给出了一个集合的上近似数和关系近似数相等的充分必要条件.最后,利用上近似数和关系近似数相等的方式构造出了一种拟阵结构,并讨论了这一拟阵结构的一些基本性.
  • 网络与信息安全
  • 网络与信息安全
    陈莎1,朱福喜1,阳小兰2,刘世超1
    2016, 37(8): 1798-1801.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社会网络中节点属性等外部信息的不可靠性及难获取性,使得社会网络的链路预测方法都集中在网络的拓扑结构信息上,并且常用的链路预测方法往往只利用了网络的局部拓扑信息.此外,社会网络的静态链路预测方法忽视了网络演化趋势信息,影响了预测精度.基于以上现状,结合节点间共同邻居相似性指标及偏好连接相似性指标,提出一种基于混合相似性指标的网络动态链路预测方法.该方法提出一种基于网络局部信息的混合相似性指标,为已存在链接分配一个影响力衰减因子并将其引入混合相似性指标进行计算,进而根据该混合相似性指标预测链路.实验结果表明用上述方法,预测精度得到了提高.
  • 网络与信息安全
    张龙,黄刘生,徐宏力
    2016, 37(8): 1802-1806.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无线通信技术在近些年的快速发展带来了对频谱资源需求的增长,而以往传统的固定频谱分配方式也带来了很多频谱资源的浪费现象.认知无线电网络可以很好地解决频谱资源的稀缺与浪费的现象,它的核心是让授权用户与其他用户一起共享频谱资源.频谱感知与频谱接入是认知无线电的两大基础技术,以往的研究均是将二者进行单独研究,而它们之间却是相互影响和制约的.提出基于非精确频谱感知的频谱分配与共享机制,分析了对授权用户的干扰所产生的影响,利用排队论理论求得非精确频谱感知下的用户最大数据传输率.
  • 网络与信息安全
    陈羽中,翁诗宁,郭昆
    2016, 37(8): 1807-1811.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对车辆自组织网络中数据融合的研究,目前主要集中于大规模簇间数据融合分析,而对簇内数据融合的研究却很少涉及.为了评估簇内数据融合性能,研究了节点可信特征以及动态车辆自组网的网络结构变化特征,提出了一种基于纳什均衡的数据融合算法,用于分析簇内节点在数据融合过程中存在的竞争和合作关系,进而分析簇特征冗余度和网络结构变化程度的均衡关系.通过对算法进行扰动,可以得到效益最优传输策略.实验结果证明,最优效益解在数据融合精确度和网络结构稳定性方面具有优势.
  • 网络与信息安全
    文宏(1,2),樊晓平1,张会福2,陈安华2
    2016, 37(8): 1812-1815.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    诸如Internet的web层及路由层、城市公交网、航空网等实际网络都呈现BA网络的无标度特点.常用的提高此类网络性能的代表性方法有优化路由算法参数、增加网络节点处理能力等.通过研究BA网络拓扑、局部路由算法及节点处报文数之间的关系,从理论上揭示了上述两种方法的优缺点,同时设计了一种通过优化配置节点处理能力来提高网络性能的新方法.仿真实验表明:优化路由算法参数能扩大网络容量,但会增加报文路由时间;提高少数大度节点转发能力也能扩大网络容量,同时避免增加报文路由时间,但需额外增加网络节点处理能力;而新设计的方法则能够在不增加网络节点处理能力之和的基础上大幅扩大网络容量、减少报文路由时间.本文的研究成果可为BA网络优化设计提供基础.
  • 网络与信息安全
    林青1,戴慧珺2,张振伟2,张佳庚3
    2016, 37(8): 1816-1820.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    移动中继节点的选择算法是多跳蜂窝网络提升系统吞吐量的关键技术,提出基于多目标优化策略的最优中继选择算法.该算法将带宽和信干噪比两个因素引入中继选择算法中,提升用户吞吐量的同时降低中继节点切换次数.分析动态场景中影响系统吞吐量与中继切换概率的因素,并充分考虑多跳蜂窝网络的移动特性与用户呼叫到达状态,优化参数选择更符合实际工作场景.仿真结果表明该算法与传统算法相比有效提升了用户吞吐量,同时降低了中继切换次数,增强了用户体验.
  • 网络与信息安全
    曹春萍,郑夏
    2016, 37(8): 1821-1825.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有的社交网络隐私保护方法大多针对单个对象:身份隐私或属性隐私,不能全面有效地保护用户隐私.本文提出一种(k,ε)-匿名模型,该模型要求对于任何一个顶点,与其具有相同邻居敏感标签的顶点至少有k-1个,且要求每一个敏感标签在局部邻域的分布和其在整个图中的分布差距在ε(0≤ε≤1)之内,从而在抑制度攻击的前提下,保护了敏感属性信息.由于社交网络庞大复杂且多用图来表示,当前大量研究均是基于其局部子图展开,因此该论文提出一种聚类算法和一种使局部最优化的贪心算法用于实现(k,ε)-匿名模型,并从信息损失度、隐私泄露风险、数据可用性、算法实现效率方面对比了k-degree匿名模型,实验结果表明该匿名模型整体优于k-degree.
  • 网络与信息安全
    刘义春,梁英宏
    2016, 37(8): 1826-1831.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    电子商务实体的信任涉及交易额、交易发生时间、实体参与交易的活跃度等诸多因素.针对电子商务环境的信任评价,大多数基于声誉的信任评价模型是单维度的,只根据单一的交易属性对历史交易给出粗粒度的评价.文章提出了一种基于交易上下文属性的多维度信任模型,结合考虑时间衰减因素、交易额影响和交易次数给出实体交互信任度量方法,利用实体活动相似度计算信任推荐实体的可信程度,综合直接信任和推荐信任来对电子商务交易实体进行信任评估.实例分析表明,模型较好地体现了交易上下文属性对信任计算的影响,增强了信任模型在交易上下文属性上的敏感性.
  • 图形、图像及其它
  • 图形、图像及其它
    何菲菲,王国胤,刘旋
    2016, 37(8): 1832-1836.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的彩色图像分割方法仅考虑了图像的数据信息和色彩信息,忽略了图像区域间的关联,导致图像过分割或欠分割,使图像无法达到理想的分割效果.针对这个问题,在基于云模型和多粒度的图像分割上,提出了融合图像空间信息的分割方法.该方法利用云变换将图像的特征信息进行粒化,然后给出了区域距离度量,在彩色图像分割中融入图像空间信息,采用自适应式的区域生长方法实现多粒度的云概念的合成,从而针对图像分割的不确定性问题,结合云变换粒化技术和图像空间信息,实现彩色图像的分割.实验结果验证了该方法的正确性和对彩色图像分割的有效性.
  • 图形、图像及其它
    陈磊,吴悦,岳晓冬
    2016, 37(8): 1837-1842.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为有效分析监控视频中群体行为,本文提出了一个基于小波变换的群体异常行为检测方法(WTM).方法不仅可以检测群体的整体移动异常行为,也可以应用于群体中个体异常行为检测.方法首先利用KLT跟踪算法获取运动特征信息,据此设定行为一致性描述因子逐帧度量视频中群体行为一致性,然后利用小波变换独特的时—频局部化特性来检测群体行为一致性指标变化的奇异点,从而发现群体行为异常.通过在公开的视频数据库上进行测试并与其它检测方法进行比较,实验结果表明本文提出的方法能够及时、准确的检测视频中群体异常行为的发生.
  • 图形、图像及其它
    秦绪佳(1,2),葛春霞1,范颖琳1,郑红波1 ,陈胜男(1,2)
    2016, 37(8): 1843-1847.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    经典暗原色先验去雾理论对于单幅雾天图像有较好的处理效果,但该算法处理halo效应的soft matting技术运行速度较慢.在暗原色先验算法基础之上,针对该算法的不足,提出邻域自适应的暗原色先验去雾的改进算法.算法首先利用暗原色先验原理估算出雾天图像透射率,在计算透射率的过程中引入邻域自适应的思想,在图像边缘的约束下对透射率图进行邻域自适应优化计算,得到了更合理的透射率估计值,使halo效应显著的减少,然后使用导向图滤波对优化后的透射率图再次优化,其中取更小的参数值就可以得到清晰无雾图像,速度得到了加快.实验结果表明,该算法应用到图像去雾处理中,从根本上避免“暗色扩张”现象的发生,而且在去雾效率方面有大大的提高.
  • 图形、图像及其它
    蒋维,孟利民,林梦嫚,应颂翔
    2016, 37(8): 1848-1853.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    实时流媒体数据业务由于网络服务的多媒体化受到人们的广泛关注.针对实时流媒体业务在IP网络上传输由于丢包、延时等现象引起的质量问题,本文利用数字喷泉技术,对H.264实时视频设计了一种具有不等差错保护的系统喷泉码的度分布,用以改善实时流媒体数据在IP网络上传输的性能.设计了一种I帧分布,能够根据信道删除率对H.264视频的I帧数据包进行高等级保护,接收方能以较高的概率优先恢复出I帧数据.仿真结果表明:在信道删除率确定的情况下,与同等差错保护的鲁棒分布相比,使用I帧分布能得到更高PSNR值的视频流,同时具有更短的解码延时,系统的性能得到较大的改善.
  • 图形、图像及其它
    唐颖军1,黄淑英1,杨勇2,戴利云1,李贤虹3
    2016, 37(8): 1854-1856.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在图像信息处理中视觉词典生成过程需要对高维数据进行聚类操作.但这些高维数据不可避免会对计算机内存和计算能力提出更高要求.本文针对聚类过程中可能产生的内存耗尽以及初始聚类质心设置问题,对现有K-means算法加以改进.通过建立初始聚类质心与各类场景中的特定语义的关联,使之体现图像各类场景的类别特征集合,进而用于指导K-means过程中的初始质心设置.此外,在迭代过程中通过批次读入特征描述子,采用K近邻进行簇分配,从而避免了一次性读入全部特征描述子而造成的内存耗尽问题.同时,对于新的簇质心生成采用综合判别均值与中位值的办法来提高各族的聚合度.本文方法与Oxford University提出的K-means进行了对比,实验结果表明本文算法在性能与收敛上更具优势.
  • 图形、图像及其它
    胡昭华(1,2),鞠蓉1,李容月1,何军1
    2016, 37(8): 1857-1861.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    现有大多稀疏跟踪方法往往采用基于灰度信息的特征描述目标,但灰度特征一般无法处理目标的旋转、姿态变化等问题.针对此问题,本文采用一种新的基于平均曲率和高斯曲率的梯度纹理特征的稀疏跟踪方法.梯度纹理特征具有旋转不变性,能很好地解决图像的旋转以及光照变化等问题.在粒子滤波框架下,提取目标模板和候选粒子的梯度纹理特征,用字典模板对每个候选粒子进行稀疏表示,求解稀疏系数并实现重构,将具有最小重构误差的粒子作为跟踪结果.同时采用增量子空间学习的方法对模板进行更新,有效抑制跟踪漂移并能处理目标遮挡问题.与现有跟踪器的大量对比实验表明,本文算法在各种挑战因素下有明显优势.
  • 图形、图像及其它
    廖翠萃1,李敏2,梁久祯2,吴秦2,许洁2
    2016, 37(8): 1862-1867.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于图像区域信息的Chan-Vese模型是经典的图像分割模型.该模型的主要求解过程是最小化能量泛函的过程,通常使用基本的显式欧拉数值求解方法进行求解.针对模型的数值求解优化问题,提出一种使用半隐式数值求解方法的改进Chan-Vese模型优化求解模型.首先,简化Chan-Vese模型的能量泛函,并实现水平集函数的自动初始化,加快模型的迭代收敛速度.其次考虑图像的概率统计信息,得到基于概率密度信息的拟合项,增强模型的鲁棒性.最后,将改进半隐式数值求解方法通过与常用的数值求解方法进行对比实验分析.实验结果表明该方法在一定程度上提高了图像分割速度,并在不同的时间步长上更具稳定性.
  • 图形、图像及其它
    王亚平,张素兰,张继福,胡立华
    2016, 37(8): 1868-1872.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    利用一般概念格生成用于表示场景图像的视觉单词,在一定程度上能提高场景分类的精度,但因该格结构仅表示二值映射关系从而导致场景分类精度不高.模糊概念格不仅具有一般概念格的层次化表示知识的特点,还具有多值映射的特征,成为一种提取不确定知识的有效工具.首先生成关于训练图像视觉词包模型表示的多值映射特征背景,然后在构造的模糊概念格上,利用其层次结构,通过不断缩小隶属函数的取值区间,以约简部分“噪声”视觉单词,进而寻找一个场景分类精度较高的最优取值区间,最后在该区间下有效提取了表示某类场景的视觉单词集,实验验证了该方法的有效性.
  • 图形、图像及其它
    朱良(1,2),林浒1,吴文江3
    2016, 37(8): 1873-1877.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    机器人视觉技术与信息技术一样,在强化产业竞争力方面极为重要.同时,视觉技术与机器人的结合,会大大提高生产效率,最大限度的保证生产中的人身安全.因此,对工业机器人视觉技术的研究具有十分重要的意义.结合实际生产需求,为实现机器人利用视觉技术获取目标工件矢量数据信息,对比分析已有图像处理、轮廓检测、最小外接矩形检测等方法,并加以改进,提出一种较为准确高效的工件矢量数据数据获取方法.试验结果表明,本文方法能够准确快速的对目标工件进行定位,获取矢量数据信息.
  • 图形、图像及其它
    刘永花1,杨丽娜2,王静宇3
    2016, 37(8): 1878-1882.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对虚拟机(VM)迁移过程中,迁移时间和停机时间对用户使用感受的影响,从提高网络服务质量降低网络运行成本角度出发,提出一种基于联邦云马尔可夫链多虚拟机并行迁移策略.首先,对传统的虚拟机顺序迁移过程进行研究,并研究构建出多虚拟机情况下的并行迁移过程,给出其迁移时间和停机时间计算模型.然后,将多虚拟并行迁移构思为一个泊松分布过程,并基于马尔可夫链构建多虚拟并行迁移的数学分析模型.最后,通过实验,给出模型参数对多虚拟并行迁移过程的影响,并且对比了顺序迁移过程的迁移时间、停机时间及网络成本,验证了并行迁移过程在处理大数据迁移中的优势.
  • 图形、图像及其它
    张晓军1,刘文远(1,2),刘永山(1,2),王林(1,2)
    2016, 37(8): 1883-1888.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于位置的服务在生活中扮演着越来越重要的作用,不仅可以为用户提供定位导航服务,而且改变着人们的生活交流方式.现有的室内定位系统大都是利用Wi-Fi接收信号强度(RSS)进行指纹匹配,以坐标方式表示位置,存在着定位精度低,不能直观表示室内位置关系等诸多不足.针对这些不足,本文提出一种基于语音识别的室内定位方法-HspotNavi.当用户静止时,利用语音识别和条件随机场解析周围声音中的位置语义,并将其与用户行走过程中采集的WiFi指纹序列、惯导数据一起打包成路径信息,上传至服务器.当其他用户请求定位服务时,HspotNavi根据语义获取预存路径,利用WiFi指纹序列的错位匹配提供定位服务.