过刊目录

  • 全选
    |
    计算机软件与数据库研究
  • 计算机软件与数据库研究
    张书波,张引,张斌,孙达明
    2016, 37(11): 2385-2390.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对基于搜索日志的查询扩展方法所提取的查询扩展词受到词汇流行性影响较为严重,存在一段时期内知识覆盖有局限,导致缺失部分满足用户信息需求的搜索结果的问题,提出平衡流行性和相似性的混合式查询扩展方法.该方法先对用户搜索日志进行聚类,并进行用户查询词匹配,生成日志扩展词集;再利用本体生成用户查询词的扩展词分类集;基于这些词类集,计算日志扩展词集的语义覆盖度,对覆盖度不足的日志扩展词集利用证据理论的合并规则融合两扩展词集,获取高质量的扩展词.实验结果表明,该方法提高了搜索引擎的检索性能,满足了用户搜索信息的需求,提高了用户搜索满意度.
  • 计算机软件与数据库研究
    余炀1,臧斌宇2
    2016, 37(11): 2391-2396.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    Intel Xeon Phi协处理器作为现阶段极具代表性的众核产品之一,为应用程序提供了强大的硬件环境和计算资源.然而,Xeon Phi所采用的内存设计存在高访问延迟的问题,因此非常依赖于缓存数据预取技术以提升访存性能.而Java作为一门具有自动内存管理且被广泛使用的语言,现有设计并未针对于Xeon Phi架构采取访存相关的优化.本文详细地研究了Xeon Phi上的缓存预取机制,并在HotSpot虚拟机内部设计实现了一套动态的运行时缓存预取解决方案,该方案相比传统的静态方法和现有动态预取方案更适合于Xeon Phi众核架构及Java动态语言环境.本文通过实验表明,该动态预取方案在Xeon Phi众核平台上可以带来平均2.5倍的单线程加速比以及40%的多线程最优性能提升.
  • 计算机软件与数据库研究
    刘誉臻1,孙文辉2,张震宇1,石琼3
    2016, 37(11): 2397-2401.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    软件错误定位是软件测试领域的研究热点.基于覆盖的软件错误自动定位技术,利用概率模型对程序执行信息进行统计分析,估计程序语句与错误的相关度,预测错误位置.其最基本的思想是,错误语句往往较多地被失败用例覆盖而较少地被成功用例覆盖.此类技术层出不穷,演化迅速,往往需要试验各种公式,并辅以繁杂的测试分析.由于研究人员的差异和实验条件的多样,实验中往往需要反复进行测试和重新编写脚本;工具和经验共享不利,已成为阻碍软件错误定位研究发展的不利条件.本文设计实现了针对软件错误定位技术的在线评测和实验平台,能简化实验步骤、避免编写脚本、设计公式原型、调整实验参数并自动生成结果.目前已有多家科研单位利用本文实现的平台进行着此类研究.
  • 计算机软件与数据库研究
    谢翌(1),孙宇清(1),沈雷(2)
    2016, 37(11): 2402-2408.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    异构性、结构性和动态性是复杂社会网络的本质特征,研究网络的社团结构有助于发现复杂网络中的信息传播规律、热点话题和权威用户.网络成员参与的主题讨论是导致社团演化的重要因素,而社团变化又带来社团主题变迁,研究主题引导下的社团结构演化,对基于社交的商品推荐、热点预测等问题有重要现实意义.针对主题驱动的社团演化问题,详细讨论了复杂网络节点关系和紧密度,以及社团发现算法,阐述了主题分析模型和主题驱动的社团演化趋势.详细分析了这些工作在复杂网络中主题和社团推演问题方面的主要贡献和存在的不足,并讨论了未来发展方向和关键问题.
  • 计算机软件与数据库研究
    张翀,陈晓莹,史宗麟,葛斌
    2016, 37(11): 2409-2415.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    HBase是一种面向亿级规模的分布式键-值数据库,它能够提供在海量数据情况下的高效读写操作.然而由于HBase仅提供键-值模式的查询,因此无法满足面向时空应用的查询.现有工作的问题,第一,没有考虑时间维这一经常性的查询维度,第二,基本都是从设计HBase的schema出发设计row key来满足多维查询,这不能从根本上提高检索性能.针对这些不足,充分研究了HBase的内部索引机制,提出基于meta机制、适合于时空检索的HST结构,利用了meta链表索引了空间和时间,在此基础上设计了时空范围查询和kNN查询,以及对应的并行算法.在真实数据集上进行实验,结果表明,相比较于现有工作,基于HST的HBase时空检索能力明显提高,能够支持HBase应用于海量时空数据查询.
  • 计算机软件与数据库研究
    司亚利(1,2),李峰3,宋亚伟1
    2016, 37(11): 2416-2420.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于位置社交网络中的兴趣点推荐不仅能够帮助用户有效挖掘新地点,带来新体验,还可以帮助兴趣点商家向用户发送广告,提高商业效益.针对兴趣点推荐中存在的精度低问题,提出一种结合流行度特征和核密度估计的兴趣点推荐算法.首先从位置社交网络大量的签到数据中分别提取兴趣点流行度特征和时间连续性特征,然后提出基于连续时间槽的兴趣点流行度评估方法.在此基础上,采用二维高斯核密度估计设计一个兴趣点推荐算法PKDE,最后在三个大型真实社交网络的签到数据集上进行实验对比和分析.实验表明,与已有同类算法相比,本文提出的兴趣点推荐算法能够有效提高推荐精度和召回率.
  • 计算机软件与数据库研究
    梁梦夏,李海波
    2016, 37(11): 2421-2427.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协同任务系统目前已应用到更多领域,资源服务序列对提高资源服务选取和利用率至关重要,但多组织交互以及大规模业务数据使资源服务的时序分析更加困难.以典型的协同制造系统为背景,提出一种资源服务时序关系分析方法.以工作流实例为业务数据分析的最小单位,根据计算能力对业务数据分段,利用时序关系矩阵表示资源服务之间的时序关系,采用移动平均法对协同任务中的资源服务序列进行迭代分析,根据资源服务类别合并分析结果,采用带权有向图表示资源服务时序关系模型.最后通过仿真实验和案例分析,验证方法的有效性.
  • 计算机软件与数据库研究
    龙浩,汪浩
    2016, 37(11): 2428-2432.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    建立统一的独立社区和重叠社区挖掘结果评价标准,对于简化复杂网络社区挖掘、提高结果评估可比性有重要意义.目前的独立社区评价没有解决社区划分何时中止的问题,而重叠社区评价标准则往往具有较大的主观性.本文基于链接关联度和最优节点复制下的节点关联度,提出了一种支持独立和重叠社区挖掘、客观的统一评价模型,且基于该评价模型的社区挖掘方法可以进行多尺度的独立社区和重叠社区挖掘.理论分析和实际网络实验证实了该评价模型的合理性和可用性.
  • 计算机软件与数据库研究
    杨华,周琪云,汤青,杨志明
    2016, 37(11): 2433-2436.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了解决传统商品推荐方法仅考虑商品两两相似性或只通过商品属性的简单集成构建推荐网络图,对网络对象复杂性和依赖关系考虑不够导致推荐准确性低的问题,提出一种改进的商品推荐算法.算法通过商品、品牌、店铺及关联关系构建混合图,根据节点关系、节点出度、商户广告付费和商品点击数构建数学模型,得到商品、品牌和店铺间的转移概率,建立节点初始概率转移矩阵.通过重启动随机游走算法确定最终节点概率转移矩阵,实现商品推荐.实验结果表明,与当下常用推荐算法相比,该算法提高了商品推荐的准确率(Precision);算法扩展性强,适用于各种电商平台.
  • 计算机软件与数据库研究
    王宏欣1,张跃2
    2016, 37(11): 2437-2442.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    考虑云环境下带截止期约束的多模态工作流调度,建立最小化资源总租赁成本的调度优化数学模型,提出迭代复合局部搜索元启发式算法.分别考虑最优模态选择、资源成本增加、降低资源公平成本、增加资源公平成本等方法,提出相应的初始解生成算法;构造插入邻域和交换邻域的迭代局部搜索算法;通过一定概率的插入和交换操作实现扰动当前解,增加群体多样性;在多次扰动产生的解集中根据某一接受标准选择一个解,作为下轮迭代的起点.采用多因素方法分析试验结果,选择算法性能最优的参数组合;将提出算法与已有算法进行比较,结果验证了所提出算法的有效性.
  • 计算机软件与数据库研究
    杜红乐1,滕少华2,张燕1
    2016, 37(11): 2443-2447.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在直推式支持向量机中,迭代过程中样本标注错误会导致错误传递,影响下一次迭代中样本标注准确度,使得错误不断的被积累,造成最终分类超平面的偏移,另外在传统单个分类器下,提高样本标注准确度与提高算法训练速度之间是矛盾的,无法得到兼顾.针对此,本文把投票机制和协同思想引入到直推式支持向量机中,提出一种协同标注的直推式支持向量机算法,利用多个分类器的投票结果对样本进行标注,提高样本标注的准确度,利用多个分类器进行协同训练提高算法的训练速度.最后实验结果表明,所提出算法能够利用投票机制和协同思想提高最终分类器的分类精度和算法的训练速度.
  • 计算机软件与数据库研究
    陈晓(1,2,3),郭景峰(2,3),刘凤春1
    2016, 37(11): 2448-2453.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    符号网络中宏观网络结构(拓扑结构属性和符号属性)和微观博弈对联盟(社区)的形成具有相互影响,是符号网络博弈模型的新特征.基于以上思想,提出一种新的符号网络层次聚类算法HCSVSN(Hierarchical Clustering Based on the Shapley Value in Signed Network).首先,基于结点的符号属性和结点度,提出改进Shapely值的计算方法,可以避免忽略外部环境(网络结构)对Shapley值的影响,并可以降低Shapley值计算的复杂性;其次,基于网络密度对联盟形成的影响,提出联盟收益均值的计算方法,并给出符号网络联盟博弈模型;然后,基于联盟平均收益最大化实现符号网络的社区发现;最后,通过实验验证算法的准确性和有效性.
  • 计算机软件与数据库研究
    易顺明1,易昊2,周国栋3
    2016, 37(11): 2454-2458.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    面向公共媒体内容开展情感分析是分析公众情感的一项基础工作.经典的基于词频特征向量的特征提取方法,主要利用词频作为文本分类的依据,而词频与情感信息之间的关系并不紧密.提出一种采用基于情感特征向量的Twitter推文情感分类方法.该方法首先通过对推文进行数据清洗、词形还原、词性标注和词汇向量化;其次,将单词匹配到情感词典中;最后,利用每个单词的正向情感、负向情感取值生成情感特征向量,通过MNB、SVM等机器学习方法训练模型,对推文的情感进行分类.实验结果表明采用情感特征向量的Twitter推文情感分类方法能够获得更佳的分类性能.
  • 计算机网络与信息安全
  • 计算机网络与信息安全
    丁利娜,王兴伟,李福亮,黄敏
    2016, 37(11): 2459-2463.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    互联网的规模日益扩大,作为域间路由协议标准的BGP协议,其性能面临着前所未有的考验.而路由更新(UPDATE)报文仍采用串行化的方式来处理,处理速度慢,极大地影响了BGP协议的性能.为此,提出一种UPDATE报文的并行化处理方法来解决这个问题.该方法采用流水线技术和多线程技术,能够提高UPDATE报文的处理速度.为了进一步提高该方法的效率,我们在UPDATE报文的并行化处理过程中引入了垃圾回收机制和多线程动态调节策略.最后,我们在Quagga原型系统上对该并行化处理方法进行了仿真实现,并与Quagga中原始的BGPD模块的测试结果进行了对比分析,实验结果表明,本文设计的UPDATE报文的并行化处理方法是可行且有效的.
  • 计算机网络与信息安全
    崔建群(1),熊涛(1),王博伦(1),吴黎兵(2)
    2016, 37(11): 2464-2468.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    NICE协议不能聚合相距较近节点,并且频繁分簇会进一步加剧这种情况,成为影响NICE协议性能的主要问题之一.提出一种具有拓扑感知的分域聚簇模型TPCM(Topology-Aware Partition Clustering Model),并根据此模型提出一种拓扑感知的分域聚簇的NICE协议改进算法.该模型能够将物理位置较近的节点聚簇在一起,成为域内节点,分簇时仅将域外节点进行分簇,从而实现数据包的就近传输;由于减少了参与分簇节点的总数量,因此也大大降低NICE协议的分簇次数,减少开销.试验结果表明,该模型可以大大降低NICE协议的分簇次数,有效降低组播树的传输时延,改善了协议的性能.
  • 计算机网络与信息安全
    崔建群(1),夏振厂(1),陈爱玲(1),吴黎兵(2)
    2016, 37(11): 2469-2472.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对移动环境下应用层组播如何快速构建稳定的组播树,以及组播树中非叶子节点失效导致链路数据的传输中断影响组播树的完整性问题,提出一种基于节点性能和在线时间的应用层组播树构建算法HSHN(High Stability based on Heterogeneous Nodes)和备份关键父节点的组播树恢复方法.首先建立模型,构建基于异构节点的高稳定性组播树,提出组播树恢复方法,然后分析模型,论证方法,保证组播树有比较高的稳定性.仿真结果表明,提出的高稳定性HSHN算法能够快速的构建组播树,具有较低的节点加入时延,而且能够快速恢复组播树.
  • 计算机网络与信息安全
    许岗1,金海和(1,2),刘靖1
    2016, 37(11): 2473-2477.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    机会网络的节点相遇形成了社会关系.现有的机会网络社团划分都是以确定的社会关系为输入.然而,由于节点之间的社会关系由相遇和通信共同决定,这使节点间的社会关系存在不确定性.为了研究机会网络社会关系及其社团,建立了机会网络的不确定社会关系模型,并基于该社会关系模型进行社团划分.首先,根据节点相遇、通信记录,构建机会网络的不确定社会关系模型;其次,提出了社团概率密度,并根据社团概率密度提出了改进的K派系过滤算法,该算法能够对不确定的社会关系进行社团划分.实验结果表明,基于社团概率密度的K派系过滤算法能够得到较好的社团划分结果.
  • 计算机网络与信息安全
    洪伟1,郭昆(1,2),郭文忠(1,2)
    2016, 37(11): 2478-2482.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数据融合是无线传感器网络中减少节点能量消耗的一个基本方法.在基于预测的时域数据融合中,通过对传感器节点采集的时间序列数据进行分析,建立能够反映时间序列中所包含的动态依存关系的数学模型,从而减少节点间冗余数据的传输.本文引入流行学习中局部线性重构的思想,结合改进的极限学习机(Extreme Learning Machine),提出KNN-PSOELM数据预测模型.首先运用K近邻的方法对输入样本点进行局部线性重构,然后采用粒子群优化算法(Particle Swarm Optimization)改进极限学习机回归方法产生最优的初始参数.优化之后的模型不仅使得原始非线性传感器数据具有线性的特征,而且避免由异常数据样本引起的病态隐层输出矩阵,提高了模型的预测精度和泛化能力.实验结果表明了算法的有效性.
  • 计算机网络与信息安全
    孙兴斌(1,2),芮赟(2)
    2016, 37(11): 2483-2487.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在对多类不均衡的网络流量进行分类时,基于机器学习的分类模型倾向于多数类,导致少数类召回率较低.针对该问题,提出一种基于统计频率的特征选择方法.该方法首先根据样本的统计频率计算出度量每个特征区分能力的特征选择系数,然后根据特征选择系数构建特征选择矩阵,最后为每个类选择与之相关性较强的特征.在实验阶段,使用该方法选择的特征对多类不均衡的网络流量进行分类获得了较高的整体准确率、少数类召回率和g-mean值,证明该方法可以减轻多类不均衡问题带来的不良影响.
  • 计算机网络与信息安全
    王昌平,蔡岳平
    2016, 37(11): 2488-2492.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    当前数据中心网络数据流量大小分布不均衡,传统等价多路径转发ECMP算法容易将多条大数据流转发至同一链路,导致链路瓶颈.提出面向CLOS结构数据中心网络的基于SDN的流量分类路由SCR(SDN-Based Classified Routing)机制.SCR利用OpenFlow机制周期性统计数据流来计算阈值,通过动态判定方法将数据流分为大流和小流.大流由SDN控制器通过自适应路由算法计算路径,小流由交换机通过流量无视路由算法计算路径.本文在VL2架构上建立合成流量模型对SCR进行性能分析与评价.仿真与分析结果表明,与ECMP相比,SCR在网络吞吐量、数据流丢弃率、分组端到端时延和平均队列长度等方面具有优势.
  • 计算机网络与信息安全
    廖小飞(1,2),李德敏(1,2),陈光(1,2),陈雯(1,2),陈建军1,盛佐1
    2016, 37(11): 2493-2497.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    作为IP组播的替代,应用层组播具有简单灵活的优势,获得了广泛应用,但时延较大的缺点对性能影响较大.针对大规模应用层组播时延较大的问题,提出一种层次化的树树组播模型来降低应用层组播时延,该模型利用两层结构来组织和管理应用层组播组成员,并考虑节点性能和节点间时延来构建较低时延的组播树.当节点加入或退出组播组时,设计合适的组播树维护算法使得组播树的时延变化较小,满足低时延要求.计算机仿真表明该树树组播模型能够有效降低应用层组播的时延,改善大规模应用层组播性能,适合应用在大规模实时多媒体环境中.
  • 计算机网络与信息安全
    吏济新,张雅云,黄福川,程红举
    2016, 37(11): 2498-2503.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无线传感器节点持续感知的数据具有高度的时间关联性,所产生的冗余数据会给传感器节点带来不必要的数据传输和能量消耗.数据预测算法通过预测节点的感知数据序列可以有效避免上述问题.提出一种基于马尔科夫链的数据预测算法(MC-DP),该算法首先对传感器节点感知的数据进行弱化处理来提高数据序列的光滑性,然后采用离散灰色预测模型对节点需要向sink传输的数据序列进行预测,当节点预测的数据精度不够时,进一步使用基于马尔科夫链的数据修正过程来对其进行改进.实验结果表明,MC-DP算法预测准确率更高,预测序列的数据误差率更低,使用该预测算法使得传感器节点可以节约更多能量.
  • 计算机网络与信息安全
    黄灿,杨鹏,顾梁
    2016, 37(11): 2504-2508.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    播存网络利用物理广播的辐射分发能力分担互联网共享型内容流量,然而传统的协同过滤推荐算法不能完全适用这一应用环境,存在着诸如数据可靠性、数据稀疏、用户冷启动等局限.本文考虑现实生活中信任关系在播存网络推荐场景下的作用,引入了信任和信任度的概念,并综合用户间信任关系和相似关系对推荐结果的共同影响,提出针对播存网络的一种融合信任机制的协同过滤推荐算法.最后通过实验验证了改进算法的推荐效果优于传统算法,并且能够在一定程度上缓解传统协同过滤推荐算法在播存网络应用中遇到的困难.
  • 计算机网络与信息安全
    李陶深(1,2),唐丽萍1,葛志辉(1,2)
    2016, 37(11): 2509-2513.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对于流媒体数据业务,用户会更多的考虑其体验质量(QoE).由于LTE网络的利用率较低,在长流传输过程中带宽通常得不到充分利用,造成数据下载时间延长,并可能伴随有网络延时、抖动、数据重传的问题.这种不利因素不仅有损QoE,也造成设备不必要的能耗.针对用户QoE的分析,提出一个基于多层框架的QoE分析模型(M-QoE),它由应用层的QoS机制、网络层的QoE机制和主观QoE机制组成,从多个层面量化分析QoE的影响因素.基于M-QoE模型,提出一种基于QoE的LET传输节能方法,该方法综合考虑了QoE和能效的问题,根据用户行为习惯和感知体验来断定是否终止当前的请求链接,以此增加设备的休眠时间,降低设备的耗能.实验结果表明,E2-QoE方法具有明显的节能效果.
  • 计算机网络与信息安全
    毛科技,方凯,戴国勇,徐慧,陈庆章
    2016, 37(11): 2514-2519.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    室内环境的复杂性导致了高精度的室内定位非常困难.针对这个问题,将无线传感器网络(WSN)技术应用到室内定位中.通过分析传统的基于RSSI测距定位方法和指纹定位方法,设计一种基于RSSI的非测距定位方法.该方法使用Kriging插值算法建立定位区域的RSSI向量指纹,通过基于组合的向量相似度匹配方法匹配目标RSSI向量与RSSI向量指纹能有效消除障碍物对定位的影响,并获得目标节点的位置范围.最后通过K-means聚类算法提取目标节点的实际位置.实验结果表明该方法的定位精度较高,适用于室内定位.
  • 计算机网络与信息安全
    程小刚1,郭韧2,陈永红(1)
    2016, 37(11): 2520-2526.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    由于同时具有匿名与可追踪的良好特性,群签名有着广泛的应用,是具有中心地位的密码系统;要把群签名应用于实际中,一个非常重要的问题是如何撤销群成员的签名权利,比如出现某成员密钥丢失、被盗或退出组织等情况;综述了群签名成员撤销的基于安全性质和基于理想功能体的安全模型定义、实现群签名成员撤销的主要模型与方法及各自的代表性具体方案,对各种可撤销群签名方案的效率及其所基于的数学假设进行了比较,也综述了其它的更为灵活的成员签名权利及签名撤销方式,并提出群签名成员撤销值得进一步研究的方向.
  • 计算机网络与信息安全
    葛雨玮(1,2,3),康绯(1,2),彭小详(1,2)
    2016, 37(11): 2527-2531.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,随着APT事件的不断曝光,恶意代码的追踪溯源逐渐成为了研究热点.在恶意代码攻击越来越有组织性和目的性的新形势下,定义恶意代码同源性的概念,对现有的恶意代码同源性分析中的特征提取技术进行了分析和总结,根据恶意代码同源性分析的特点,选取了恶意代码多个层次上的关键特征,提出一个基于动态BP神经网络的恶意代码同源性方法.该方法利用动态和静态相结合的方法,提取恶意代码的关键特征并比较不同的样本间这些特征的相似性,以此为输入利用动态BP神经网络算法得到同源性分析结果.实验结果表明,经过实际样本集的训练,该方法能够有效地判别恶意代码之间的同源性.
  • 计算机网络与信息安全
    李春伟,于洪涛,高超,卜佑军
    2016, 37(11): 2532-2356.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对可变形部件模型中特征金字塔需要精细计算,从而导致计算速度较慢这一问题,提出一种结合快速特征金字塔的可变形部件模型对象检测算法.首先在特征金字塔中根据间隔选取若干个基准尺度进行精确计算,然后依据多尺度特征中的幂指定律,近似计算得到多分辨率的图像特征.算法采用尺度上稀疏采样的特征金字塔来外推精细采样的特征金字塔,然后采用预先训练好的模板进行类别检测,得出检测结果.在PASCAL VOC2007以及INRIA数据集上的实验结果表明,该算法可以明显加速模型中特征计算的速度,而检测精度仅略有下降.
  • 计算机网络与信息安全
    苏杰波,张小萍,李道丰,赵搏文,周凯
    2016, 37(11): 2537-2541.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归树),该算法利用同态加密特性对CART算法做了相应的改善,使之在保持CART原有准确率和相对较好执行效率的情况下能分类加密云数据,避免了在半诚实模型下的分类过程中真实数据的泄露.经过安全分析和实验测试表明,PPCART可显著提高传统CART算法的安全性,且具有接近于它的执行时间.
  • 人工智能与算法研究
  • 人工智能与算法研究
    程磊生(1,2),吴志健(1,2),彭虎(1,2),吴双可2,邓长寿3,王则林(1,2)
    2016, 37(11): 2542-2546.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在演化计算领域,粒子群优化算法具有易实现、收敛快、调参少等优点.但是随着问题规模的增大,粒子群优化算法易陷入求解精度不高、耗时过长的窘态,因此本文提出一种基于弹性分布式数据集(Resilient Distributed Datasets,RDD)的分布式粒子群优化算法.该算法采用岛模型将种群分解为若干个岛屿,即子种群,然后使用RDD并行数据结构将整个种群并行化,使得每个岛屿对应RDD中的一个分区,借助RDD的分区并行,实现了粒子群优化算法在分布式平台上的并行.最后,对包括单峰函数和多峰函数在内的11个标准测试函数,将该算法与多种改进的PSO算法进行了比较实验与分析,结果表明该算法求解精度高且加速效果明显.
  • 人工智能与算法研究
    华逸群,曹健
    2016, 37(11): 2547-2551.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    网络使得机票预订更加便捷,机票价格预测可以帮助旅客、代理商合理的选择购买时间、了解市场.然而各航空公司定价机制复杂,机票实时价格受多方面因素影响不断变化,具有趋势性、随机性和波动性的特点,历史价格与预测值间很难用精确的关系表示.文中将模糊时间序列引入机票价格预测问题中,利用36条航线的最低价格数据(201410—20154)进行预测,并用绝对平均误差对实验结果进行评估.将预测结果与传统的时间序列AR模型、移动平均和指数平滑比较,结果表明模糊时间序列模型可以提高预测的准确率,不同航线的预测误差结果浮动较小,且在价格波动较大时准确率有明显提升,并提供较可靠的购票决策支持.
  • 人工智能与算法研究
    张以文,吴金涛,郭星,赵姝
    2016, 37(11): 2552-2557.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    提出一种改进的基于动态Skyline和多种群遗传粒子群优化的云服务组合优化方法,旨在解决动态、不确定环境下大规模云服务组合优化问题.对云服务组合和服务质量(QoS)形式化描述,提出一种云服务组合优化模型;对Skyline操作进行建模的基础上,设计Skyline云服务动态更新算法,以满足云服务因临时加入、退出及QoS变化而引起的动态性和不确定性需求;最后,设计一种新的云服务组合优化算法,算法采用动态Skyline操作和用户约束降低问题求解空间,并基于种群相似性和遗传操作进行防早熟收敛处理.通过真实数据集和随机数据集的大量仿真实验,结果验证了本文算法的可行性和有效性.
  • 人工智能与算法研究
    张超1,胡斌(1,2),郑炜豪2
    2016, 37(11): 2558-2561.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    轻度认知障碍是介于老年痴呆与正常衰老之间的中间状态,是老年痴呆的高危人群,研究该病的分类,有助于提前预防病情和延缓痴呆.经研究发现轻度认知障碍和正常人间脑皮层是存在差异的.本文采用多任务学习选择特征,共享任务间的相关性,对脑皮层形态学的三种指标:脑皮层厚度、灰质体积、皮层复杂度看成三个任务,选择特征时任务之间存在一定的联系,与F-score、mRMR两种特征选择方法进行对比.并结合极限学习机和支持向量机分类方法,探究特征选择方法与哪种分类器结合最优.实验证明,多任务学习方法比另外两种特征选择方法效果好,并且和极限学习机分类方法的结合效果最优,在区分轻度认知障碍患者和正常老人上具有更高的准确率和较低的时间复杂度,为实现轻度认知障碍的自动诊断提供了理论依据.
  • 人工智能与算法研究
    罗剑江,王振友
    2016, 37(11): 2562-2566.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    受限玻尔兹曼机(RBMs)常常作为深度置信网络(DBN)的基本构成模块,通过训练几个RBM,DBN能够快速地被训练好以获得好的工作效果.为了获得更好的数据表示,受稀疏编码理论的启发,本文提出一种新的稀疏RBM,称为AtanRBM.与稀疏RBM(sparse RBM)不同的是,AtanRBM是添加一个arctan正则项(arctan函数逼近L(0)范数)直接地约束隐含单元的概率密度空间来达到隐含单元稀疏的效果,而不是约束隐含单元的平均激活概率期望达到相同的较低稀疏水平.在MNIST数据集的实验表明,AtanRBM比当前相关的模型可以学到更稀疏和更具辨别力的表示形式或表示方法,进而由AtanRBM预训练的深层网络能够获得更好的分类效果.
  • 人工智能与算法研究
    黄永青(1,2),杨善林1,梁昌勇1
    2016, 37(11): 2567-2570.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对交互式遗传算法因种群规模小、进化代数少和用户评价负担重而性能偏低的问题,将蚁群优化引入遗传操作过程,从而提出一种使用精英保留策略的交互式蚁群遗传算法.从人机交互和降低用户评价负担的角度设计了算法结构,即以ACO信息素矩阵作为构造解的依据,替代遗传算法中的选择算子,然后将蚂蚁构造的解进行交叉和变异操作之后交给用户评价,而用户只需确定当前代哪个解是迄今历史最优解即可,而不用评价每个个体的具体适应值,并以迄今历史最优解更新信息素.利用函数优化和汽车造型设计进行实验,结果表明该算法具有较高优化性能,并能有效降低用户疲劳.
  • 人工智能与算法研究
    滕少华,唐海涛,张巍,刘冬宁,梁路
    2016, 37(11): 2571-2576.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在深入分析南方某局域气象数据的基础上,提出构建多网络模型(概率神经网络PNN和径向基神经网络RBF混合模型)对局域地区降雨类型进行识别及雨量预测.首先构建PNN神经网络模型识别降雨类型;其次,针对大雨级别以下和大雨级别以上分别建立两个不同的RBF神经网络模型,实现对降雨量的进一步预测;最后将RBF网络预测的雨量结果逆向校正PNN网络的预测识别结果并获得降雨类型数据的雨量等级划分.本文均采用K折交叉验证方法检验模型的可靠性与稳定性.实验结果表明,模型有效提升了预测准确率及召回率,并在实际中取得较好的应用效果.
  • 其它
  • 其它
    张圣,郭武
    2016, 37(11): 2577-2581.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    本文提出采用通用语音属性的方法来进行自动语音识别的声学模型建模,并将其应用到说话人识别的全变量空间建模中.首先将发音方式和发音位置两种属性联合构成通用语音属性的基本单元用于声学建模,在此基础上采用深度学习算法建立语音识别的声学模型;用此声学模型来获得说话人识别的每帧声学特征对应的后验概率,将这个后验概率作为全变量空间分析的零阶统计量,在此基础上完成说话人识别中的i-vector建模及识别.在NIST 2012的说话人识别评测任务中,提出的算法能够取得与主流算法相当的识别水平.进一步,当我们把基于通用语音属性的DNN/i-vector系统与目前主流的系统进行得分域的融合,相对于最好的单系统,男声等错误率平均下降了121%,女声等错误率平均下降了144%.
  • 其它
    杨秋芬(1,2),桂卫华1,胡豁生1,余妹兰3
    2016, 37(11): 2582-2587.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对面部分类检测识别过程中,存在的纹理形状特征表征及分类识别算法精度不高的问题,提出一种基于局部二元Haar特征表示的Kadane优化多阈值AdaBoost面部分类识别算法.首先,利用图像局部二元模式对传统的Haar特征表达形式进行改进,提高图像模型的纹理形状特征表达能力;其次,针对单阈值弱学习算法不能充分利用局部二元Haar特征信息,造成分类精度较低的问题,提出基于Kadane优化的多阈值AdaBoost分类器,实现局部二元Haar特征表示下的面部高精度识别;最后,通过实验对比显示,所提算法的面部有效识别率可达90%以上,要优于选取的对比算法.
  • 其它
    苏振威,谢林柏
    2016, 37(11): 2588-2592.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对多区域采样目标跟踪方法容易出现的区域多样性丧失、跟踪精度下降和跟踪不稳定等问题,本文引入区域优化权值及改进子区域重采样方法,提出基于优化权值的多区域采样目标跟踪算法.该方法利用区域优化权值优化各个子区域的区域置信度适当增加低置信度区域在重采样阶段所分配到的粒子数量,在保证粒子根据区域置信度大小有效分配的前提下,抑制了区域多样性丧失现象发生.本文算法在子区域内引入粒子权重优化权值并设定重采样阈值,缓解粒子贫化充分利用有效粒子信息.实验结果表明,本文方法能有效提高目标跟踪精度,改善目标跟踪稳定性.