过刊目录

  • 2024年, 45卷, 第2期
    刊出日期:2024-03-01
      

  • 全选
    |
  • 胡菊香1,吕学强1,2,游新冬2,周建设1
    2024, 45(2): 257-264.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBSCAN的聚类结果进行加权计算并自动标注基金文本数据,辅以少量人工校对,为后续基金新闻分类提供数据支撑.多粒度特征融合的分类算法首先从词粒度出发构建停用词表、扩展词典;其次从句粒度出发抽取新闻摘要,捕捉更具有语义关联的文本信息;最后将多头注意力机制嵌入BERT模型,对关键特征赋予更高权重,以提高分类的准确性.本文从多个角度进行了充分地实验,该方法具有高效的处理能力和有效性,其分类精确率可达到95.21%,优于现有方法.
  • 程宇,周瑞,张子若,罗悦,张宏旺,王佳昊
    2024, 45(2): 265-270.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    无线通信和感知技术的发展促进了WiFi感知的产生与发展.依据人体及其行为对WiFi信号传播的影响,通过模式匹配可以实现基于WiFi的手势识别、活动识别、定位等感知任务.但是WiFi信号对环境具有较大依赖性,目标人员或周围环境的变化会导致已经建立的感知模型失效.为了解决这个问题,现有方案通常采用半监督或无监督域适应方法.但在实际应用中,无法预先获得新环境中的数据.因此,需要一种无需新环境数据,即可自动泛化到新环境的方法.为了实现这个目标,本文提出一种基于多模态样本生成和情景训练的环境无关手势识别方法.该方法采用若干源域的数据建立手势识别模型,能够在目标域没有任何数据的情况下,泛化到目标域中.实验结果表明,该方法在目标域无数据的情况下,对新用户和新环境的手势识别正确率均超过80%,高于业界现有水平.
  • 张冰雪,李文楷
    2024, 45(2): 271-277.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于脑电图的情绪识别在人机交互领域具有重要意义,多数研究使用大量通道的脑电设备信号,而针对消费级设备少量通道脑电信号的研究较少.本文针对现有脑电情绪识别模型特征提取复杂,使用通道数量多,需要长数据序列等缺点,提出一种针对少量通道脑电信号的端到端实时脑电情绪分类模型,使用5通道的脑电数据在较短的时间片上进行分类.模型使用一维卷积降低数据时间序列长度并提取特征,使用多头注意力机制的双向长短期记忆网络进一步提取高维特征,最后使用全连接层进行分类.结果表明本文提出的模型在少量通道脑电信号中能更好的提取脑电特征,提高了实时脑电情绪分类的准确率.
  • 郑超凡,陈羽中,徐俊杰
    2024, 45(2): 278-284.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    答案选择是问答领域的一个重要子任务,目标是根据问题从候选答案集合中选择最合适的答案.该任务的核心是问答语义匹配.近年来,随着深度神经网络和预训练语言模型的应用,许多端对端的问答匹配模型展现出优异的性能.但是,现有模型仍然存在语义信息提取不充分以及未有效利用外部知识信息等问题.针对上述问题,本文提出一种知识增强图卷积网络(A Knowledge-enhanced Graph Convolutional Network,KEGCN).首先,KEGCN提出一种基于图卷积神经网络的问题-答案结构信息提取机制,在利用BERT获得文本语义信息的基础上,KEGCN通过图卷积神经网络学习问答对之间的结构信息,增强语义信息.其次,KEGCN设计了一种基于自注意力门控网络的扩展知识语义构建机制,利用自注意力门控网络获取扩展知识实体之间的上下文语义关联并过滤知识噪声,增强模型的鲁棒性.最后,KEGCN利用多尺寸卷积神经网络提取多粒度的全局语义信息,以进一步提高答案选择推理的准确性.WikiQA和TrecQA数据集上的实验结果表明,与对比模型相比较,KEGCN的综合性能更加优异.
  • 李春英1,2,武毓琦1,汤志康1,林伟杰1,汤庸3
    2024, 45(2): 285-292.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对学习资源个性化推荐中存在的数据稀疏和冷启动问题,本文提出了一种基于知识图谱的学习者个性化学习资源推荐模型模型(LPRM).LPRM模型利用在线学习中学生与课程的历史交互信息以及在线课程的属性信息构建课程知识图谱,辅助课程资源的个性化推荐;针对RippleNet框架中实体关系传播未考虑实体影响力的问题,提出节点影响力计算模型衡量知识图谱中实体的影响力,构建LPRM模型框架得到学习者对学习资源的评分.大量对比实验结果表明,本文提出的基于知识图谱的学习者个性化学习资源推荐模型模在AUC和ACC评价指标上均表现出最优的性能,模型参数分析结果表明LPRM模型能有效地提升学习者学习资源个性化推荐性能,较好地缓解了数据稀疏和冷启动引起的学习者个性化资源推荐不准确等问题.
  • 董红伟1,李爱莲1,解韶峰2,崔桂梅1
    2024, 45(2): 293-300.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对标准蜜獾算法存在的易陷入局部最优值、目标精度低、局部搜索能力不足等问题,提出了一种多策略改进的蜜獾算法.在种群初始化阶段,使用Chebyshev混沌映射初始化种群,保证随机性的同时提高种群的均衡性;在局部挖掘阶段加入莱维飞行,使寻找最优值到确定最优值的过程更加平稳,避免算法陷入局部最优;在最优个体确定阶段上引入最优个体自适应变异策略,来提高算法局部搜索能力以及收敛精度,避免算法个体早熟.选取18个基准测试函数进行仿真,同时结合秩和检验、实际工程应用对该算法进行多维度评估,实验证明改进的蜜獾算法与标准蜜獾算法相比,在收敛速度、目标精度以及寻优搜索能力均有明显改善,表现出较好的鲁棒性.
  • 韩晓鸿1,赵梦凡1,2,张钰涛1,2
    2024, 45(2): 301-308.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社交媒体平台的开放性和包容性为人们提供了自由的表达方式,但也引发了新的社会问题,假新闻在社交平台层出不穷,会引起公众恐慌,侵害人们的精神健康,这使得假新闻检测尤为必要.现有的假新闻检测方法大多侧重于从文本内容、用户和传播模式中挖掘有效信息,但是这些方法没有充分利用文本内容的全局语义关系.为了有效融合新闻内容的全局语义信息和新闻传播的全局结构关系,本文提出一种基于元路径的推文-词-用户异质图卷积注意力框架HGCAN,根据元路径将构建的推文-词-用户异质图分解为两个子图,通过图卷积网络提取传播结构特征,利用注意力机制聚合邻居节点的信息并学习子图重要性,从而有效学习节点的特征表示.在两个公开数据集上的实验结果表明,相比于其他方法,本文方法在准确率和F1指标上都取得了较为先进的结果.
  • 苏璇,王远军
    2024, 45(2): 309-318.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于传统机器学习分类算法对影像组学的高维不平衡数据分类结果不理想的问题,本文提出一种改进海洋捕食者的不平衡特征选择算法.首先,对海洋捕食者算法MPA算法进行改进,引入精英反向矩阵增加算法迭代后期的种群多样性,引入新的CF参数改善算法的收敛速度与精度,同时合理分配原始参数分布和取值来满足算法在不同阶段的搜索需求;接着针对不平衡数据引入新的目标函数来帮助MPA算法收敛到更优的特征子集.最后,基于G-means的精英反向海洋捕食者算法GEMPA算法在14个基础测试函数上进行测试并在12个公开数据集上与MPA,基于K个最近邻相关性的在线特征选择算法K-OFSD以及其余的6种元启发式算法GA、PSO、CSO、SSA、SCA和MFO对比分析.以平均F-measure值,平均特征数量,平均运行时间为评估指标,通过实验可知GEMPA算法能够快速搜索到分类精度最高的特征子集,降低高维数据的冗余度,针对改善高维不平衡数据分类问题有很好的发展潜力.
  • 朱文龙1,2 ,陈羽中1,2,饶孟宇2
    2024, 45(2): 319-326.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着互联网技术和自媒体行业的快速发展,人们可以方便快捷地从社交媒体中获取最新信息,但也让更多的谣言在网络中盛行.现有谣言检测模型多从文本内容、用户信息和传播模式中挖掘有效特征.然而,现有模型未充分学习文本的语义信息和谣言传播过程中的结构信息,并忽略了谣言传播的动态过程.针对上述问题,本文提出一种基于动态异构图的谣言检测模型DHGNN(Dynamic Heterogeneous Graph Neural Network).首先,为了增强帖子的文本语义表示,本文提出一种多级注意力网络,引导模型关注源帖子和相应评论中关键的词和句子,充分学习源帖与相应评论之间的语义关联.其次,引入了基于异构图的图神经网络,通过对异构传播图中的用户、帖子节点和转发(或评论)关系进行建模,为不同类型的节点和边生成特定的表示,充分学习异构传播图中的结构信息.最后,提出一种基于旋转记忆单元的时序注意力,分别为每个异构传播图快照建立记忆,捕获谣言动态传播的演化模式.在Twitter15、Twitter16数据集上的实验结果表明,DHGNN模型的性能优于最新的对比模型.
  • 陶佳,黄贤英,高钰澜
    2024, 45(2): 327-334.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    推荐系统中将知识图谱作为辅助信息能有效缓解协同过滤算法中的稀疏性和冷启动问题.然而,现有的基于知识图谱的推荐模型往往忽略了视觉信息以及用户和物品历史交互序列中不同物品对当前任务的重要性.由此提出了一种融合视觉信息的协同知识注意力网络推荐模型(CKVI).该模型使用注意力机制动态地捕获用户和物品历史交互数据中蕴含的用户历史偏好信息.同时将知识图谱作为辅助信息,进一步丰富用户和物品的表示,增强模型的可解释性.其次考虑到与物品相关的图像,如电影海报中蕴涵着丰富的视觉信息,设计了一种图像聚合方法,聚合用户的历史行为图像,捕获用户的视觉偏好.最后将几种信息融合,用于推荐.为了验证模型有效性,在MovieLens和Book-crossing两个数据集上进行了实验,结果表明CKVI相比其他对比的模型推荐效果有较大提升.
  • 林潮伟1,2,林兵2,3,陈星1,2
    2024, 45(2): 335-343.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对不确定性云边协同环境下工作流应用调度问题,考虑服务器的负载压力、网络拥塞等计算环境因素造成计算性能和传输带宽的不稳定性,采用三角模糊数表示模糊云边协同环境中服务器的计算性能和传输带宽.对于泊松到达的多工作流应用,提出一种基于局部关键路径的多工作流应用调度策略,将局部关键路径作为调度单元进行统一调度,充分避免任务之间的数据传输,旨在满足多工作流应用截止日期约束的前提下,降低其模糊执行代价.仿真结果表明,与其他基准策略相比,在不同的截止时间约束下,该策略都能获得多工作流应用最优的可行调度方案,同时实现了模糊执行代价的有效优化.
  • 尹震宇2,3,尹聪1,2,3,张飞青1,2,3,徐光远1,2,3,徐福龙1,2,3
    2024, 45(2): 345-350.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    基于机器视觉的地标线检测一直以来都是车间自主巡检机器人研究的重点和难点问题之一.针对检测过程中易受车间地面积水、光照不均以及油渍粉尘污染等环境因素的影响从而导致误检率、漏检率较高,难以满足工程实际需求的问题,本文提出了一种基于自适应阈值分割与动态感兴趣区域划分的车间地标线检测方法(AT-DROI),该方法以分块图像为基础,首先按照特定特征对子块进行搜索,并剔除其中的离群噪声点,然后将环境因子与采样点相结合计算出特征颜色的双门限阈值,最后利用粗细粒度掩膜抑制特征图像中的干扰信息,有效实现了室内复杂环境下对地标线的高精度检测.通过在自采集的实际车间场景视频序列上进行大量对比实验,实验结果表明,本文方法在自采集的多组实际车间场景视频序列上测试的平均准确率、假阳性率和假阴性率分别达到了95.15%、3.73%和4.85%,平均每秒检测帧数为26fps,能够满足实际生产中对地标线检测的准确性和实时性要求.
  • 魏赟1,宗旭1,高丽萍1,2
    2024, 45(2): 351-358.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    二维电子表格是应用最为广泛的计算机应用程序之一,随着大数据和云计算的兴起,对二维电子表格的协同编辑需求也日益增长,而CRDT(无冲突复制数据类型)作为近年来被提出的一致性维护方法,基于它的二维电子表格协同编辑方法在以前的文献中很少被研究.本文提出了一种基于CRDT的同步方法,通过检测操作间的关系,调用相应的冲突消解函数,以实现表格协同文档的一致性维护.本文首先定义了4种操作关系:1)正交冲突关系、一维冲突关系、互斥关系和相容关系;2)提出了一种基于CRDT框架下的冲突消解方案来处理这4种操作关系;3)从理论上分析了本文所提出算法的时间复杂度和空间复杂度;4)通过理论证明和实例研究,验证了该算法的正确性,同时本文还开发了Web端的在线表格协同编辑系统Co-Table,进一步证实了算法的正确性.
  • 陈礼贤1,2 ,梁杰1,2,黄一帆1,2,陈哲毅1,2,于正欣3,陈星1,2
    2024, 45(2): 359-366.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了更好地支持边缘计算服务提供商进行资源的提前配置与合理分配,负载预测被认为是边缘计算中的一项重要的技术支撑.传统的负载预测方法在面对具有明显趋势或规律性的负载时能取得良好的预测效果,但是它们无法有效地对边缘环境中高度变化的负载取得精确的预测.此外,这些方法通常将预测模型拟合到独立的时间序列上,进而进行单点负载实值预测.但是在实际边缘计算场景中,得到未来负载变化的概率分布情况会比直接预测未来负载的实值更具应用价值.为了解决上述问题,本文提出了一种基于深度自回归循环神经网络的边缘负载预测方法(Edge Load Prediction with Deep Auto-regressive Recurrent networks,ELP-DAR).所提出的ELP-DAR方法利用边缘负载时序数据训练深度自回归循环神经网络,将LSTM集成至S2S框架中,进而直接预测下一时间点负载概率分布的所有参数.因此,ELP-DAR方法能够高效地提取边缘负载的重要表征,学习复杂的边缘负载模式进而实现对高度变化的边缘负载精确的概率分布预测.基于真实的边缘负载数据集,通过大量仿真实验对所提出ELP-DAR方法的有效性进行了验证与分析.实验结果表明,相比于其他基准方法,所提出的ELP-DAR方法可以取得更高的预测精度,并且在不同预测长度下均展现出了优越的性能表现.
  • 刘亚1,韩建功1,高丽萍1,2 ,曲博3
    2024, 45(2): 367-373.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线性文档更为复杂的并发操作环境和冲突消解场景.为了解决富文本文档中的并发操作环境与撤销操作冲突问题,本文提出了一种新颖的基于树型结构的地址空间转换方法,采用基于位置的节点寻址方案和节点属性值计数器策略,能更方便地支持撤销操作与更改操作.此外,本文还给出了树型结构地址空间的结果一致性的正确性证明及详细的案例分析,并开发了Web平台下实时协同富文本编辑原型系统AST-RichText,进一步验证了该方法的可行性.
  • 顾兆军1,侯晶雯1,2
    2024, 45(2): 374-380.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为了解决真实数据缺少类标签、日志解析错误影响模型性能的问题,设计了基于置信度的半监督异常检测模型SemiCAD.该模型首先基于原始日志数据进行特征提取;其次,通过基于分层密度的带噪声应用空间聚类(HDBSCAN)的正例无标记样本(PU)学习算法,对训练集中无标签的数据进行伪标签估计;最后,使用一致性预测中的统计量p值度量日志数据间的不一致性,选择多个合适的集成算法作为不一致性度量函数计算不一致得分进行协同检测,给出待测日志序列的标签及其标签置信度.在超级计算机(Blue Gene/L)和Hadoop分布式文件系统(HDFS)的日志数据上进行实验,结果表明,相比其他日志异常检测模型,该模型的召回率和F1值等均有所提升,证明该半监督模型在缺少标签的日志中可以有效检测异常.
  • 王金芳,郭渊博
    2024, 45(2): 381-387.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    物理信息系统包含类型多样的物理设备,现有的攻击图生成技术不适用于物理信息系统.传统的漏洞扫描技术难以检测到物理设备的漏洞,并且随着系统规模的增加,攻击图的计算会出现状态空间爆炸问题.为此,本文提出了一种面向物理信息系统的分布式攻击图生成算法.首先,针对物理设备漏洞识别较难的问题,提出了一种基于属性标记实体的方法扩展实体漏洞信息,并据此对物理信息系统进行攻击建模;其次,针对状态空间爆炸问题,提出了一种分布式攻击图生成算法,并且利用消息传递机制消除图部分的重复遍历,进一步提高了生成效率.实验结果表明,与其他相关技术相比,本文技术具有更高的生成效率.
  • 刘贺,张文波
    2024, 45(2): 388-395.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随着物联网技术的广泛应用,针对物联网设备计算和存储能力受限的特性,设计一种高精度、轻量化的恶意流量识别方法,对于保障物联网设备的安全具有重要意义.本文提出一种基于会话中数据包的灰度图片转换方法(Packets in a Session to Grayscale Image,PS2GI)用来生成以原始流量数据构建的灰度图片,同时提出一种基于简化混合VisionTransformer(Simplified Hybrid Vision Transformer,SHViT)深度学习模型中的注意力机制的方式用来实现高精度、轻量化的恶意流量识别方法.实验结果表明,使用SHViT模型在IoT-23数据集上对比ViT模型在多分类情况的准确率降低0.17%,达到99.70%,模型的推理时间增加33.8%,达到6.37ms,但是模型的参数量降低68.1%,达到3.06M,同时模型的计算量降低41.7%.
  • 冯锦丹1,孙宏宇1,姚迪2,张涵嘉1,仇晓黎3,刘金山1,盛超1
    2024, 45(2): 396-404.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对物联网技术在智能制造系统中的应用,通过在卫星结构研制设计过程中应用物联网标识和感知技术实现智能化生产管控.分析卫星结构研制流程中实物、信息的操作现状,提出了一种SIMR(Snapshot Integration Multipath Routing)路由算法的卫星研制流程自主感知优化技术,保证流量传输均衡和信息快速回传,解决卫星研制实物流与信息流难以深度融合的问题.围绕卫星零件、装配体、电子标签等实物定义了智能化生产管控系统,将系统分解为实物操作序列与数据操作序列,进而给出了基于物联网的卫星结构智能化生产管控系统架构,明确了本方法在卫星结构板成形生产和装配系统管控环节的应用模式,为提升卫星结构实物状态管控与全流程研制能力提供了一种可行的方法.
  • 熊兵1,2 ,张俊杰1,2,黄思进1,2,陈哲毅1,2,于正欣3,陈星1,2
    2024, 45(2): 405-412.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    移动边缘计算(Mobile Edge Computing,MEC)将计算与存储资源部署到网络边缘,用户可将移动设备上的任务卸载到附近的边缘服务器,得到一种低延迟、高可靠的服务体验.然而,由于动态的系统状态和多变的用户需求,MEC环境下的计算卸载与资源分配面临着巨大的挑战.现有解决方案通常依赖于系统先验知识,无法适应多约束条件下动态的MEC环境,导致了过度的时延与能耗.为解决上述重要挑战,本文提出了一种新型的基于深度强化学习的计算卸载与资源分配联合优化方法(Joint computation Offloading and resource Allocation with deep Reinforcement Learning,JOA-RL).针对多用户时序任务,JOA-RL方法能够根据计算资源与网络状况,生成合适的计算卸载与资源分配方案,提高执行任务成功率并降低执行任务的时延与能耗.同时,JOA-RL方法融入了任务优先级预处理机制,能够根据任务数据量与移动设备性能为任务分配优先级.大量仿真实验验证了JOA-RL方法的可行性和有效性.与其他基准方法相比,JOA-RL方法在任务最大容忍时延与设备电量约束下能够在时延与能耗之间取得更好的平衡,且展现出了更高的任务执行成功率.
  • 张海全,王小宇
    2024, 45(2): 413-417.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    以保障电力系统主机操作网络安全运行为目的,构建基于电力信息病毒查杀的电网主机操作安全性保护平台.该平台利用站内联网交换机和防火墙连接保护子站和操作子站内若干电网主机后,连接电网主机操作单元,用户通过该单元执行数据下载、数据分析、Zookeeper服务等电网主机操作,同时使用集成第三方软件的病毒查杀单元内Mcafee、Avira和Kav杀毒软件,查杀用户执行电网主机操作过程中软件内存在的病毒.以支持向量机算法作为基础,建立电网主机操作安全等级审计模型,然后电网主机操作单元认证电网主机操作软件,并对电网主机操作安全等级进行审计后,执行相关电网主机操作,同时连接外网防火墙,并利用Web发布服务、物联网APN专线以及电信专用服务器等,将电网主机操作结果呈现在移动终端APP上,完成电网主机操作安全性保护过程.
  • 刘治国1,董效奇1,汪林2,夏清雨1,潘成胜1,3
    2024, 45(2): 418-424.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    卫星边缘计算服务已经成为网络的重要组成部分,特别在地面网络稀疏环境下,可显著的提高用户的服务质量.但卫星网络的资源有限性为边缘计算任务的部署带来了巨大困难.因此,本文针对部署位置和计算资源分配不合理而导致任务处理时延过长、卫星能耗过大的问题,在SDN(Software Defined Network)的卫星-地面联合部署网络架构(SDN-Space-Ground Integrated Network,SSGIN)的系统模型下.提出了ET-DQN(Experience Tournament-DQN)的任务部署算法,该算法通过引入经验竞选机制提高经验池利用率和网络训练的效率,解决了经验池利用率低,而造成的网络过估计、难收敛的问题.仿真结果表明,该方法能够有效降低任务的响应时延以及能耗,很好地改善了传统DQN算法收敛速度慢和样本的利用率低下的问题.
  • 郎思祺,陈纯毅,申忠业,胡小娟,于海洋
    2024, 45(2): 425-430.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    蒙特卡罗路径追踪渲染算法结果图像往往受噪声影响,现有去噪算法效率较低且容易丢失图像细节.因此,本文提出一种视觉驱动梯度域滤波重构的自适应渲染算法.首先在预渲染阶段获取特征图像同时通过引导滤波器对特征图像进行预滤波;然后通过图像视觉显著性划分区域进行滤波重构,在显著区域利用融合图像梯度信息的双边滤波器进行平滑去噪,非显著区域利用均值滤波器进行快速去噪;最后利用SURE(Stein′s Unbiased Risk Estimator)计算像素颜色估计量的均方误差引导自适应采样.实验结果表明,与同类算法相比,本文算法可以在更短时间内渲染出具有更优质视觉效果的图像,本文算法的结构相似性(SSIM)和峰值信噪比(PSNR)均有显著提高,运行时间平均降低8.6%以上.
  • 王嘉豪1,徐敏1,孙众1,周修庄2
    2024, 45(2): 431-437.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在线课堂学习参与度自动评估是提升课堂教学效果的重要技术途径.本文使用计算机视觉特征分析技术,提出一种在线课堂学习参与度自动识别方法.首先,采用VGGFace网络和C3D网络分别对学习者的面部表情和身体姿态进行特征编码;然后,设计基于注意力机制的双层级联聚合模块,对视频片段的特征进行融合,使得参与度高度相关的帧序列获得更大的权重.由于低参与度样本的数量和高参与度样本相比非常少,课堂参与度自动识别属于类别不平衡的数据分类问题.类别高度不均衡,导致模型训练存在很大挑战.为了缓解参与度数据分布不平衡带来的影响,本文提出采用双边分支网络作为参与度识别基本的网络结构.其中,传统学习分支进行表征学习,重新平衡分支关注少数样本分类,将特征学习和分类器学习进行分别建模.在DAiSEE数据集上的实验结果表明,提出的方法有效提升了参与度自动识别性能,尤其对少数类样本的分类具有明显的性能提升.
  • 汪明明1,陈庆奎1,2,付直兵1
    2024, 45(2): 438-445.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    3D感知是自动驾驶场景的核心问题,传感器融合可以综合利用激光雷达和摄像机的优点以达到更高的3D目标检测准确率.传感器融合涉及点云到图像对准问题,预先对传感器标定可以得到点到图像位置的投影关系,然而这种对准方式受传感器相对位置偏移与采集时间偏移影响而在干扰下对模型产生负面影响.针对该问题,本文把场景中实体在各个传感器下的不同表达作为不同对象,以对象为节点建立包含两类节点与三类边的异构图描述该场景,并提出了基于该异构图的3D目标检测优化模型HetGNN-3D.该模型通过图结构捕获对象间潜在联系并找到点云对象节点与图像对象节点间对应关系,从而减弱干扰带来的影响.HetGNN-3D包含图初始化、消息传递、图读出三大模块.图初始化模块使用基于点云的3D目标检测模型的输出和基于图像的2D目标检测模型的输出建立对象级异构图.消息传递模块针对异构图特性分类聚合与更新消息.图读出包含用于对象关系预测的边读出与属于同一实体的对象子图读出,然后基于对象子图得到3D目标检测结果.在nuScenes数据集的实验表明,HetGNN-3D有效融合点云信息与图像信息优化了3D目标检测结果,此外,基于对象级异构图的边关系预测使融合过程与预先标定得到的传感器映射矩阵解耦合,从而提升了融合模型的容错性与鲁棒性.
  • 郭佳乐,胡天生,史士杰,陈恩庆
    2024, 45(2): 446-452.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    人体动作识别是计算机视觉领域的重要研究方向之一,越来越多地应用在视频监控、自动驾驶等场景.目前大多数双流方法采用卷积神经网络分别提取动作的时空特征,而卷积网络仅关注于动作的局部空间特征,缺乏动作的长距离依赖关系,且卷积造成的特征损失及视频背景噪声的影响不利于动作特征的提取.同时,注意力机制愈加广泛地应用在各类视觉任务中,并达到了较高的性能.针对以上问题,本文提出一种基于注意力机制的TS-PVAN双流动作识别模型,该模型以TSN双流网络框架作为基线,为空间流设计一种P-VAN网络处理RGB帧以提取视频动作的空间特征.该模型提高了空间网络提取动作特征的能力,以及双流时空特征信息的融合效果.通过在HMDB51和UCF101两个数据集上的实验对比分析,验证了所提方法的有效性.
  • 熊冰冰1,温文媖1,方玉明1,张玉书2
    2024, 45(2): 453-460.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为实现云存储中图像数据低成本采样和安全传输,本文提出一种基于压缩感知和生命游戏的图像数据保护算法.该算法利用生命游戏规则产生的置乱矩阵,置乱明文图像的稀疏矩阵,增强元素的随机性,使得矩阵有较好的置乱效果.结合半张量积和压缩感知技术对置乱后的矩阵进行加密和压缩,极大地节省图像数据在采样和传输过程中的存储空间.将压缩图像数据量化到0~255之间,提升图像数据的安全性.利用混沌系统产生的混沌序列实现压缩图像的扩散,增大图像信息熵.由于高维混沌系统产生混沌序列,该方案具有密钥敏感度高的优点.经实验分析,所提出的图像加密算法可以应用于云存储,且具有较高的安全性与传输效率.
  • 闫忠心,白琳,李陶深
    2024, 45(2): 461-469.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为追求更准确的关键点检测结果,现有许多有关人体姿态估计研究多采用复杂的深度网络架构构建模型,忽略了模型的实际部署成本,导致模型在资源受限的边缘设备上很难实际部署,缺乏实用性.为了解决上述问题,本文设计了一种融合自我知识蒸馏和卷积压缩的轻量化人体姿态估计模型.该模型首先使用改进的EfficientNet网络构建一个编码器,提取图像的多尺度特征;其次,基于深度可分离转置卷积,设计一种轻量化上采样解码器,估计人体姿态;最后,采用轻量化多尺度双向融合与知识自我蒸馏方法,进一步提高人体姿态估计的准确性.在COCO和MPII标准数据集上进行了广泛的定性、定量和消融实验,实验结果表明所提出的模型不仅能获得准确的人体姿态估计,而且能显著降低模型的计算复杂性.
  • 张浩萌,刘斌
    2024, 45(2): 470-476.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    视频描述是一项同时涉及到计算机视觉和自然语言处理两个领域的跨模态任务,其目的是为视频自动生成一段描述,所生成的内容不仅要准确完整地描述视频的主要内容,而且要符合基本的语法结构.针对现有的视频描述方法在生成过程的可解释性和生成内容的准确性等方面尚存在一些不足之处,本文提出一种基于编解码框架的融合语义信息和视觉推理特征的视频描述方法,该方法在解码阶段进行适当的改进,提出3种特征融合网络,分别为特征参与的融合网络、特征引导的融合网络以及结合权重的融合网络,将视频对应的语义特征与视觉推理特征进行融合,从而生成兼具可解释性和准确性的描述.在MSVD和MSRVTT两个数据集上进行消融和对比实验的结果表明:与基模型相比,本文所提方法的CIDEr指标分别增长了21.6%和3.5%;与其他方法的比较结果表明,本文提出的方法在各个指标上具有一定的竞争力.
  • 安芷楠,魏赟
    2024, 45(2): 477-482.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对图像增强处理中亮度偏低、细节模糊、色彩失真等问题,提出了一种基于Gabor滤波的多尺度Retinex与自适应补偿的灰度世界理论结合的图像增强算法.通过双伽马函数预处理图像暗区对比度并抑制亮区过增强;考虑Gabor滤波良好的方向选择性和纹理细节敏感度,将其作为多尺度Retinex算法的中心环绕函数在双曲正切域上进行卷积来突出细节,并添加增益偏移算子动态地调整反射分量的亮度;最后使用自适应补偿的灰度世界算法进行色彩保持和校正,得到最终的输出图像.实验结果表明该算法在结构相似性、标准差和平均梯度上比对比算法的平均值分别高出47%、38%和50.3%,处理后的图像在提高亮度、突出细节的同时保持了较高的色彩度.
  • 曹春萍,俞璎时
    2024, 45(2): 483-489.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    功能脑网络的构建工作是阿尔茨海默病辅助诊断中的基础任务.针对基于全频域的单层网络构建方法难以处理小频段间的异质性特征以及脑网络中可能存在错误边或缺失边的问题,提出一种基于多层网络链路预测的功能脑网络模型.利用多层网络框架使节点间存在多个频段描述下的连接关系,并设计融合层间相似性和节点重要性的局部相似性指标,进而基于多层网络拓扑结构进行链路预测,以重构网络结构.实验结果表明,与当前先进的脑网络模型相比,该模型在阿尔茨海默病分类诊断中性能表现更好,证明所提模型能有效提升网络表达的精准性,且在计算机辅助诊断中具有良好的应用价值.
  • 边奕心,李禹齐,张子恒,赵松,尹启天,李文渊
    2024, 45(2): 490-497.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    缓慢循环是一种Android特有代码异味,对Android应用程序的可维护性产生负面影响.针对传统基于静态程序分析方法误检率较高的问题,本文提出基于深度学习的检测方法.首先,使用代码文本信息作为模型输入的特征集.然后,使用两种深度学习模型进行异味检测.此外,为了快速、准确获得模型所需的大量样本数据,提出了一种基于开源Android项目构造正负样本的方法并实现工具ASSD.最后,使用开源Android数据集对提出的方法进行实验验证.实验结果表明,本文方法优于现有基于程序静态分析的检测方法,其中检测效果最好的是CNN模型,其F1值平均提高了28.7%.此外,本文方法优于基于机器学习的检测方法,相对于检测效果最好的随机森林模型,CNN模型的F1值平均提高了9.43%.
  • 张钦,郑尚,邹海涛,于化龙,高尚
    2024, 45(2): 498-504.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    代码补全(code completion)通过提供类名和方法名等预测,辅助开发人员编写代码,是自动化软件开发的重要功能之一.近年来,智能代码补全已成为软件工程领域的热门研究方向之一,前人工作表明通过自然语言技术或神经网络学习代码,能够提高代码补全的准确率,但这些补全模型仍存在不足,如代码上下文的信息表示较弱、程序信息提取不全和代码补全任务不平衡.因此,本文提出一种全新的智能代码补全方法,其中引入形变的长短记忆网络(Mogrifier-LSTM)和注意力机制增强代码上下文的信息表示,同时利用双向LSTM学习程序的层次结构信息,并设计一种多任务框架自动实现代码补全任务之间的平衡.通过在真实数据集上进行实验,结果表明本文所提方法表现优于主流代码补全方法.
  • 胡思源1,徐尔茨1,2,李东升1,2,刘锋1,2,张一鸣1,2
    2024, 45(2): 505-512.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    硬盘驱动器(HDD)仍然是大型数据中心与超算中心主要和重要的存储部件,而存储集群规模地持续扩大对硬盘故障预测的研究不断提出挑战.当前,前人已使用统计学、机器学习和深度学习等不同类型的故障预测方法用于大规模存储集群的硬盘故障预测,并取得不俗的研究结果.但是,对于故障模型的迁移性与数据集差异的相关研究还较少.我们收集了多种类型的HDD数据集与基于不同策略的模型,对其进行交叉实验验证,在模型迁移性、数据集预处理和模型参数方面获得了相关实验结果,例如:数据集在回溯时间与平衡度上的设置显著影响一定程度的预测模型性能,而模型参数设置则并不敏感;模型在不同数据集之间的可迁移性强弱不定,而数据集特征类型和数量的选择更影响预测模型性能.