章耀坤,于洪,胡峰
2021, 42(8): 1662-1667.
在数据挖掘领域中,数据离散化是将一组连续的数值属性转换为离散的标称属性值,并广泛在音频或视频等连续时间信号的预处理中得到应用.据文献考证,离散区间中的不确定性的空白区间被现有研究所忽略.此外,动态的增量数据将使离散区间更加复杂.针对增量数据下离散问题,本文提出了一种基于三支决策的自适应动态区间离散化方法.本文提出的三支离散化方法可以使离散区间的范围随数据的变化而自适应地变化,并提高了对新增量数据进行离散化的效果.利用本文定义的空白区间的概念,可有效提高新数据和原始数据之间融合的效果.实验结果表明,本文的方法对于处理增量式数据离散化问题具有较好的效果,且运行速度更快.