
在预测英乡得步陆燃置圆眼分析和机器学习的概念漂班输移表示目标变量的统计特性随着时间的推移以不可预见的方式变化的现象。随着时间的推移,模型的预测精度将降低。
该术语的概念指的是要被预测的目标变量。更一般地边装联型去而,它也可以指其他感兴趣的现象之外的目标的概念,诸如输入,定科武弱但是在概念漂移的上下文中,术语通常指的是目标变量。
概述
例子:在欺诈检测应用中,目标概念"欺诈"可能是一个二元属性,其值为"是"或"否",指示给定的交易是否为欺诈。或者,在一个天气预测来自中的应用,可能有多个目标的概念,如温度,压力和湿度。
现实生活中产生的数据以数360百科据流的形式出现,其中概念并不是稳定不变的,而是随时间改随者木板足变的,例如天气预报,犯人们的穿衣习惯都示十六会随季节不同而发生改变等。当某些数据产生环境因素发生变化时,新的数据的分布规律将发生变化,所产生的概念将会发生改变,而这时利用历史数据建立的数据模型或概念将不在适合对新数据分类或新事物的认识,旧小该模型旧概念就必须发生与时俱进的改变。称这种数据流中数据分布随时间发生改变,概念发生改变的现象为"概念漂移"。
假设数据流S可以根据产生数据的不同模型划分为段即S={D1,足婷百黄批D2,...,Dm,...},其中每段由若干个数据点组成。若A概念产生于数据段Di={di1,di2,...,din},而B概念产生于数据段Dj={dj1,dj2,...,djn},其中j=i+1,概念在数据段Di和Dj都是稳定的,而两段数据的产生模型Mi和Mj也即数据流概念在区间{din,...,djn}发生了变化,即数据流S发生了概念漂将分旧弱必评脱里移。