Data mining and time series segmentation via extrema: preliminary investigations
FFouille de donn´ees et segmentation de chroniques par extrema :consid´erations pr´eliminaires
Data mining and time series segmentation via extrema: preliminary investigations
Michel Fliess , , C´edric Join , R ´ESUM ´E :
La segmentation des chroniques est l’un des outils de fouilles des donn´es. On l’aborde, ici, en prenant desextrema locaux pour points d’importance perceptuelle (PIP). Un th´eor`eme de d´ecomposition additive des chroniques, dˆu `aCartier et Perrin, et des techniques alg´ebriques d’estimation des d´eriv´ees, d´ej`a utiles en automatique et signal, permettentd’´evacuer le brouillage dˆu aux fluctuations rapides de toute chronique. Des illustrations num´eriques valident notre approcheet soulignent l’importance du choix du seuil de d´etection.
ABSTRACT : Time series segmentation is one of the many data mining tools. We take here local extrema as perceptuallyinteresting points (PIPs). The blurring of those PIPs by the quick fluctuations around any time series is treated via anadditive decomposition theorem, due to Cartier and Perrin, and algebraic estimation techniques, which are already usefulin automatic control and signal processing. Our approach is validated by several computer illustrations. They underline theimportance of the choice of a threshold for the extrema detection.
MOTS-CL ´ES : chroniques, segmentation, point d’importance perceptuelle (PIP), estimation alg´ebrique.
KEYWORDS : time series, segmentation, perceptually important points (PIPs), algebraic estimation. I. I
NTRODUCTION
Les chroniques, ou (cid:28) time series (cid:29) , sont omnipr´esentes dans la fouille de donn´ees, ou (cid:28) data mining (cid:29) . Parmi les multiplesm´ethodes utilis´ees, on privil´egie ici la segmentation (voir, par exemple, [Abonyi et Feil, 2007], [Cho et Fryzlewicz, 2012],[Dur´an-Rosal et al., 2018a], [Dur´an-Rosal et al., 2018b], [Dur´an-Rosal et al., 2019], [Esling et Agon, 2012], [Keogh et al., 2004],[Kim et al., 2019], [Lee et al., 2018], [Liu et al., 2008], [Lu et Huang, 2020], [Mart´ı et al., 2014]), c’est-`a-dire une approxi-mation par un nombre fini de segments de droite. De nombreuses ´etudes concr`etes l’ont d´ej`a utilis´ee dans des domaines vari´es :hydrom´et´eorologie ([Hubert et al., 1989]), ´economie ([Cheong et al., 2012], finance ([Wan et al., 2016], [Wan et Si, 2017]),mouvement animal ([Edelhoff et al., 2016], vision par ordinateur ([Liu et al., 2019]), efficacit´e ´energ´etique des machinesoutils ([Seevers et al., 2019]), collecte de donn´ees par drones aquatiques ([Castellini et al., 2020]), . . .
Prendre pour boutsdes segments des points d’importance perceptuelle ( PIP ), ou (cid:28) perceptually important points (cid:29) , consolide ce point devue (voir, par exemple, [Fu, 2011], [Fu et al., 2017]), qui l’est encore davantage si ces PIP sont des extrema locaux([Pratt et Fink, 2002], [Fink et Pratt, 2004], [Fink et Gandhi, 2011], [Yin et al., 2011]). La d´etection des PIP est brouill´eepar les fluctuations rapides de toute chronique. Comment isoler des extrema locaux sur la ligne bleue de la figure 1 ?Les publications existantes ignorent, semble-t-il, cette difficult´e majeure. Cet article pr´esente un cadre math´ematique etalgorithmique afin de d´etecter ces extrema locaux en d´epit des oscillations. Quelques exemples acad´emiques sur la r´eductionde dimension, pr´ealable `a toute fouille de donn´ees, illustrent notre propos.Notre approche des chroniques, qui s’appuie sur ([Fliess et al., 2018]), consacr´e `a la pr´evision et `a la gestion du risquepour l’´energie photovolta¨ıque, est n´ee en ing´enierie financi`ere ([Fliess et Join, 2009], [Fliess et al., 2011]). Elle a ´et´e utilis´eepour la pr´evision du trafic autoroutier ([Aboua¨ıssa et al., 2016]) et des ressources n´ecessaires en informatique nuagique, ou (cid:28) cloud computing (cid:29) ([Fliess et al., 2019]). Le pivot en est un th´eor`eme dˆu `a [Cartier et Perrin, 1995] : toute chronique X satisfaisant une hypoth`ese tr`es lˆache, s’´ecrit X = E ( x ) + X fluctuat , o`u E ( x ) est la moyenne , ou tendance ( (cid:28) trend (cid:29) ),et X fluctuat les fluctuations rapides autour de . La ligne rouge de la figure 1 correspond `a la moyenne. Le th´eor`eme deCartier et Perrin s’exprime dans le langage de l’ analyse non standard , introduit par [Robinson, 1996] et outil merveilleuxpour l’intuition (voir, par exemple, [Lobry et Sari, 2008]). On ne recherche pas les extrema sur X , mais sur E ( X ) , pluslisse. La d´etection d’un extremum est li´ee `a l’annulation de la d´eriv´ee d’ordre . On y parvient grˆace aux techniques LIX (CNRS, UMR 7161), ´Ecole polytechnique, 91128 Palaiseau, France.
[email protected] AL.I.E.N. (ALg`ebre pour Identification & Estimation Num´eriques), 7 rue Maurice Barr`es, 54330 V´ezelise, France. { cedric.join, michel.fliess } @alien-sas.com CRAN (CNRS, UMR 7039)), Universit´e de Lorraine, BP 239, 54506 Vandœuvre-l`es-Nancy, France.
[email protected] a r X i v : . [ c s . D B ] S e p ’ estimation alg´ebrique ([Fliess et al., 2008], [Mboup et al., 2009]) pour traiter du cas bruit´e, connu comme important etdifficile ([Lanczos, 1956]). Si la d´eriv´ee est proche de durant un certain temps, la chronique est remplac´ee par un plateau,c’est-`a-dire un segment horizontal. Des techniques alg´ebriques analogues ont d´ej`a ´et´e employ´ees pour d´etecter des ruptures,ou (cid:28) change-points (cid:29) ([Fliess et al., 2010]).Cette communication est organis´ee comme suit. Les rappels du § II sont consacr´es aux chroniques et `a l’estimationalg´ebrique. On pr´esente au § III des illustrations num´eriques, qui soulignent l’importance du seuil de d´etection des extrema.Quelques prolongements sont propos´es au § IV.II. R
APPELS SUR LES CHRONIQUES ET L ’ ESTIMATION ALG ´ EBRIQUE
A. Chroniques et analyse non standard L’ analyse non standard , qui repose sur la logique math´ematique, fournit un sens pr´ecis aux notions d’infiniment petit etd’infiniment grand. On recommande la pr´esentation par [Nelson, 1977] (voir aussi [Nelson, 1987], [Diener et Diener, 1995],[Diener et Reeb, 1989]), conceptuellement plus simple.Soit l’intervalle [0 , , avec ´echantillonnage infinit´esimal, comme souvent en analyse non standard, T = { t < t < · · · < t ν = 1 } o`u t i +1 − t i , ≤ i < ν , est infinit´esimal , c’est-`a-dire tr`es petit. Remarque 2.1:
Les notions d’infiniment petit ou grand sont des id´ealisations math´ematiques. On doit consid´erer, enpratique, un laps de temps d’une seconde (resp. heure) comme tr`es petit par rapport `a une heure (resp. mois). C’est pourquoil’analyse non standard s’applique au monde r´eel.Une chronique X est une fonction T → R . La mesure de Lebesgue sur T est la fonction (cid:96) d´efinie sur T \{ } par (cid:96) ( t i ) = t i +1 − t i . La mesure de tout intervalle [ c, d ] ⊂ T , c ≤ d , est sa longueur d − c . L’ int´egrale sur [ c, d ] de la chronique X ( t ) s’´ecrit (cid:90) [ c,d ] Xdτ = (cid:88) t ∈ [ c,d ] X ( t ) (cid:96) ( t ) X est S - integrable si, et seulement si, l’int´egrale (cid:82) [ c,d ] | X | dτ est limit´ee , c’est-`a-dire non infiniment grande, et, si d − c isinfinit´esimal, (cid:82) [ c,d ] | X | dτ l’est aussi. X est S - continue en t ι ∈ T si, et seulement si, f ( t ι ) (cid:39) f ( τ ) quand t ι (cid:39) τ (on ´ecrit a (cid:39) b si a − b est infinit´esimal). X est presque continue si, et seulement si, elle est S -continue sur T \ R , o`u l’ensemble R est rare . X est Lebesgue int´egrable si, et seulement si, elle est S -int´egrable et presque continue.La chronique X est rapidement fluctuante , ou oscillante , autour de , si, et seulement si, elle est— S -int´egrable,— (cid:82) A X dτ est infinit´esimal pour ensemble quadrable . Th´eor`eme de Cartier-Perrin : Si la chronique X est S -int´egrable, il y a d´ecomposition additive ([Cartier et Perrin, 1995]) : X ( t ) = E ( X )( t ) + X fluctuat ( t ) (1)o`u— la moyenne E ( X )( t ) est Lebesgue-int´egrable,— X fluctuat ( t ) est rapidement fluctuante.La d´ecomposition (1) est unique `a une quantit´e additive infinit´esimale pr`es. Remarque 2.2:
Cette moyenne, ou tendance , souvent d´esign´ee par le mot anglais (cid:28) trend (cid:29) , est `a rapprocher du lissagepar moyenne glissante ou (cid:28) moving average (cid:29) (voir, par exemple, [M´elard, 2008]). On la retrouve aussi en analyse technique (voir, par exemple, [B´echu et al., 2014], [Kirkpatrick et Dahlquist, 2016], [Tsinaslanidis et Zapranis, 2016]), branche del’ing´enierie financi`ere. Tr`es diff´erent est le sens habituel de trend dans la litt´erature sur les chroniques (voir, par exemple,[Enders, 2014]). B. Estimation alg´ebrique des d´eriv´ees Le § II-A d´emontre que l’on peut passer au continu si les donn´ees sont en nombre suffisant et la p´eriode d’´echantillonnagepetite. La d´eriv´ee est, en fait, estim´ee sur la moyenne et non sur les donn´ees brutes.Soit la fonction polynˆomiale de degr´e p ( t ) = a + a t, t ≥ , a , a ∈ R R est rare ([Cartier et Perrin, 1995]) si, pour tout r´eel standard α > , il existe un ensemble interne A ⊃ R tel que (cid:96) ( A ) ≤ α .2. Un ensemble est quadrable ([Cartier et Perrin, 1995]) si sa fronti`ere est rare.3. Voir [Lobry et Sari, 2008] pour une pr´esentation plus abordable e calcul op´erationnel classique (voir, par exemple, [Yosida, 1984]) permet de r´e´ecrire p P = a s + a s D’o`u en multipliant par s s P = a s + a (2)et en d´erivant par rapport `a s , qui, dans le domaine temporel, correspond `a la multiplication par − t : s dP ds + 2 sP = a (3)Le syst`eme triangulaire (2)-(3) d’´equations fournit a , a . On se d´ebarrasse de sP , s P , an s dP ds , c’est-`a-dire, dans ledomaine temporel, des d´eriv´ees par rapport au temps, en multipliant les deux membres des ´equations (2) et (3) par s − n , n ≥ . Les int´egrales it´er´ees correspondantes, qui, en pratique, sont remplac´ees par des filtres lin´eaires num´eriques, sont desfiltres passe-bas : elles att´enuent les oscillations parasites. Une fenˆetre temporelle courte suffit pour estimer avec pr´ecision a , a .La g´en´eralisation aux polynˆomes de degr´e sup´erieur est ´evidente, donc aussi celle aux d´eveloppements de Taylor tronqu´es.Renvoyons `a [Mboup et al., 2009] pour plus de d´etails. Remarque 2.3:
Les manipulations alg´ebriques pr´ec´edentes sont employ´ees avec succ`es en ing´enierie (voir, par exemple,[Sira-Ram´ırez et al., 2013]). Le passage en de la d´eriv´ee premi`ere a ´et´e utilis´ee, en particulier, en traitement du signal([Fedele et al., 2009]). III. I LLUSTRATIONS
A. Polynˆomes par morceaux
Soit y ( t ) d´efini par y ( t ) = − t + 0 .
50 0 ≤ t < y ( t ) = 5 t − . ≤ t < y ( t ) = − . ≤ t < y ( t ) = t − . ≤ t < y ( t ) = 50 . ≤ t ≤ alt´er´e par un bruit uniform´ement r´eparti entre − et . Soit . s la p´eriode d’´echantillonnage. La segmentation obtenue estpr´esent´ee figure 2-(a). L’estimation de d´eriv´ee l’est, selon le § II-B, avec un polynˆome de degr´e sur une fenˆetre de ´echantillons. La figure 2-(b) en atteste la qualit´e. On note la d´etection des plateaux. La segmentation est peu repr´esentativedurant la branche parabolique, de courte dur´ee heureusement . B. Sinuso¨ıdes
Soient deux sinuso¨ıdes de fr´equences s et s, ´echantillonn´ees toutes les . s (voir figures 3-(a) et 4-(a)). Elles sontalt´er´ees par un bruit uniform´ement r´eparti entre − . et . . La d´eriv´ee est estim´ee avec un polynˆome de degr´e , surune fenˆetre glissante de dur´ee s. On d´etecte les extrema avec un seuil ´egal `a . (voir figures 3-(b) et 4-(b)). Avec la petitefr´equence, ce seuillage conduit `a un plateau (figures 4-(c) & 4-(d)), mais pas avec la grande (figures 3-(c) & 3-(d)). C. CAC 40
On reprend, pour la segmenter, la chronique du CAC 40, repr´esent´ee par la figure 1. Avec des seuils diff´erents, et ,pour d´etecter les passages par z´ero de la d´eriv´ee, on modifie notablement les r´esultats (figures 5-(c) et 6-(c)).IV. C ONCLUSION
1) On examinera d’autres poins d’importance perceptuelle, comme ceux de courbure localement maximale (voir, d´ej`a,[Join et Tabbone, 2008]).2) Aux chroniques multivari´ees correspondent des courbes gauches, c’est-`a-dire non planes. Le choix des PIP exige une´etude g´eom´etrique plus d´elicate (voir, par exemple, [Cagnac et al., 1971]). L’analyse technique, qui examine, souvent,prix et volumes ([B´echu et al., 2014], [Kirkpatrick et Dahlquist, 2016], [Tsinaslanidis et Zapranis, 2016]), y gagneraitcertainement .3) Des applications v´eritables sont en cours d’´etude, la reconnaissance de signatures entre autres. Plusieurs publica-tions proposent, d´ej`a, des techniques diverses d’analyse des chroniques (voir, par exemple, [Henniger et al., 2014],[Hsu et al., 2015]). Nos premiers r´esultats d´emontent l’inanit´e de rechercher mesures ou distances universelles desimilarit´e, c’est-`a-dire ind´ependantes du but poursuivi.
4. Voir, `a ce sujet, le point 1 du § IV.5. Certains liens entre analyse technique, PIP et segmentation des chroniques ont d´ej`a ´et´e entrevus (voir, par exemple, [Tsinaslanidis et Zapranis, 2016],[Wan et al., 2016], [Wan et Si, 2017], [Yin et al., 2011]).
EFERENCES[Abonyi et Feil, 2007] Abonyi, J., Feil, B. (2007) : Cluster Analysis for Data Mining and System Identification. Birkh¨auser.[Aboua¨ıssa et al., 2016] Aboua¨ıssa, H., Fliess, M., Join, C. (2016) : On short-term traffic flow forecasting and its reliability. In : https : //hal.archives-ouvertes.fr/hal-01275311/en/ [B´echu et al., 2014] B´echu, T., Bertrand, E. Nebenzahl, J. (2014) : L’analyse technique ( e ´ed.). Economica.[Cagnac et al., 1971] Cagnac, G., Ramis, E., Commeau, J. (1971) : Trait´e de math´ematiques sp´eciales, t. 4. Masson.[Cartier et Perrin, 1995] Cartier, P., Perrin, Y. (1995) : Integration over finite sets. In : Diener, F., Diener, M. (eds.) : Nonstandard Analysis in Practice, pp.195-204. Springer.[Castellini et al., 2020] Castellini, A., Bicego, M., Masillo, F., Zuccotto, M., Farinelli, A. (2020) : Time series segmentation for state-model generation ofautonomous aquatic drones : A systematic framework. Engin. Appli. Artific. Intell. , 103499.[Cheong et al., 2012] Cheong, S.A., Fornia, R.P., Hui Ting Lee, G., Liang Kok, J., Shyr Yim, W., Yuan Xu, D., Zhang, Y. (2012) : The Japanese economyin crises : A time series segmentation study. Econom. : The Open-Access Open-Assess. E-J. . http : //dx.doi.org/10.5018/economics-ejournal.ja.2012-5 [Cho et Fryzlewicz, 2012] Cho, H., Fryzlewicz, P. (2012) : Multiscale and multilevel technique for consistent segmentation of nonstationary time series.Stat. Sinica , 207-229.[Diener et Diener, 1995] Diener, F., Diener, M. (1995) : Tutorial. In : Diener, F., Diener, M. (eds.) Nonstandard Analysis in Practice, pp. 1-21. Springer.[Diener et Reeb, 1989] Diener, F., Reeb, G. (1989) : Analyse non standard. Hermann.[Dur´an-Rosal et al., 2018a] Dur´an-Rosal, A.M., Guti´errez, P.A., Mart´ınez-Estudillo, F.J., H´ervas-Mart´ınez, C. (2018a) : Simultaneous optimisation ofclustering quality and approximation error for time series segmentation. Informat. Sci. , 186–201.[Dur´an-Rosal et al., 2018b] Dur´an-Rosal, A.M., Guti´errez, P.A., Salcedo-Sanz, S., H´ervas-Mart´ınez, C. (2018b) : A statistically-driven Coral ReefOptimization algorithm for optimal size reduction of time series. Appl. Soft Comput. , 139-153.[Dur´an-Rosal et al., 2019] Dur´an-Rosal, A.M., Guti´errez, P.A., Carmona-Poyato, ´A, C´esar Herv´as-Mart´ınez, C. (2019) : A hybrid dynamic exploitationbarebones particle swarm optimisation algorithm for time series segmentation. Neurocomput. , 45-55.[Edelhoff et al., 2016] Edelhoff, H., Signer, J., Balkenhol, N. (2016) : Path segmentation for beginners : an overview of current methods for detectingchanges in animal movement patterns. Mov. Ecol. , 21. https : //doi.org/10.1186/s40462-016-0086-5 [Esling et Agon, 2012] Esling, P., Agon, C. (2012) : Time-series data mining. ACM Comput. Surv. , article 12, 34 pages.[Enders, 2014] Enders, W. (2014) : Applied Econometric Time Series (4th ed.). Wiley.[Fedele et al., 2009] Fedele, G., Chiaravallotri, F., Join, C. (2009) : An algebraic derivative-based approach for the zero-crossings estimation. In : https://hal.inria.fr/inria-00389872/en/ [Fink et Pratt, 2004] Fink, E., Pratt, K.B. (2004) : Indexing of compressed time series. In : Last, M., Kandel, A., Bunke, H. (eds) Data Mining in TimeSeries Databases, pp. 43-65. World Scientific.[Fink et Gandhi, 2011] Fink, E., Gandhi, H.S. (2011) : Compression of time series by extracting major extrema. J. Exper. Theoret. Artif. Intell. ,255-270.[Fliess, 2006] Fliess, M. (2006) : Analyse non standard du bruit. C.R. Acad. Sci. Paris , 797–802.[Fliess et Join, 2009] Fliess, M., Join, C. (2009) : A mathematical proof of the existence of trends in financial time series. In : El Jai, A., Afifi, L., Zerrik,E. (Eds.) : Systems Theory : Modeling, Analysis and Control. Presses Universitaires de Perpignan, pp. 43-62. https : //hal.inria.fr/inria-00352834/en/ [Fliess et al., 2019] Fliess, M., Join, C., Bekcheva, M., Moradi, A., Mounier, H. (2019) : Easily implementable time series forecasting techniques forresource provisioning in cloud computing. In : https : //hal.archives-ouvertes.fr/hal-02024835/en/ [Fliess et al., 2011] Fliess, M., Join, C., Hatt, F. (2011) : A-t-on vraiment besoin d’un mod`ele probabiliste en ing´enierie financi`ere ? In : Conf. M´edit.Ing´en. Sˆure Syst. Compl., Agadir. https : //hal.archives-ouvertes.fr/hal-00585152/en/ [Fliess et al., 2010] Fliess, M., Join, C., Mboup, M. (2010) : Algebraic change-point detection. App. Algeb. Engin. Commun. Comput. , 131–143.[Fliess et al., 2008] Fliess, M., Join, C., Sira-Ram´ırez, H. (2008) : Non-linear estimation is easy. Int. J. Model. Identif. Contr. , 12-27.[Fliess et al., 2018] Fliess, M., Join, C., Voyant, C. (2018) : Prediction bands for solar energy : New short-term time series forecasting techniques. SolarEnergy , 519-528.[Fu, 2011] Fu, T.-C. (2011) : A review on time series data mining. Engin. Appli. Artif. Intell. , 164-181.[Fu et al., 2017] Fu, T.-C., Hung, Y.-K., Chung, F.-L. (2017) : Improvement algorithms of perceptually important point identification for time series datamining. In : IEEE 4th Int. Conf. Soft Comput. Mach. Intell.. Port Louis, Mauritius.[Henniger et al., 2014] Henniger, O., Guest, R., Miguel-Hurtado, O., Kaplan, C. (2014) : Signature/Sign Time Series Data : Standardization. In : Li S., JainA. (Eds), Encyclopedia of Biometrics, pp. 1395-1400. Springer.[Hsu et al., 2015] Hsu, Y.-L., Chu, C.-L., Tsai, Y.-J., Wang, J.-S. (2015) : An inertial pen with dynamic time warping recognizer for handwriting andgesture recognition. IEEE Sensors J. , 154-163.[Hubert et al., 1989] Hubert, P., Carbonnel, J.P., Chaouche, A. (1989) : Segmentation des s´eries hydrom´et´eorologiques – Applications `a des s´eries depr´ecipitations et de d´ebit de l’Afrique de l’ouest. J. Hydrol. , 349-367.[Join et Tabbone, 2008] Join, C., Tabbone, S. (2008) : Robust curvature extrema detection based on new numerical derivation. In : Blanc-Talon, J.,Bourennane, S., Philips, W., Popescu, D., Scheunders, P. (Eds) : Advanced Concepts for Intelligent Vision Systems. Lect. Notes Comput. Sci. ,pp. 485-493. Springer.[Keogh et al., 2004] Keogh, E., Chu, S., Hart, D., Pazzani, M. (2004) : Segmenting time series : A survey and novel approach. In : Last, M., Kandel, A.,Bunke, H. (eds), Data Mining in Time Series Databases, pp. 1-21. World Scientific.[Kim et al., 2019] Kim, H., Kim, H.K., Kim, M., Park, J. , Cho, S., Im, K.B., Ryu, C.R. (2019) : Representation learning for unsupervised heterogeneousmultivariate time series segmentation and its application. Comput. Indust. Engin. , 272-281[Kirkpatrick et Dahlquist, 2016] Kirkpatrick, C.D., Dahlquist, J. (2016) : Technical Analysis (3rd ed.). Pearson.[Lanczos, 1956] Lanczos, C. (1956) : Applied Analysis. Prentice Hall.[Lee et al., 2018] Lee, W.-H., Ortiz, J., Ko, B., Lee, R. (2018) : Time series segmentation through automatic feature learning. arXiv:180.955394 [Lobry et Sari, 2008] Lobry, C., Sari, T. (2008) : Nonstandard analysis and representation of reality. Int. J. Contr. , 535-576.[Liu et al., 2008] Liu, X., Lin, Z., Wang, H. (2008) : Novel online methods for time series segmentation. IEEE Trans. Knowledg. Data Engin., ,1616-1626.Liu et al., 2019] Liu, J., Wang, C., Liu, Y. (2019) : A novel method for temporal action localization and recognition in untrimmed video based on timeseries segmentation. IEEE Access , 135204-135209.[Lu et Huang, 2020] Lu, S., Huang, S. (2020) : Segmentation of multivariate industrial time series data based on dynamic latent variable predictability.IEEE Access , 112092-112103.[Mart´ı et al., 2014] Mart´ı, L., Sanchez-Pi, N., Molina, J.M., Bicharra Garcia, A.C. (2014) : YASA : Yet another time series segmentation algorithm foranomaly detection in big data problems. In : Polycarpou, M., de Carvalho, A.C.P.L.F., Pan, J.-S., Wo´zniak, M., Quinti´an, H., Corchado, E. (Eds.) : Hybrid Artificial Intelligence Systems. Lect. Notes Artif. Intel. , pp. 697-708. Springer.[Mboup et al., 2009] Mboup, M., Join, C., Fliess, M. (2009) : Numerical differentiation with annihilators in noisy environment. Numer. Algor. , 439-467.[M´elard, 2008] M´elard, G. (2008) : M´ethodes de pr´evision `a court terme (2 e ´ed.). Ellipses & Presses Universitaires de Bruxelles.[Nelson, 1977] Nelson, E. (1977) : Internal set theory : A new approach to nonstandard analysis. Bull. Amer. Math. Soc. , 1165-1198.[Nelson, 1987] Nelson, E. (1987) : Radically Elementary Probability Theory. Princeton University Press.[Pratt et Fink, 2002] Pratt, K.B., Fink, E. (2002) : Search for patterns in compressed time series. Int. J. Image Graph. , 89-106.[Robinson, 1996] Robinson, A. (1996) : Non-standard Analysis (revis. ed.). Princeton University Press.[Seevers et al., 2019] Seevers, J.-P., Johst, J., Weiß, T., Meschede, H., Hessel, J. (2019) : Automatic time series segmentation as the basis for unsupervised,non-intrusive load monitoring of machine tools. Procedia CIRP , 695-700.[Sira-Ram´ırez et al., 2013] Sira-Ram´ırez, H., Garc´ıa-Rodr´ıguez, C., Cort`es-Romero, J., Luviano-Ju´arez, A. (2013) : Algebraic Identification and EstimationMethods in Feedback Control Systems. Wiley.[Tsinaslanidis et Zapranis, 2016] Tsinaslanidis, P.E., Zapranis, A.D. (2016) : Technical Analysis for Algorithmic Pattern Recognition. Springer.[Wan et al., 2016] Wan, Y., Gong, X., Si, Y.-W. (2016) : Effect of segmentation on financial time series pattern matching. Appl. Soft Comput. , 346-359.[Wan et Si, 2017] Wan, Y., Si, Y.W. (2017) : A formal approach to chart patterns classification in financial time series. Informat. Sci. , 151-175.[Yin et al., 2011] Yin, J., Si, Y.-W., Gong, Z. (2011) : Financial time series segmentation based on turning points. In : Int. Conf. Syst. Sci. Engin., Macau.[Yosida, 1984] Yosida, K. (1984) : Operational Calculus (translated from the Japanese). Springer. ig. 1: CAC 40. En bleu : valeur quotidienne du CAC 40 du 1er janvier 2009 au 31 d´ecembre 2019. En rouge : moyenne(glissante). a) En bleu : signal. En rouge : segmentation (b)
V´eritable d´eriv´ee (noir - -), d´eriv´ee estim´ee (bleu), seuils (rouge - -), passage en (noir *) Fig. 2: Polynˆomes par morceaux a) En bleu : signal. En rouge : segmentation (b)
V´eritable d´eriv´ee (noir - -), d´eriv´ee estim´ee (bleu), seuil (rouge - -),passage en (noir *) (c) Zoom de (a) (d)
Zoom de (a)
Fig. 3: Sinuso¨ıde : fr´equence ´elev´ee a) En bleu : signal. En rouge : segmentation (b)
V´eritable d´eriv´ee (noir - -), d´eriv´ee estim´ee (bleu), seuil (rouge - -),passage en (noir *) (c) Zoom de (a) (d)
Zoom de (a)
Fig. 4: Sinuso¨ıde : fr´equence basse a) En bleu : chronique. En rouge : segmentation (b)
D´eriv´ee estim´ee (bleu), seuil (rouge - -), passage en (noir *) (c) Zoom de (a)
Fig. 5: CAC 40 : Seuil bas a) En bleu : chronique. En rouge : segmentation (b)