Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE REPUBLIQUE TOGOLAISE Travail-Liberté-Patrie No d’ordre : 2018/MP/GE- UNIVERSITE DE LOME (UL) ECOLE NATIONALE SUPERIEURE D’INGENIEURS (E.N.S.I) DEPARTEMENT DE GENIE ELECTRIQUE "SUPPORT VECTOR MACHINE" POUR LA PREDICTION DE LA VITESSE DU VENT : CAS DU SITE DE LOME MEMOIRE DE FIN D’ETUDES POUR L’OBTENTION DU DIPLOME MASTER PROFESSIONNEL/ INGENIEUR DE CONCEPTION GENIE ELECTRIQUE Rédigé et soutenu par : Hadnane OURO-AGBAKE Jury: Président : Dr KODJO Koffi Mawugno, Maitres de conférences, Chef du département Génie Electrique. Directeur : Dr SALAMI Adékunle Akim, Maitres de conférences, Directeur Adjoint de l’ENSI. Membre 1 : M. GUENOUKPATI Agbassou, Enseignant-chercheur à l’ENSI Membre 2 : M. DOTCHE A. Koffi, Enseignant à l’ENSI © Juillet 2018 DEDICACES Dédicaces Je dédie ce travail : A Allah, le très haut. A mes chers parents: En leur exprimant mon amour, mon respect et mes vives gratitudes pour leur patience, leur amour et leurs prières, qui m’encouragent toujours à la réussite tout le long de mes études, qu’Allah les protège et les bénisse. A toutes nos grandes familles et tous nos chers amis et amis de classe, tous ceux que nous aimons et qui nous sont très chers. Mémoire d’ingénieur/Master Professionnel i Hadnane OURO-AGBAKE REMERCIEMENTS Remerciements Je tiens à adresser mes vifs et sincères remerciements : au Professeur BEDJA Koffi-Sa, Professeur Titulaire, Ingénieur des Télécommunications, Directeur de l’Enseignement Supérieur Technique, Directeur de l’ERSI et de la Formation Doctorale de l’ENSI-UL, pour ses conseils et encouragements pendant notre formation ; au Dr. AJAVON Ayité Sénah, Maître de Conférences, Ingénieur Electro-énergéticien, Directeur de l’ENSI ; au Dr. KODJO Koffi Mawugno, Maître de Conférences, Ingénieur Automaticien, Enseignant Chercheur à l’ENSI, et chef de département Génie Electrique ; au Dr. SALAMI Adekunle Akim, Maître de Conférences, Ingénieur Génie Electrique, Directeur Adjoint de l’ENSI, Directeur de ce mémoire pour sa disponibilité et ses conseils; au Dr. BAYOR Sibiri Wourè-Nadiri, Maître-Assistant, Ingénieur Génie Electrique, Enseignant-Chercheur à l’ENSI ; au Dr. DEFLY Koffi, Maître-Assistant, Enseignant-Chercheur à l’ENSI ; au Dr. BOKOVI Yao, Maître-Assistant, Ingénieur Génie Electrique, Enseignant chercheur à l’ENSI ; à M EGBEKU Edem, Ingénieur Génie Electrique, Enseignant-chercheur à l’ENSI ; à M. KPOGLI Komlan, Ingénieur, Enseignant chercheur à l’ENSI ; Mémoire d’ingénieur/Master Professionnel ii Hadnane OURO-AGBAKE REMERCIEMENTS à tout le personnel enseignant, administratif et technique de l’ENSI pour leur dévouement au bien-être de tous les étudiants de l’ENSI; Pour finir, je voudrais remercier les membres de ma famille pour leurs soutiens sans failles qu’ils m’ont apportés tout au long de ces années. Mémoire d’ingénieur/Master Professionnel iii Hadnane OURO-AGBAKE RESUME Résumé La production de l’énergie éolienne dépend fortement de la variation de la vitesse du vent sur le site de production. Cependant, si l’énergie éolienne doit concurrencer les autres sources d’énergie, la prédiction de la vitesse du vent est alors indispensable. Afin de rendre le plus précis possible les prédictions de vitesse du vent sur le site de Lomé, cette étude, faisant suite à d’autres études entreprises à l’ENSI, a pour objectif de prédire la moyenne horaire de la vitesse du vent en utilisant un modèle des SVM (Support Vector Machine) pour la régression. Les SVM sont une technique de Machine Learning supervisé pour la prédiction des séries chronologiques, qui se révèlent très efficaces dans ces dernières décennies. A cet effet, nous disposons d’une base de données horaire recueillie sur le site, dont 70% ont été dédiés à l’apprentissage, et 30% à la validation. Plusieurs configurations de ce modèle ont été développées et testées. Les résultats obtenus avec une erreur quadratique moyenne (MSE) de 0,128 et un coefficient de détermination (R2) de 0,962 montrent clairement qu’il est possible de prédire la moyenne horaire de la vitesse du vent par un modèle SVR. Mots clés : apprentissage automatique, Support Vector Machine, Support Vector Régression, vitesse du vent, prédiction. Mémoire d’ingénieur/Master Professionnel iv Hadnane OURO-AGBAKE TABLE DES MATIERES Table des matières Pages DEDICACES ......................................................................................................................... i REMERCIEMENTS ............................................................................................................ii RESUME ............................................................................................................................. iv TABLE DES MATIERES .................................................................................................... v LISTE DES FIGURES ..................................................................................................... viii LISTE DES TABLEAUX ................................................................................................... ix LISTE DES ABREVIATIONS ET ACRONYMES ............................................................ x INTRODUCTION GENERALE ....................................................................................... 1 CHAPITRE 1 : LE PROCESSUS ENERGETIQUE EOLIEN ..................................... 4 1.1. Introduction ............................................................................................................. 5 1.2. Energie éolienne ...................................................................................................... 5 1.3. Les origines du vent ................................................................................................ 6 1.3.1. Ensoleillement inégal de la terre ...................................................................... 7 1.3.2. La force de Coriolis .......................................................................................... 7 1.3.3. La géographie locale ........................................................................................ 7 1.4. Les caractéristiques de l’énergie éolienne .............................................................. 8 1.4.1. Puissance éolienne ........................................................................................... 8 1.4.2. Les caractéristiques du vent ........................................................................... 11 1.4.3. Les classes de vent ......................................................................................... 13 1.5. Aérogénérateurs .................................................................................................... 15 Mémoire d’ingénieur/Master Professionnel v Hadnane OURO-AGBAKE TABLE DES MATIERES 1.5.1. Configuration d’une éolienne ......................................................................... 15 1.5.2. Classification des aérogénérateurs ................................................................. 16 1.5.3. Les paramètres de l’énergie éolienne ............................................................. 19 1.5.4. Commandes de l’éolienne .............................................................................. 24 1.6. Problématique de la prédiction de la vitesse du vent ............................................ 27 1.7. Conclusion ............................................................................................................ 28 CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT ..................................................................................................... 29 2.1. Introduction ........................................................................................................... 30 2.2. Les applications de la prédiction de la vitesse du vent ......................................... 30 2.3. Revue littéraire de la prédiction de la vitesse du vent .......................................... 31 2.3.1. Méthode de persistance .................................................................................. 31 2.3.2. Modèles de prévision numérique ................................................................... 32 2.3.3. Prévision d'ensemble ...................................................................................... 33 2.3.4. Méthodes physiques ....................................................................................... 33 2.3.5. Méthodes d'approche statistique et d'apprentissage ....................................... 34 2.4. Machines à Vecteurs Support (SVM) ................................................................... 36 2.4.1. Le problème de discrimination binaire .......................................................... 37 2.4.2. Les SVM linéaires .......................................................................................... 37 2.4.3. Le cas non linéaire : les noyaux ..................................................................... 42 2.4.4. Les SVM multiclasses .................................................................................... 45 2.4.5. Support Vector Régression ............................................................................ 45 2.4.6. Les SVM par la pratique ................................................................................ 47 2.5. Conclusion ............................................................................................................ 50 CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE .................................................................................... 51 Mémoire d’ingénieur/Master Professionnel vi Hadnane OURO-AGBAKE TABLE DES MATIERES 3.1. Introduction ........................................................................................................... 52 3.2. Environnement ...................................................................................................... 52 3.2.1. Pythons ........................................................................................................... 52 3.2.2. Pandas............................................................................................................. 53 3.2.3. NumPy............................................................................................................ 53 3.2.4. Matplotlib ....................................................................................................... 54 3.2.5. SciPy............................................................................................................... 54 3.2.6. Statsmodels .................................................................................................... 55 3.2.7. scikit-learn ...................................................................................................... 55 3.3. Description du problème ....................................................................................... 56 3.4. Méthodologie ........................................................................................................ 56 3.4.1. Mesure de performance .................................................................................. 56 3.4.2. Stratégie d’apprentissage ............................................................................... 57 3.5. Modélisation de la vitesse du vent par les SVM ................................................... 58 3.5.1. Analyse exploratoire des données de vitesse ................................................. 59 3.5.2. Prétraitement des données du vent ................................................................. 64 3.5.3. Les performances des configurations ............................................................. 65 3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des entrées ............................................................................................................ 67 3.6. Prédiction avec le modèle choisi........................................................................... 70 3.7. Coût du projet ...................................................................................................... 75 3.8. Conclusion ............................................................................................................ 76 CONCLUSION GENERALE.......................................................................................... 78 RÉFÉRENCES BIBLIOGRAPHIQUES ........................................................................... 81 Mémoire d’ingénieur/Master Professionnel vii Hadnane OURO-AGBAKE LISTE DES FIGURES LISTE DES FIGURES Pages CHAPITRE 1 : Figure 1.1: Surface de balayage des pales .......................................................................... 10 Figure 1.2: Configuration d'un aérogénérateur................................................................... 16 Figure 1.3: Tube de courant d’air autour d’un aérogénérateur........................................... 20 Figure 1.4: Coefficient de puissance .................................................................................. 21 Figure 1.5: Courbe de puissance ........................................................................................ 22 CHAPITRE 2 : Figure 2.1 : Quatre types de problèmes de discrimination binaire ..................................... 38 Figure 2.2: Hyperplan optimal séparant les points de 2 classes ......................................... 39 Figure 2.3: Marge souple .................................................................................................... 42 Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de dimension plus grande ..................................................................................... 43 Figure 2.5 : Redescription des données pour permettre une séparation linéaire ................ 43 Figure 2.6 : ɛ-insensible...................................................................................................... 47 CHAPITRE 3 : Figure 3.1 : La courbe des vitesses du vent de 2015 à 2018 .............................................. 60 Figure 3.2 : Histogramme des données de vitesses ............................................................ 62 Figure 3.3: Courbe de la variable de sortie du modèle ....................................................... 69 Figure 3.4 : Courbes des variables d’entrée du modèle ..................................................... 70 Figure 3.5: Résultats de prédiction ..................................................................................... 71 Figure 3.6: Vitesses mesurées et vitesses prédites ............................................................. 72 Figure 3.7: Corrélation vitesses mesurées-vitesses prédites .............................................. 72 Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures ........... 73 Figure 3.9: Histogramme des erreurs au cours de la validation ......................................... 74 Figure 3.10 : Puissances prédites correspondantes ............................................................ 75 Mémoire d’ingénieur/Master Professionnel viii Hadnane OURO-AGBAKE LISTE DES TABLEAUX LISTE DES TABLEAUX Pages CHAPITRE 1 : Tableau 1.1: Densité de puissance...................................................................................... 11 Tableau 1.2 : Les classes de vent........................................................................................ 13 CHAPITRE : 2 Tableau 2.1: Horizons et applications de la prévision........................................................ 31 Tableau 2.2: Les fonctions noyaux ..................................................................................... 45 CHAPITRE : 3 Tableau 3.1: fiche des données ........................................................................................... 59 Tableau 3.2 : Les statistiques du vent ................................................................................. 62 Tableau 3.3: Matrice de corrélation des variables d'entrées ............................................... 63 Tableau 3.4: Variables d'entrée .......................................................................................... 63 Tableau 3.5: les différentes configurations d'entrée ........................................................... 64 Tableau 3.6: Performances SVR; configuration 1.............................................................. 65 Tableau 3.7: Performances SVR; configuration 2.............................................................. 66 Tableau 3.8 : Performances SVR; configuration 3............................................................. 66 Tableau 3.9: Performances SVR; configuration 4.............................................................. 66 Tableau 3.10: Performances SVR; configuration 5............................................................ 66 Tableau 3.11 : Performances SVR; configuration 6........................................................... 66 Tableau 3.12 : Performances SVR; configuration 7........................................................... 67 Tableau 3.13 : Performances SVR; configuration 8........................................................... 67 Tableau 3.14 : Récapitulatif des performances de différentes configurations ................... 68 Tableau 3.15:Les principales caractéristiques du model choisi ......................................... 70 Tableau 3.16: Coûts du matériel et du logiciel utilisés ...................................................... 76 Tableau 3.17: Estimation financière du temps de travail ................................................... 76 Tableau 3.18 : Estimation du coût total du projet .............................................................. 76 Mémoire d’ingénieur/Master Professionnel ix Hadnane OURO-AGBAKE LISTE DES ABREVIATIONS ET ACRONYMES LISTE DES ABREVIATIONS ET ACRONYMES 𝐶𝑝 : Coefficient de puissance 𝑟 : Coefficient de corrélation ℜ : Constante de BOLTZMANN σ : Ecart-type He : Helium H : Hydrogène 𝐶 : La constante de régulation 𝛼𝑖 : Les multiplicateurs de Lagrange max : Maximisation min : Minimisation ℒ : Operateur lagrangien ∑ : Operateur de sommation 𝜀 : Taux d’erreur 𝜙 : Transformation non-linéaire 𝜆 : Rapport de vitesse de pointe 𝜉𝑖 : Variable de relâchement ALADIN : Aire Limitée Adaptation dynamique Développement international ALTM : La pression atmosphérique ANN : Artificial Neural Network ARCH : Auto-Regressive Conditional Heteroscedasticity ARIMA : Moyenne mobile intégrée régressive ARMA : Moyenne mobile auto régressive Mémoire d’ingénieur/Master Professionnel x Hadnane OURO-AGBAKE LISTE DES ABREVIATIONS ET ACRONYMES BF : Beaufort CENER : National Renewable Energy Centre CO2 : Dioxyde de carbone DWPC : La température de la rosée GARCH : Generalized Auto-Regressive Conditional Heteroscedasticity HIRLAM : High Resolution Local Area MAE : Mean Absolute Error MSE : Mean Squared Error NPW : Numeric Weather Prediction RBF : Fonction de base radiale RELH : Humidité relative du vent RMSE : Root Mean Squared Error R2 : Coefficient de détermination SO2 : Dioxyde de soufre SVM : Support Vector Machine SVR : Support Vector Regression TIME : Date et l’heure d’enregistrement des données TMPC : La température ambiante WAsP : Wind Atlas Analysis and Application Program Mémoire d’ingénieur/Master Professionnel xi Hadnane OURO-AGBAKE Introduction générale INTRODUCTION GENERALE Le développement des sources d’énergie renouvelables doit tout, ou presque, aux préoccupations écologiques liées au réchauffement climatique ainsi qu’au prix des combustibles fossiles et aux inquiétudes nées de leur probable épuisement. Les énergies fossiles conventionnelles auront une fin relativement proche et leur utilisation contribue à une dramatique dérive climatique. Passer le plus rapidement possible aux énergies renouvelables devient ainsi essentiel, tant pour des raisons économiques qu’environnementales. Parmi les nombreuses énergies renouvelables crédibles, l’énergie éolienne est l’une des plus prometteuses. Depuis plusieurs dizaines d’années, l’énergie éolienne connaît une croissance considérable, particulièrement en Europe. Cependant, la production d’énergie éolienne est dépendante de l’intensité du vent, fortement volatile, et donc caractérisée par un haut degré d’incertitude. Cette méconnaissance de la production future d’énergie a tendance à rendre la gestion du réseau électrique plus difficile. Afin d’optimiser l’exploitation de cette forme d’énergie (par une meilleure intégration dans le réseau et une réduction des coûts de production en vue d’une concurrence avec les autres sources d’énergie), la prévision à court terme de la ressource, et ainsi de la puissance en sortie d’un champ éolien, est donc essentielle. La prévision à court terme de de la vitesse du vent joue un rôle important dans la production et la distribution de l’énergie éolienne. L’objectif des chercheurs est de fournir un outil fiable de prédiction. Les recherches dans ce domaine se basent sur les approches statistiques et celles de l’intelligence artificielle. Ces dernières sont les plus utilisées pour rendre prévisibles la production d’énergie d’un parc éolien. C’est dans cet optique d’obtenir un modèle de prédiction qu’il nous a été confié dans le cadre de notre mémoire de fin d’étude pour l’obtention du diplôme d’Ingénieur Génie Electrique/ Master professionnel le thème intitulé : « ‘SUPPORT VECTOR MACHINE’ POUR LA PREDICTION DE LA VITESSE DU VENT : CAS DU SITE DE LOME ». Mémoire d’ingénieur/Master Professionnel 2 Hadnane OURO-AGBAKE INTRODUCTION GENERALE Afin d’atteindre nos objectifs, nous divisons notre travail en trois chapitres. Le premier sera consacré au processus énergétique éolien et à la problématique de la prédiction de la vitesse du vent. Le second chapitre présente une revue de littérature sur la prédiction des données de vitesse du vent puis nous poserons les bases théoriques et pratiques des méthodes des SVM que nous utiliserons dans ce travail. Le troisième chapitre présentera les résultats de la modélisation, et de la prédiction. Nous y analyserons et discuterons les résultats obtenus. Mémoire d’ingénieur/Master Professionnel 3 Hadnane OURO-AGBAKE 1. Chapitre 1 : Le processus énergétique éolien CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.1. Introduction L'utilisation de l'énergie éolienne élimine essentiellement les émissions de CO2, SO2, et autres déchets issus des centrales à charbon traditionnelles ou les déchets radioactifs dans les centrales nucléaires. En diversifiant davantage l'approvisionnement en énergie, l'énergie éolienne réduit la dépendance aux combustibles fossiles soumis à l'instabilité des prix et de l'offre, renforçant ainsi la sécurité énergétique mondiale. La plus prometteuse des sources d'énergie renouvelable, propre et fiable, l'énergie éolienne prend une part importante dans la production d'électricité dans les décennies à venir. Le but de ce chapitre est d’exposer les principes fondamentaux de l'énergie éolienne et la conception moderne des éoliennes, ainsi que quelques idées concernant la production d'énergie éolienne. Nous finirons ce chapitre par la problématique liée à la prédiction de la vitesse du vent. 1.2. Energie éolienne L'énergie éolienne est une forme convertie d'énergie solaire qui est produite par la fusion nucléaire de l'hydrogène (H) en hélium (He) dans son noyau. Le processus de fusion de H en He crée de la chaleur et le rayonnement électromagnétique sort du soleil, dans l'espace dans tous les sens. Bien que seule une petite partie du rayonnement solaire soit interceptée par la terre, elle fournit presque tous les besoins énergétiques de la terre. Estimée à environ 1,8 × 1011 MW, l'énergie solaire totale reçue par la terre, seulement 2% (c'est-à-dire 3,6 × 109 MW) est convertie en énergie éolienne et environ 35% de l'énergie éolienne est dissipée à moins de 1000 m de la surface terrestre [36]. Par conséquent, l'énergie éolienne disponible qui peut être convertie en d'autres formes d'énergie est environ 1,26 × 109 MW. Parce que cette valeur représente 20 fois le taux de consommation d'énergie mondiale actuelle, l'énergie éolienne pourrait en principe répondre à l'ensemble des besoins énergétiques du monde. En tant que source d'énergie inépuisable et gratuite, il est disponible et abondante dans la plupart des régions de la terre. En outre, une utilisation plus étendue de l’énergie du vent Mémoire d’ingénieur/Master Professionnel 5 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN aiderait à réduire la demande de combustibles fossiles, qui pourrait s'épuiser au cours de ce siècle, selon leurs consommations actuelles. De plus, le coût du kWh d'énergie éolienne est très inférieur à celui de l'énergie solaire photovoltaïque [15]. Ainsi, en tant que source d'énergie la plus prometteuse, on pense que l'énergie éolienne joue un rôle crucial dans l'approvisionnement énergétique mondial au XXIe siècle. 1.3. Les origines du vent Le vent résulte du mouvement de l'air dû aux gradients de pression atmosphérique. Le vent s'écoule des régions de haute pression vers les régions de basse pression. Plus le gradient de pression atmosphérique est grand, plus la vitesse du vent est élevée et plus la puissance éolienne qui peut être captée du vent au moyen de machines de conversion d'énergie. La relation de Van Der Walls (1.1) [1], [4], [12] montre qu'en raison des gradients de pression résultant essentiellement des différences de températures d'un point à un autre du globe, les masses d'air se déplacent dans toutes les directions constituant ainsi le phénomène du vent.  n 2   P v  n   nT  v 2  v   (1.1) Où : - 𝑃𝑣 est la pression dans le volume 𝑣 ; 𝑛 est le nombre total de moles ; 𝑣 est le volume total de gaz ; 𝛼 et 𝛽 sont des caractéristiques du gaz ; ℜ est la constante de BOLTZMANN des gaz parfaits ; 𝑇 est la température de l’ensemble du volume 𝑣. La génération et le mouvement du vent sont compliqués en raison d'un certain nombre de facteurs. Parmi eux, les facteurs les plus importants sont l’ensoleillement inégal de la terre, la force de Coriolis dû à la rotation de la terre, et les conditions géographiques locales. Mémoire d’ingénieur/Master Professionnel 6 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.3.1. Ensoleillement inégal de la terre Parmi tous les facteurs affectant la production d'énergie éolienne, le rayonnement solaire inégal sur la surface de la terre est le plus important et le plus critique. L'inégalité du rayonnement solaire peut être attribuée à quatre raisons qui sont : - L’équateur reçoit une quantité plus importante d’énergie solaire par unité de surface que les pôles, du fait que la terre est une sphère qui tourne autour du soleil dans le même plan que son équateur. Il en résulte un gradient de pression des pôles à l’équateur, et donc un mouvement d’air. - L’inclinaison de l’axe de la terre d’environ 23.5 par rapport à son plan écliptique. - La différence du taux d’absorption ou de réflexion du rayonnement solaire des matériaux sur la surface de la terre. - La surface topographique de la terre entraine un rayonnement solaire différent sur les côtés ensoleillés et ombragés. 1.3.2. La force de Coriolis La rotation de la Terre est un autre facteur important affectant la direction du vent et sa vitesse. La force de Coriolis, qui est générée par la rotation de la Terre, dévie la direction des mouvements atmosphériques. Dans l’hémisphère nord, le vent est dévié à droite et dans l’hémisphère sud à gauche. La force de Coriolis dépend de la latitude ; il est nul à l'équateur et atteint les valeurs maximales aux pôles. De plus, la déformation du vent dépend aussi de la vitesse du vent ; plus le vent souffle fort, plus il est dévié [52]. 1.3.3. La géographie locale Dans les basses couches de l’atmosphère (au-dessous de 1000m), la friction de l’air contre la surface du terrain influence la vitesse du vent. L’écoulement de celui-ci dépend alors des obstacles rencontrés (rugosité du terrain) et des contours du paysage, lesquels peuvent créer des turbulences et dégrader la productivité ou, au contraire, donner lieu à des effets Mémoire d’ingénieur/Master Professionnel 7 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN accélérateurs : effet de tunnel ou de colline. 1.4. Les caractéristiques de l’énergie éolienne L'énergie éolienne est une forme particulière d'énergie cinétique dans l'air lorsqu'il s'écoule. L'énergie éolienne peut être soit converti en énergie électrique par des machines de conversion de puissance ou directement utilisé pour pomper l'eau… 1.4.1. Puissance éolienne L'énergie cinétique existe chaque fois qu'un objet d'une masse donnée est en mouvement de translation ou de rotation. Lorsque l'air est en mouvement, l'énergie cinétique de l'air peut être déterminée par la relation (1.2). Ec  1 2 mv 2 (1.2) Où : - 𝑚 est la masse d'air ; 𝑣 la vitesse moyenne du vent sur une période de temps appropriée. La puissance éolienne peut être obtenue en différenciant l'énergie cinétique de la relation (1.2) du vent par rapport au temps. On obtient la relation (1.3). Pw  1 2 mv 2 (1.3) Cependant, seule une petite partie de l'énergie éolienne peut être convertie en puissance électrique. Lorsque le vent traverse une éolienne et entraîne les lames, le débit massique du vent correspondant est donné par la relation (1.4). m   Av (1.4) Où : -  est la densité de l'air ; - A est la surface balayée par les pales ; Mémoire d’ingénieur/Master Professionnel 8 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN En substituant (1.4) dans (1.3), la puissance disponible dans le vent 𝑃𝑤 peut être exprimée par la relation (1.5). Pw  1  Av 3 2 (1.5) La relation (1.5) révèle qu’une grande puissance éolienne nécessite une vitesse de vent plus élevée, une plus grande longueur des pales pour obtenir une plus grande zone de balayage, et une densité de l'air plus élevée. On voit également que la production d'énergie éolienne est proportionnelle à la puissance cubique de la vitesse moyenne du vent, une petite variation de la vitesse du vent peut entraîner un grand changement dans l'énergie éolienne. 1.4.1.1. Zone de balayage des pales Comme le montre la Figure 1.1, la zone balayée par les pales peut être calculée à partir de la relation (1.6). A    l  r   r 2    l 2  2r    2 (1.6) Où : - 𝑙 est la longueur des pales ; 𝑟 est le rayon du moyeu. Ainsi, en doublant la longueur des lames de vent, la zone balayée peut être augmentée par le facteur 4. Mémoire d’ingénieur/Master Professionnel 9 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN Figure 1.1: Surface de balayage des pales [52] 1.4.1.2. Densité de l’air Un autre paramètre important qui affecte directement la production d'énergie éolienne est la densité de l'air, qui peut être calculée à partir de l'équation d’état exprimée par la relation (1.7). pV  nRT (1.7) où : - 𝑝 est la pression d'air locale en pascal ; - R est la constante de gaz (287 J / kg.K pour l'air) ; - T est la température de l'air locale en K. - V est le volume en m3 ; La densité, nombre de moles par unité de volume est donnée par la relation (1.8).  1.4.1.3. p RT (1.8) Densité de puissance éolienne La densité de l'énergie éolienne est un indice complet de l'évaluation de la ressource éolienne sur un site particulier. C'est la puissance éolienne disponible dans le flux d'air à Mémoire d’ingénieur/Master Professionnel 10 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN travers une zone d'unité transversale perpendiculaire dans une période de temps unitaire. Les classes de la densité de puissance du vent à deux hauteurs de mesure de vent standard sont énumérées dans Tableau 1.1. Tableau 1.1: Densité de puissance Classe de 10 m de hauteur 50 m de hauteur densité de Densité de Vitesse Densité de Vitesse puissance puissance moyenne du puissance moyenne du éolienne vent (m/s) éolienne vent (m/s) (W/m2) (W/m2) 1 <100 <4,4 <200 <5,6 2 100-150 4,4-5,1 200-300 5,6-6,4 3 150-200 5,1-5,6 300-400 6,4-7,0 4 200-250 5,6-6,0 400-500 7,0-7,5 5 250-300 6,0-6,4 500-600 7,5-8,0 6 300-350 6,4-7,0 600-800 8,0-8,8 7 >400 >7,0 >800 >8,8 1.4.2. Les caractéristiques du vent Le vent varie avec les emplacements géographiques, l'heure du jour, la saison et la hauteur au-dessus la surface de la terre, la météo et les formes de relief locales. La compréhension des caractéristiques du vent aidera à optimiser la conception des éoliennes, à développer des techniques de mesure de vent, et à sélectionner des sites de parcs éoliens. 1.4.2.1. La vitesse du vent La vitesse du vent est l'une des caractéristiques les plus critiques de la production d'énergie éolienne. En fait, la vitesse du vent varie à la fois dans le temps et dans l'espace, déterminée par de nombreux facteurs tels que les conditions géographiques et météorologiques. Les données de vitesse du vent mesurées sont généralement traitées par les méthodes statistiques. Mémoire d’ingénieur/Master Professionnel 11 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.4.2.2. Distribution de Weibull La variation de la vitesse du vent sur un site particulier peut être mieux décrite en utilisant la fonction distribution de Weibull [51], qui illustre la probabilité de différentes vitesses moyennes du vent se produisant sur le site pendant une période de temps. La distribution de Weibull est donnée par la relation (1.9). k  k   v k 1   v  . exp       f(v)   c   c    c   0 v0 (1.9) v0 où : - 𝑐 est le facteur d'échelle qui est étroitement lié à la vitesse moyenne du vent ; 𝑘 est le facteur de forme qui est une mesure de la largeur de la distribution. Ces deux paramètres peuvent être déterminés à partir de l'analyse statistique des données de vitesses du vent mesurées sur le site [52]. 1.4.2.3. La turbulence La turbulence du vent est la fluctuation de la vitesse du vent dans des échelles de temps courtes, en particulier pour la composante de vitesse horizontale. La turbulence du vent a un fort impact sur la fluctuation de la puissance de l’aérogénérateur. La turbulence lourde peut générer de grandes charges de fatigue dynamiques agissant sur l’aérogénérateur et ainsi réduire la durée de vie prévue de ce dernier. Dans la sélection des sites de parcs éoliens, la connaissance de l'intensité de la turbulence éolienne est cruciale pour la stabilité de la production d'énergie éolienne. 1.4.2.4. La direction du vent La direction du vent est l'une des caractéristiques du vent. Les données statistiques des directions du vent sur une longue période de temps sont très importantes dans la sélection du site du parc éolien et la disposition des éoliennes dans le parc éolien. Mémoire d’ingénieur/Master Professionnel 12 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.4.2.5. Le cisaillement du vent Le cisaillement du vent est un phénomène météorologique dans lequel la vitesse du vent augmente avec l’altitude. L'effet de la hauteur sur la vitesse du vent est principalement dû à la rugosité à la surface de la Terre et peut être estimée en utilisant l’équation de puissance de Hellmann exprimée par la relation (1.10), équation qui relie les vitesses du vent à deux hauteurs différentes [46].   z  v( z )  v( z0 ).    z0  (1.10) où : - 𝑧 est la hauteur au-dessus de la surface de la terre ; 𝑧0 est la hauteur de référence pour laquelle 𝑣 (𝑧0 )vitesse du vent est connue ; 𝛼 est le coefficient de cisaillement du vent. En pratique, 𝛼 dépend d'un certain nombre de facteurs, y compris la rugosité de l'environnement, le paysage, la hauteur, l'heure du jour, la saison et les lieux. Le coefficient de cisaillement du vent est généralement plus faible le jour et plus élevé la nuit. Les résultats empiriques indiquent que le cisaillement du vent suit souvent la "loi de puissance 1/7" (c'est-à-dire 𝛼 = 1/7) [49]. 1.4.3. Les classes de vent On catégorise les vents selon diverses échelles (tableau 1.2). Il est à noter que les vitesses terrestres et maritimes ne sont pas équivalentes. La vitesse s’exprime en kilomètre à l’heure ou en nœuds. Tableau 1.2 : Les classes de vent Force (BF) 0 Vitesse Termes en nœuds Calme <1 Mémoire d’ingénieur/Master Professionnel Vitesse en km/h <1 Etat de la mer Effets à terre La mer est comme un La fumée monte miroir verticalement 13 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1 2 Très légère brise Légère brise 1-3 4-6 1-5 6-11 Quelques rides Vaguelettes ne déferlant pas La fumée indique la direction du vent On sent le vent sur le visage, les feuilles bougent Les drapeaux flottent 3 Petite brise (vent faible) 7-10 12-19 Les moutons bien. Les feuilles sont apparaissent sans cesse en mouvement 4 5 6 7 Jolie brise (vent modéré) Bonne brise (vent assez fort) Vent frais (vent fort) Grand vent frais (vent très fort) 11-15 16-20 20-28 29-38 (vent nombreux moutons 21-26 39-49 50-61 62-74 balancent. Les éventuellement sommets de tous les embruns arbres sont agités blanche, lame, Trainées d’écume, lames déferlantes à la crête des lames, trainées d’écume tempétueux) Lames déferlantes 9 Fort coup de vent 41-47 75-88 grosses à énormes, visibilité réduite par les embruns Très grosses lames à 10 Tempête 48-55 89-102 longue crête en panache. Surface des Mémoire d’ingénieur/Master Professionnel branches plient moutons, Tourbillons d’écumes 34-40 s’envolent, les petites Les petits arbres embruns 27-33 Les poussières Vagues modérées, Crête d’écume Coup de vent 8 Petites vagues, 14 On entend siffler le vent Tous les arbres s’agitent. Efforts pour marcher contre le vent Quelques branches cassent. La marche contre le vent est difficile Le vent peut endommager les bâtiments Rare sur les terres. Gros dégâts Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN eaux blanches. Visibilité réduite Lames exceptionnellement 11 Violente tempête 56-63 103-117 hautes. Mer recouverte Très rare sur les terres. de bancs d’écume Très gros dégâts blanche. Visibilité réduite Air plein d’écume et d’embruns. Mer 12 Ouragan > 63 > 117 entièrement blanche. Visibilité fortement Très rare sur les terres. Dégâts très importants réduite 1.5. Aérogénérateurs Un aérogénérateur, encore appelé une éolienne est une machine de conversion d'énergie qui convertit l’énergie cinétique du vent en énergie mécanique, puis cette dernière en énergie électrique. Dans les trois dernières décennies, des progrès remarquables dans la conception des éoliennes ont été réalisés avec les développements technologiques modernes. Divers concepts d'éoliennes ont été développés et construits pour maximiser la production d'énergie éolienne, minimisant le coût de la turbine, et augmentant l’efficacité et la fiabilité des turbines. 1.5.1. Configuration d’une éolienne La plupart des grandes éoliennes modernes sont des turbines à axe horizontal, à trois pales. Comme le montre la figure 1.2, une éolienne est composée d'une nacelle positionnée audessus d'un mat, abritant la plupart des composants de l’éolienne. Trois pales (non illustrées) montées sur le moyeu. L’ensemble pales et moyeu forme le rotor. Ce dernier est connecté via l'arbre principal à la boîte de vitesse. Mémoire d’ingénieur/Master Professionnel 15 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN Le rotor du générateur est connecté à l'arbre de sortie de la boîte de vitesses. Ainsi, la vitesse de rotation lente du moyeu est élevée à une vitesse de rotation élevée désirée du rotor du générateur. En utilisant le système de contrôle de tangage, chaque pale est inclinée individuellement pour optimiser l'angle d'attaque de la pale pour permettre une capture d'énergie plus élevée en fonctionnement normale et pour protéger les composants de la turbine (pales, mat, etc.) contre les dommages dans les situations d'urgence. Avec les informations de retour telles que la direction instantanée du vent et la vitesse de la girouette, le système de contrôle de lacet fournit le contrôle d'orientation du lacet pour garder constamment la turbine face au vent. Figure 1.2: Configuration d'un aérogénérateur [52] 1.5.2. Classification des aérogénérateurs Les aérogénérateurs peuvent être classés en fonction de la configuration du générateur, du chemin d'écoulement de l'air par rapport au rotor de la turbine, de la capacité de la turbine, du mode d'alimentation et de l'emplacement de l'installation de l’aérogénérateur. 1.5.2.1. Eoliennes à axe horizontal et a axe vertical En considérant la configuration de l'axe de rotation des pales de rotor, les éoliennes peuvent être classées à axe horizontal ou à axe vertical. La plupart des éoliennes commerciales Mémoire d’ingénieur/Master Professionnel 16 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN appartiennent aujourd'hui au type à axe horizontal, dans lequel l'axe de rotation des pales est parallèle au flux du vent. Les avantages de ce type d'éoliennes comprennent le rendement élevé de la turbine, haute densité de puissance et faible coût par unité de puissance de sortie. Les pales des éoliennes à axe vertical tournent par rapport à leurs axes verticaux perpendiculaires au sol. Un avantage significatif de l'éolienne à axe vertical est que la turbine peut accepter le vent de n'importe quelle direction et donc aucun contrôle de lacet n'est nécessaire. 1.5.2.2. Eoliennes à vent ascendant et descendant Selon sur la configuration du rotor par rapport à la direction du vent, les éoliennes à axe horizontal peuvent être classées à vent ascendant ou descendant. La majorité des éoliennes à axe horizontal sont des éoliennes à vent ascendant. Le principal avantage des conceptions à vent ascendant est d'éviter la distorsion du champ d'écoulement comme le vent passe à travers le mat et la nacelle. Pour une éolienne descendant, le vent souffle d'abord à travers la nacelle et le mat puis les pales du rotor. 1.5.2.3. Capacité de l’éolienne Les éoliennes peuvent être divisées en un certain nombre de grandes catégories en vue de leur capacité nominale : micro, petites, moyennes, grandes et très grandes éoliennes. Il est accepté qu'une turbine dont la puissance nominale est inférieure à plusieurs kilowatts puisse être catégorisée comme micro-éolienne [17]. Les micro-éoliennes ont besoin de vitesses de démarrage relativement bas et fonctionnent à des vitesses de vent modérées, les petites éoliennes se réfèrent généralement aux turbines avec une puissance de sortie inférieure à 100 kW [14], les éoliennes les plus courantes ont des tailles moyennes avec des puissances nominales de 100 kW à 1 MW, les éoliennes de type 1 MW jusqu'à 10 MW peuvent être classées en tant que grandes éoliennes et enfin Les éoliennes de très grande taille sont référées aux éoliennes d'une capacité supérieure à 10 MW. Mémoire d’ingénieur/Master Professionnel 17 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.5.2.4. Eoliennes à entrainement direct et à engrenages Selon la condition d’entrainement dans un système de générateur, les éoliennes peuvent être classées comme éolienne à entraînement direct ou à engrenages. Pour augmenter la vitesse de rotation du rotor afin d’obtenir une puissance plus élevée, une éolienne à engrenages utilise généralement une boîte de vitesses. Les avantages du générateur à engrenages incluent un coût inférieur, une taille et un poids plus petits. Cependant, l'utilisation d’une boîte de vitesses peut réduire considérablement la fiabilité de l'éolienne et augmenter le niveau de bruit de l’éolienne et les pertes mécaniques. Dans les aérogénérateurs à entrainement direct, l'arbre de générateur est directement relié au rotor Par conséquent, le concept d'entraînement direct est plus supérieur en termes d'efficacité énergétique, de fiabilité et de conception simplifié. 1.5.2.5. Éoliennes en réseau et hors réseau Les éoliennes peuvent être utilisées pour des applications en réseau ou hors réseau. La plupart des éoliennes de taille moyenne et presque toutes les grandes éoliennes sont utilisées dans des applications liées au réseau. L'un des avantages évidents pour les systèmes d'éoliennes en réseau est qu'il n'y a pas de problème de stockage d'énergie. 1.5.2.6. Éoliennes terrestres et marines Les éoliennes terrestres ont une longue histoire de développement. Leurs avantages sont, le coût inférieur des fondations, l'intégration plus facile avec le réseau électrique, le coût inférieur dans la construction du tour et de l’aérogénérateur, l’installation, et un accès plus commode pour les opérations et la maintenance. Les éoliennes en mer ont une excellente ressource éolienne en termes d'intensité de l'énergie éolienne et de continuité. Une éolienne installée en mer peut produire une puissance plus élevée et fonctionner plus d'heures chaque année par rapport à la même turbine installée sur terre. Mémoire d’ingénieur/Master Professionnel 18 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.5.3. Les paramètres de l’énergie éolienne Le dimensionnement des parcs éoliens doit tenir compte de certains paramètres : le coefficient de puissance, la limite de Lanchester-Betz, la courbe de puissance des aérogénérateurs… 1.5.3.1. Coefficient de puissance La conversion de l'énergie éolienne en énergie électrique implique principalement deux étapes : dans la première étape, l'énergie cinétique dans le vent est convertie en énergie mécanique pour mouvoir l'arbre de l’éolienne. Les dispositifs de conversion à ce stade sont les pales. Pour maximiser la capture de l'énergie éolienne, les pales doivent être soigneusement conçues. Le coefficient de puissance 𝐶𝑝 traite de l'efficacité de conversion dans cette première étape, défini comme le rapport de la puissance mécanique réellement capturée par les pales à la puissance disponible dans le vent comme la relation (1.11). Cp  Pmec Pmec  1 Pw  Av 3 2 (1.11) L’existence de diverses pertes aérodynamiques dans les systèmes d'éoliennes, entraine un coefficient de puissance Cp beaucoup plus bas que sa limite théorique, allant généralement de 30 à 45% [49]. Dans la deuxième étape, l'énergie mécanique capturée par les pales est encore convertie en énergie électrique via un générateur. A ce stade, l'efficacité de conversion est déterminée par plusieurs paramètres dus aux pertes de puissance dans la boite de vitesse, pertes mécaniques et électriques dans le générateur. 1.5.3.2. Limite de Betz L'efficacité maximale théorique d'une éolienne idéale a été déterminée par l’allemand Albert Betz [6] en 1920. Il a été révélé qu'aucune éolienne ne pouvait convertir plus de 16/27 (59,26%) de l'énergie cinétique du vent en énergie mécanique. Mémoire d’ingénieur/Master Professionnel 19 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN En effet, Considérons le système éolien à axe horizontal représenté sur la figure 1.3 sur lequel on a représenté la vitesse 𝑣1 du vent en amont de l'aérogénérateur et la vitesse 𝑣2 en aval. En supposant que la vitesse du vent traversant le rotor est égale à la moyenne entre la vitesse du vent non perturbé à l'avant de l'éolienne 𝑣1 et la vitesse du vent après passage à travers le rotor 𝑣2 , soit 𝑣1 +𝑣2 2 , la masse d'air en mouvement de densité 𝜌 traversant la surface 𝐴 balayée des pales en une seconde est donnée par la relation (1.12). m  A  v1  v2  2 (1.12) Figure 1.3: Tube de courant d’air autour d’un aérogénérateur [2] La puissance 𝑃𝑚 [relation (1.13)] alors extraite, s'exprime par la moitié du produit de la masse et de la diminution de la vitesse du vent (seconde loi de Newton). Pm  m  v12  v22  2 (1.13) Soit en remplaçant 𝑚 par son expression (1.12), la relation (1.13) devient (relation (1.14)). Pm  Mémoire d’ingénieur/Master Professionnel  A  v1  v2   v12  v22  4 (1.14) 20 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN Un vent théoriquement non perturbé traverserait cette même surface 𝐴 sans diminution de vitesse, soit à la vitesse 𝑣1 , la puissance 𝑃𝑚𝑡 correspondante serait alors la puissance obtenue par la relation (1.5), soit : 1  Av13 avec v1  v 2 Le ratio entre la puissance extraite du vent et la puissance totale théoriquement disponible est alors donné par la relation (1.15). Pm  Pmt 2  v1    v1   1   1      v2    v2   2 (1.15) La représentation de la caractéristique correspondante à l'équation (1.15), sur la figure 1.4, montre que le ratio (relation (1.15)) appelé aussi coefficient de puissance 𝐶𝑝 présente un maxima de 16/27 soit 0,59 [2]. C'est cette limite théorique appelée limite de LanchesterBetz qui fixe la puissance maximale extractible pour une vitesse de vent donnée. Figure 1.4: Coefficient de puissance Mémoire d’ingénieur/Master Professionnel 21 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.5.3.3. Courbe de puissance La courbe de puissance d'une éolienne affiche la puissance de sortie de l’éolienne en fonction de la vitesse moyenne du vent. Les courbes de puissance sont généralement déterminées à partir des mesures sur le terrain. Comme le montre la figure 1.5, l'éolienne commence à produire de l'énergie utilisable à un minimum de vitesse du vent, définie comme la vitesse d'enclenchement. La puissance augmente continuellement avec l'augmentation de la vitesse du vent jusqu'à atteindre un point saturé, auquel la puissance de sortie atteint sa valeur maximale, définie comme la puissance de sortie nominale. En conséquence, la vitesse à ce stade est définie comme la vitesse nominale. À la vitesse nominale, l'augmentation de la vitesse du vent n'augmentera pas la puissance de sortie en raison de l'activation de la commande de puissance. Lorsque la vitesse du vent devient trop grande pour potentiellement endommager l'éolienne, l'éolienne doit s’arrêter immédiatement. Cette vitesse du vent est définie comme la vitesse de coupure. Ainsi, les vitesses d'enclenchement et de coupure définissent les limites de fonctionnement de l'éolienne. Figure 1.5: Courbe de puissance [52] Mémoire d’ingénieur/Master Professionnel 22 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.5.3.4. Rapport de vitesse de pointe Le rapport de vitesse de pointe est un facteur extrêmement important dans la conception des éoliennes, défini comme le rapport de la vitesse tangentielle à l'extrémité de la pale et la vitesse réelle du vent, soit la relation (1.16).  l  r  v (1.16) où : - 𝑙 est la longueur des pales ; 𝑟 est le rayon du moyeu ; 𝜔 est la vitesse angulaire des pales. Si la vitesse angulaire 𝜔 de la pale est trop petite, la plus grande partie du vent peut passer sans être perturbée bien que la lame ait balayé la zone, rendant peu le travail utile sur les pales. Au contraire, si 𝜔 est trop grand, les lames en rotation rapide peuvent bloquer le flux de vent réduisant l'extraction de puissance. Par conséquent, il existe une vitesse angulaire optimale à laquelle l'extraction de la puissance maximale est atteinte. Pour une éolienne à 𝑛 pales, la vitesse angulaire optimale peut être approximativement déterminée par la relation (1.17), [37]. opt  2 v nL (1.17) Où : - 𝐿 est la longueur du courant d'air ascendant et descendant fortement perturbé du rotor. En remplaçant la relation 1.17 dans la relation 1.16, le rapport optimal de vitesse de pointe devient la relation (1.18). opt  2  l  r    n  L  (1.18) Empiriquement, le rapport (𝑙 + 𝑟) / 𝐿 est égal à environ 2. Ainsi, pour les éoliennes à trois pales (c'est-à-dire n = 3), 𝜆𝑜𝑝𝑡 ≈ 4 𝜋 / 3 [52]. Mémoire d’ingénieur/Master Professionnel 23 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN Si la pale aérodynamique est conçue avec soin, le rapport de vitesse de pointe optimal peut être environ 25-30% plus élevé que la valeur optimale calculée ci-dessus. Par conséquent, une éolienne à trois pales aurait un rapport de vitesse de pointe optimal. 1.5.3.5. Facteur de capacité de l'éolienne En raison de la nature intermittente du vent, les éoliennes ne produisent pas de la puissance tout le temps. Ainsi, un facteur de capacité d'une éolienne est utilisé pour fournir une mesure de la puissance réelle de l'éolienne pendant une période de temps donnée. Un facteur de capacité raisonnable serait de 0,25-0,30 et un très bon facteur de capacité serait d'environ 0,40 [38]. 1.5.4. Commandes de l’éolienne Les systèmes de contrôle des éoliennes jouent un rôle important pour assurer le fonctionnement fiable et sûr de l’aérogénérateur et pour optimiser la capture de l'énergie éolienne. Les principaux systèmes de contrôle dans une éolienne sont : système d’orientation des pales « pitch », le contrôle de décrochage « stall » (passive et active), le contrôle de lacet « yaw ». Dans des conditions de vitesse de vent élevée, la puissance de sortie d'une éolienne peut dépasser sa valeur nominale. Ainsi, le contrôle de puissance est nécessaire pour maintenir la puissance de sortie dans les fluctuations admissibles afin éviter des dommages à l’éolienne et stabiliser la puissance de sortie. Il y a deux stratégies de contrôle principales dans le contrôle de puissance : contrôle d’orientation des pales et contrôle de décrochage. 1.5.4.1. Système d’orientation des pales « pitch » Le système de contrôle de tangage est une partie essentielle de l'éolienne car système règle non seulement continuellement l’orientation des pales de l'éolienne pour améliorer l'efficacité de la conversion de l'énergie éolienne et la stabilité de la production d'énergie, mais sert également de système de sécurité en cas de vents forts ou situations d'urgence. Il est nécessaire que même en cas de panne de courant du réseau, les pales du rotor soient Mémoire d’ingénieur/Master Professionnel 24 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN toujours orientées dans leurs positions optimales en utilisant soit la puissance des batteries de secours ou des condensateurs. Les premières techniques de contrôle actif de l’orientation des pales utilisaient des vérins hydrauliques pour contrôler toutes les pales simultanément. Cependant, ces techniques de contrôle de pas collectif n’ont pas pu satisfaire complètement à toutes les exigences de la régulation de l'angle d'inclinaison des pales, en particulier pour les éoliennes de l’ordre des MW car chaque pale subit différentes charges à différentes positions de rotation. Par conséquent, des techniques de contrôle plus précis de chaque pale ont été développées et mises en œuvre, permettant de contrôler les charges aérodynamiques asymétriques sur les pales, ainsi que les charges structurelles dans les structures non rotatives tel que la flexion latérale du mat. Dans un tel système de contrôle, chaque pale est équipée de son propre actionneur de pas, capteurs et contrôleur. Dans l'industrie de l'énergie éolienne d'aujourd'hui, il existe principalement deux types de systèmes de contrôle de l’orientation des pales : systèmes à commande hydraulique et à commande électrique. 1.5.4.2. Contrôle de décrochage « stall » Outre le contrôle de l’orientation des pales, le contrôle du décrochage est une autre approche pour contrôler et protéger les éoliennes. Le concept de contrôle de décrochage repose sur la régulation de la puissance en calant les pales une fois la vitesse nominale atteinte. Le contrôle de décrochage peut être divisé en approches de contrôle passif et actif. Le contrôle de décrochage passif est essentiellement utilisé dans les éoliennes dans lesquelles les pales sont boulonnées au moyeu à un angle d'installation fixe. Dans une éolienne à régulation passive, la régulation de puissance repose sur les caractéristiques aérodynamiques des pales. A vitesse basse et modérée du vent, la turbine fonctionne près de l'efficacité maximale. A vitesse haute, la turbine est automatiquement contrôlée au moyen de pales calées à limiter la vitesse de rotation et la puissance de sortie, protégeant la Mémoire d’ingénieur/Master Professionnel 25 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN turbine des vitesses excessives du vent. Par rapport à la commande d’orientation des pales, un système de contrôle de décrochage passif a une structure simple et évite d'utiliser un système de contrôle complexe, conduisant à une grande fiabilité du système de contrôle. En outre les fluctuations de puissance sont plus faibles pour les turbines à contrôle de décrochage. Cependant, cette méthode de contrôle présente certains inconvénients, tels que faible efficacité, l'exigence d'équipement externe au démarrage de la turbine, plus de charges dynamiques agissant sur les pales, la nacelle et le mat, dépendance à des freins fiables pour la sécurité de l'opération. Par conséquent, cette technique de contrôle a été principalement utilisée pour les petites et moyennes éoliennes. Depuis que la capacité des éoliennes est entrée dans la gamme de puissance multi-mégawatts au cours des dernières années, le contrôle de l’orientation (pitch) est devenu dominant sur le marché des aérogénérateurs. La technique de contrôle de décrochage actif a été développée pour les grandes éoliennes. Une éolienne à décrochage actif comporte des pales de décrochage associées à un système d’orientation des pales (pitch). Comparé au contrôle de décrochage passif, le contrôle actif fournit plus de précision dans le contrôle de la puissance de sortie et maintient la puissance nominale à des vitesses de vent élevées. Cependant, avec l'ajout du mécanisme de contrôle de tangage, le contrôle de calage actif augmente le coût de la turbine et diminue la fiabilité du fonctionnement. 1.5.4.3. Contrôle du lacet Afin de maximiser la production d'énergie éolienne et de minimiser les charges asymétriques agissant sur les pales et le mat, une éolienne à axe horizontal doit être orientée de sorte à avoir le rotor contre le vent en utilisant un système de contrôle de lacet actif. Comme les systèmes de tangage (pitch), les systèmes de lacet peuvent être entraînés électriquement ou hydrauliquement. Dans les éoliennes modernes, le contrôle du lacet est effectué par des moteurs électriques. Mémoire d’ingénieur/Master Professionnel 26 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN 1.6. Problématique de la prédiction de la vitesse du vent D’après tout ce qui précède, on conçoit aisément que la puissance électrique d’origine éolienne produite par un système de conversion d’énergie cinétique du vent en énergie électrique est liée aux caractéristiques du système de conversion et à la variation temporelle du vent [3]. Pour une bonne caractérisation du site d’exploitation de l’énergie électrique d’origine éolienne, le choix optimal des caractéristiques du système de conversion de cette énergie est facile. Cependant, si les caractéristiques du système de conversion de l’énergie du vent en énergie électrique sont connues, seule une maîtrise des variations du vent est indispensable pour une exploitation optimale de cette énergie. Le vent est caractérisé par sa direction et sa vitesse qui sont toutes des variables aléatoires, imprévisibles et non linéaires. Les systèmes de conversion de l’énergie du vent sont dotés des dispositifs pour mesurer la direction du vent et adapter rapidement la direction de l’axe du rotor pour se placer face au vent [28]. La direction du vent n’a donc que fort peu d’influence sur la production d’électricité, d’autant plus que généralement, les vents ont tendance à avoir une ou deux directions dominantes pour lesquelles la majeure partie de l’énergie est produite. Ainsi les caractères aléatoire et imprévisible de la puissance électrique d’origine éolienne à la sortie d’un système de conversion d’énergie du vent sont liés à la variation de la vitesse du vent. Ainsi la question insidieuse est la suivante : « Que se passe-t-il lorsque le vent cesse de souffler ?». La production d’énergie éolienne, dépendante de l’intensité du vent, fortement volatile, caractérisée par un haut degré d’incertitude, et donc une méconnaissance de la production future d’énergie, a tendance à rendre la gestion du réseau électrique plus difficile. Afin d’optimiser l’exploitation de cette forme d’énergie, la prévision de la ressource, et ainsi de la puissance en sortie d’un champ éolien, est donc essentielle et ce à des horizons allant de Mémoire d’ingénieur/Master Professionnel 27 Hadnane OURO-AGBAKE CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN l’instant immédiat à quelques heures. Il existe plusieurs méthodes qui abordent le problème de prévision des données de la vitesse du vent par des approches statistiques. Ces dernières reposent sur une modélisation mathématique de la série. Nous pouvons citer les travaux de Box & Jenkins [9], [23] comme des références pour ces méthodes. Puis viennent des outils de l’apprentissage artificiel, en anglais Machine Learning qui ont contribué dans l’appréhension des problèmes de prédictions [8], [35]. Les outils de l’apprentissage artificiel les plus utilisés pour rendre plus prévisible la vitesse du vent sur un site sont les réseaux de neurones, la logique floue, et le neuroflou [3], [40]. Cependant plus récemment, la technique des machines à vecteurs supports (SVM) a également été envisagée [24], [29], [45]. Dans ce mémoire on s’intéresse à la technique des Support Vector Régression qui sont une adaptation de l’algorithme SVM aux problèmes de régression. Les SVM (ainsi que les SVR) sont une classe d’algorithme d’apprentissage supervisé destinée à résoudre des problèmes de discrimination et de régression (SVR). Ils sont basés sur les mêmes principes d’apprentissage que les réseaux de neurones, toutefois ils possèdent l’avantage d’être plus simple à configurer. Les SVM ont rapidement été adoptés pour leur capacité à travailler avec des données de grandes dimensions, le faible nombre d'hyper paramètres, leurs garanties théoriques, et leurs bons résultats en pratique. 1.7. Conclusion Ce premier chapitre, somme toute nous a permis de comprendre les techniques d’implantation et d’exploitation d’une éolienne. Nous avons vu que pour une exploitation optimale d’un parc éolien il faut non seulement un bon dimensionnement des aérogénérateurs mais aussi une bonne maitrise du vent sur le site, surtout la vitesse de ce dernier. Mémoire d’ingénieur/Master Professionnel 28 Hadnane OURO-AGBAKE 2. Chapitre 2 : Généralités sur la prédiction de la vitesse du vent CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT 2.1. Introduction Au cours de ces dernières années, une forte augmentation de l'énergie éolienne peut être observée. En 2015, 12 800 MW de capacité éolienne ont été installés en Europe. Il y a maintenant 142 GW de capacité installée, dont 131 GW sont onshore et 11 GW offshore [47]. Avec des capacités croissantes, il y a aussi une demande croissante de fiabilité et de précision des prédictions pour diverses fins. Dans ce chapitre, nous décrivons les applications de prédiction de la puissance éolienne, les méthodes usuelles utilisées pour la prédiction de la vitesse du vent, nous terminerons par les techniques des SVM qui sont celles utilisées dans le cadre de notre travail. 2.2. Les applications de la prédiction de la vitesse du vent Diverses applications nécessitent de bonnes prédictions pour différents horizons. De l’instant actuel t0, l'horizon de prévision ∆𝑡 indique le décalage temporel, pour lequel la valeur de la puissance ou de la vitesse du vent doit être prédite à l'avance. Une application importante des prévisions est le commerce de l'énergie éolienne sur les marchés de l'électricité, ce qui n'est possible qu'avec de bonnes prévisions car l'énergie est vendue pour des points futurs dans le temps. Sur les marchés de l'électricité, il y a tendance vers des horizons de prévision plus courts. Il existe une demande pour les prévisions d'horizons de quelques minutes à quelques jours. Pour équilibrer le réseau, des prévisions précises sont également nécessaires. La tâche primordiale de maintien en stabilité de la tension et de la fréquence dans le réseau ne peut être gérée que lorsque les décisions concernant la capacité de réserve et de la distribution peuvent être prises rapidement. Les parties prenantes sont les fournisseurs d’énergie ainsi que chaque producteur d'énergie qui injecte du jus dans le réseau. Pour la planification de l'équilibrage du réseau, de bonnes prévisions sont aussi nécessaires. En général, l'énergie d'équilibrage ou de contrôle est utilisée pour régler les événements inattendus sur le réseau. Un fournisseur par conséquent a besoin de savoir combien d'énergie il peut offrir pour un certain point dans le proche avenir. Mémoire d’ingénieur/Master Professionnel 30 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Les différents horizons de prévision sont classés dans le tableau 2.1 et des exemples d'applications y sont donnés. Les méthodes actuellement disponibles pour ces prévisions sont présentées au paragraphe suivant. Tableau 2.1: Horizons et applications de la prévision [53] Horizon Plage de temps Applications Très court terme Quelques secondes – 30 minutes Trading Equilibrage réseau Régulation de charge Court terme 30 minutes – 6 heures Trading intra journalier Régulation 2.3. Moyen terme 6 heures – 1 jour Long terme 1 jour-1 semaine ou plus Optimization des prix Planification les réserves d’énergie, la maintenance Revue littéraire de la prédiction de la vitesse du vent Plusieurs méthodes ont été employées pour la prévision de l'énergie éolienne. De nombreuses littératures ont été consacrées à l'amélioration des approches de prévision de l'énergie éolienne par des chercheurs. Un certain nombre de méthodes de prévision de l'énergie éolienne ont été développées et lancées sur des sites éoliens. 2.3.1. Méthode de persistance Les modèles basés sur la persistance utilisent une hypothèse simple que la vitesse du vent ou la puissance éolienne à un certain moment futur sera la même chose que lorsque la prévision est faite [56]. La méthode de la persistance est en quelque sorte plus précise que d'autres méthodes de prévision du vent à très court terme. Mais la précision de la méthode de persistance se dégrade rapidement avec l'échelle de temps de prévision en augmentation [55]. Mémoire d’ingénieur/Master Professionnel 31 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT La méthode de la persistance est non seulement la plus simple mais aussi la méthode la plus économique en matière de prévision de vitesse du vent ou de prévision de puissance. L'électricité utilise la méthode de la persistance pour les prévisions à très court terme. Par conséquent, toute méthode de prévision développée doit d'abord être testée par rapport à la méthode de référence classique de la persistance afin de vérifier si elle peut s'améliorer par rapport aux prévisions dérivées de la persistance. 2.3.2. Modèles de prévision numérique Les méthodes numériques basées sur la prévision météorologique sont généralement utilisées pour prévoir la météo locale et les attributs du vent. Plusieurs progiciels de prévision numérique du temps (NPW) ont été développés : le modèle HIRLAM (High Resolution Local Area), le modèle hydrostatique ETA, le modèle ALADIN (Aire Limitée Adaptation dynamique Développement international) [30] [10]. Cependant, les prévisions obtenues par les modèles de prévision numérique du temps dépendent fortement des conditions initiales ; donc fournir une prévision d'ensemble augmente la fiabilité de la prédiction. Malheureusement, l'utilisation de méthodes basées sur la prévision numérique exige une grande puissance de calcul, et même avec de bonnes données d'entrées, en raison du comportement chaotique, il n'est habituellement pas possible de prévoir les attributs du vent au-delà de quelques semaines. En général, ce modèle fonctionne bien à long terme, mais les prédictions à court terme sont inférieures à celles d'autres méthodes. Étant donné que la méthode de NPW sert de plate-forme pour la prévision de l'état météorologique futur, la sortie pourrait être traitée davantage pour obtenir des estimations plus fines en ce qui concerne les attributs du vent. À cet égard, Cassola et Burlando [11] appliquent la méthode de filtrage de Kalman pour améliorer les prévisions de vitesse du vent et d'énergie éolienne à très court terme. Mémoire d’ingénieur/Master Professionnel 32 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT 2.3.3. Prévision d'ensemble La prévision d'ensemble utilise un certain nombre d'exécutions de différents modèles pour prédire un large échantillon de résultats météorologiques futurs possibles. Les résultats sont ensuite évalués en examinant la distribution de tous les « membres » de l'ensemble des variables de prévision. Une autre approche d'ensemble est l'approche multi modèle, qui utilise un certain nombre de modèles de prévision numérique du temps pour produire un ensemble [22]. Il est appelé une méthode multi-NWP. Les membres de l'ensemble proviennent de différentes variantes du même modèle de NPW (comme différents paramétrages physiques des processus physiques de la sous-grille, ou différentes conditions initiales, ou différentes techniques d'assimilation des données). Ils peuvent également provenir de modèles de NPW complètement différents. Une caractéristique intéressante de la prévision d'ensemble réside dans le fait qu'elle fournit également une estimation de la fiabilité de la prévision. L'idée est que lorsque les différents membres de l'ensemble diffèrent largement, la prévision est affectée par une grande incertitude ; quand il y a un accord plus étroit entre les prévisions des membres de l'ensemble, l'incertitude dans la prédiction est plus faible. 2.3.4. Méthodes physiques La méthode physique est basée sur la prévision numérique du temps (NPW) en utilisant la prévision météorologique des données telles que la température, la pression, la rugosité de surface et les obstacles. Le modèle de NPW est développé par les météorologues pour les prévisions météorologiques à grande échelle [34]. Les méthodes physiques sont à augmenter la résolution réelle du modèle de NPW afin d'obtenir une prévision précise. Les méthodes physiques sont effectuées sur les supercalculateurs car ils ont besoin de beaucoup de calculs. Les systèmes physiques utilisent des paramètres basés sur une description physique détaillée de l'atmosphère, pour atteindre la meilleure précision de prédiction. Habituellement, la vitesse du vent donnée par le service météorologique sur une grille grossière est transformée aux conditions sur place à l'emplacement du parc éolien. Mémoire d’ingénieur/Master Professionnel 33 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Les méthodes actuelles de prévision de l'énergie éolienne commerciale utilisent les prévisions de vent de la NPW comme données d'entrée. Les systèmes physiques, en utilisant les données d'entrée de la NPW, effectuent le raffinement nécessaire de ces données de sortie (vitesse du vent prévision) aux conditions sur site par des méthodes basées sur la physique de la limite atmosphérique inférieure couche. Un certain nombre d'approches physiques ont été introduites. Le Prediktor est développé par Risoe National Laboratory au Danemark. Il utilise WAsP (Wind Atlas Analysis and Application Program) et le programme PARK pour prendre en compte les conditions locales en utilisant les NPW de HIRLAM (High Resolution Limited Area Model). Le Previento, développé par l'Université d'Oldenburg en Allemagne a un approche physique similaire, mais utilise les NPW de Lakelmodell du Service météorologique allemand. Le LocalPred est développé par CENER (National Renewable Energy Centre) en Espagne. Le eWind, développé par AWS TrueWind Inc. aux États-Unis, a une approche physique similaire avec Prediktor mais utilise un modèle de couche limite à haute résolution (ForeWind) comme modèle de NPW pour prendre en compte les conditions locales [19]. 2.3.5. Méthodes d'approche statistique et d'apprentissage Les approches basées sur les statistiques intègrent généralement des techniques appliquées aux données de séries chronologiques, telles que les méthodes basées sur la moyenne mobile intégrée régressive (ARIMA). Il existe diverses implémentations de modèles basés sur ARIMA dans la littérature, tels que des modèles fractionnaires basés sur ARIMA et des modèles de moyenne mobile auto régressive (ARMA) pour prédire les attributs du vent simultanément [16], [26]. Les modèles basés sur ARMA sont basés sur les vitesses ou puissances de vent et les termes d'erreur passés. En plus des modèles ARMA statiques traditionnels, les chercheurs ont développé des versions dynamiques pour capturer les vitesses de vent non stationnaires inhérentes. À cet égard, Huang et Chalabi [25] utilisent les processus de marche aléatoire intégrée lissée pour modéliser les coefficients des paramètres du modèle. Récemment, on s'intéresse de plus en plus à combiner les modèles ARMA traditionnels avec d'autres approches. Dans cette veine, Mémoire d’ingénieur/Master Professionnel 34 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Liu et al. [32] développent deux approches où le modèle ARMA est lié au réseau de neurones artificiels (ANN) et aux méthodes basées sur le filtre de Kalman. Shi combinent ARMA avec ANN et des machines vectorielles de support (SVM) dans le même but. On conclut que ces modèles fonctionnent bien pour la prévision de la vitesse du vent non stationnaire dans les systèmes éoliens [44]. Les méthodes basées sur des statistiques ne sont pas seulement limitées aux modèles ARMA. Par exemple, Liu adopte le modèle modifié de Taylor Kriging et compare la qualité de la prévision aux approches basées sur l'ARMA [33]. Les chercheurs ont également étudié la possibilité de mettre en œuvre des modèles ARCH et GARCH pour modéliser la variabilité de la vitesse du vent [53]. Liu compare 10 approches ARMA-GARCH différentes pour modéliser la volatilité et conclure qu'aucun modèle ne surpasse l'autre, et indiquer que lorsque la hauteur augmente, la puissance du modèle diminue. Ces études sont importantes pour fournir la prévision d'intervalle et calculer la probabilité d'exploitation des éoliennes et la production éolienne conditionnelle prévue. D'autre part, ANN est une technique qui a été utilisée pour mapper le (s) vecteur (s) d'entrée aléatoire (s) aux sorties sans suppositions préalables d'une relation fixe. Le réseau de neurones peut apprendre en fonction des données existantes, découvrir les modèles cachés et utiliser les données passées pour en prédire les futures. Des implémentations réussies des ANN pour la prévision de la vitesse du vent existent dans la littérature [46] [36] [42]. Li et Shi [31] ont comparé trois ANN différents, à savoir l'élément linéaire adaptatif (ADALINE), la rétro-propagation directe (FFBP) et la fonction de base radiale (RBF) pendant 1 heure avant les prévisions de vitesse du vent. Le modèle a surpassé tous les autres, et que les sites éoliens devraient être évalués en fonction de la performance de différents ANN selon une approche au cas par cas. Bilgili et al., Utilisant une fonction de transfert sigmoïde logistique, une fonction de transfert linéaire comme fonction d'activation, et la propagation élastique comme approche d'apprentissage, ont développé un modèle de prévision de la vitesse du vent basé sur les données provenant des sites voisins [7]. Kani et Ardehali ont combiné les ANN et les modèles de chaînes de Markov pour développer une Mémoire d’ingénieur/Master Professionnel 35 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT approche combinée pour la prévision à très court terme de la vitesse du vent. L'approche fondée sur les chaînes de Markov est utilisée pour saisir les tendances à long terme [27]. Fadare a utilisé des données sur 200 ans obtenues à partir de 28 stations au sol et a développé un réseau de rétro propagation à trois couches, à action directe, avec différentes configurations pour prévoir la vitesse du vent au Nigeria [20]. Il existe également d'autres méthodes d'intelligence artificielle développées pour la prédiction de la vitesse du vent telles que les approches basées sur la corrélation spatiale, les approches basées sur la logique floue, les approches basées sur les transformées en ondelettes et les approches SVM [57]. 2.4. Machines à Vecteurs Support (SVM) [54] Les Support Vector Machines souvent traduit par l’appellation de Séparateur à Vaste Marge (SVM) sont une classe d’algorithmes d’apprentissage initialement définis pour la discrimination. Ils ont été ensuite généralisés à la prévision de variables quantitatives. Dans le cas de la discrimination d’une variable dichotomique, ils sont basés sur la recherche de l’hyperplan de marge optimale qui, lorsque c’est possible, classe ou sépare correctement les données tout en étant le plus éloigné possible de toutes les observations. Le principe est donc de trouver un classifieur, ou une fonction de discrimination, dont la capacité de généralisation (qualité de prévision) est la plus grande possible. Le principe de base des SVM consiste de ramener le problème de la discrimination à celui, linéaire, de la recherche d’un hyperplan optimal. Deux idées ou astuces permettent d’atteindre cet objectif : - la première consiste à définir l’hyperplan comme solution d’un problème d’optimisation sous contraintes dont la fonction objectif ne s’exprime qu’à l’aide de produits scalaires entre vecteurs et dans lequel le nombre de contraintes “actives” ou vecteurs supports contrôle la complexité du modèle. Mémoire d’ingénieur/Master Professionnel 36 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT - le passage à la recherche de surfaces séparatrices non linéaires est obtenu par l’introduction d’une fonction noyau (kernel) dans le produit scalaire induisant implicitement une transformation non linéaire des données vers un espace intermédiaire (feature space) de plus grande dimension. D’où l’appellation couramment rencontrée de machine à noyau ou kernel machine. Sur le plan théorique, la fonction noyau définit un espace hilbertien, dit auto-reproduisant et isométrique par la transformation non linéaire de l’espace initial et dans lequel est résolu le problème linéaire. Cet outil devient largement utilisé dans de nombreux types d’applications et s’avère un concurrent sérieux des algorithmes les plus performants (agrégation de modèles). L’introduction de noyaux, spécifiquement adaptés à une problématique donnée, lui confère une grande flexibilité pour s’adapter à des situations très diverses (reconnaissance de formes, de séquences génomiques, de caractères, détection de spams, diagnostics...). À noter que, sur le plan algorithmique, ces algorithmes sont plus pénalisés par le nombre d’observations, c’est-à-dire le nombre de vecteurs supports potentiels, que par le nombre de variables. Néanmoins, des versions performantes des algorithmes permettent de prendre en compte des bases de données volumineuses dans des temps de calcul acceptables. 2.4.1. Le problème de discrimination binaire Le problème abordé est celui de la discrimination binaire. Il s’agit de trouver un moyen permettant de construire une fonction de décision associant à chaque observation sa classe. Posons que les formes à discriminer sont des vecteurs x ϵ ℝP. Le problème de discrimination vise à construire un estimateur de la fonction de décision idéale D : ℝP → {-1,1}, minimisant pour toutes les observations x la probabilité d’erreur. Pour construire cet estimateur, on suppose l’existence d’un échantillon {(xi, yi), i = 1, n} (aussi appelé ensemble d’apprentissage). 2.4.2. Les SVM linéaires Un problème de discrimination est dit linéairement séparable lorsqu’il existe une fonction de décision linéaire (appelé aussi séparateur linéaire), de la forme D(x) = signe (f(x)) avec Mémoire d’ingénieur/Master Professionnel 37 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT 𝑓 (𝑥) = 𝑣 𝑇 𝑥 + 𝑎; v ϵ ℝP et a ϵ ℝ, classant correctement toutes les observations de l’ensemble d’apprentissage (D (xi) = yi, i ϵ [1, n]). La fonction f est appelée fonction caractéristique. Une généralisation des SVM au cas des observations non séparables et non linéaires se fait par introduction de variables d’écart et de noyaux. Ces différents types de problèmes sont illustrés sur la figure 2.1. A toute fonction de décision et donc aux fonctions de décision linéaire on associe une frontière de décision (l’hyperplan) exprimée par la relation (2.1).   v, a   x  p | vT x  a  0 (2.1) où : - x est le vecteur d’entrée ; - v le vecteur des paramètres (ou poids) ; - a une constante. Figure 2.1 : Quatre types de problèmes de discrimination binaire [54] Dans le cas le plus simple de discrimination de deux classes (discrimination binaire), il est alors décidé que x est de classe 1 si D(x) ≥ 0 et de classe -1 sinon. Mémoire d’ingénieur/Master Professionnel 38 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT L’idée est de chercher l’hyperplan le « plus sûr », celui qui passe au milieu des points des 2 classes d’exemples (le moins sensible à de petites variations des exemples), celui qui maximalise la distance minimum (marge) à chacune des 2 classes. 2.4.2.1. Maximisation de la marge Lorsque des observations sont linéairement séparables, il existe dans le cas général une infinité de frontières de décision linéaires séparant cet échantillon. La notion de marge offre un critère de choix parmi toutes ces solutions en admettant que maximiser la marge c’est aussi maximiser la confiance et donc minimiser la probabilité d’erreur associée au classifieur. Il existe donc un unique hyperplan optimal, [50] défini comme l'hyperplan qui maximise la marge entre les échantillons et l'hyperplan séparateur illustré sur la figure 2.2. Figure 2.2: Hyperplan optimal séparant les points de 2 classes La marge est la distance entre l'hyperplan et les échantillons les plus proches. Ces derniers sont appelés vecteurs supports. Le problème se met sous la forme de la relation (2.2) suivante :    dist  x ,   v, a     max min   v ,a  Mémoire d’ingénieur/Master Professionnel i 1, n i  39 (2.2) Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Avec dist  xi ,   v, a    vT xi  a la distance d’un point quelconque xi de l’échantillon à v l’hyperplan et min 𝑑𝑖𝑠𝑡(𝑥𝑖 , ∆(𝑣, 𝑎)) = 𝑚 est la marge. 𝑖∈[1,𝑛] En introduisant explicitement la marge comme une variable, ce problème se réécrit comme un problème d’optimisation sous contraintes exprime par la relation (2.3). max  m   v ,a    vT xi  a avec min  v i1, n     (2.3)  m   C’est un problème mal posé dans le sens où si (v, a) est une solution, (kv, ka), pour tout k>0 l’est aussi. Une manière de traiter cette difficulté est d’effectuer le changement de variable : 𝑤 = 𝑣 𝑚‖𝑣‖ et 𝑏 = La marge vaut désormais 𝑎 𝑚‖𝑣‖ Le problème se réécrit suivant la relation (2.4).   1  max    w ,b  w   T avec yi  w xi  b   1; 1 ‖𝑤‖ (2.4) i  i, n  , il s'agit donc de maximiser ‖𝑤‖−1 . La formulation dite primale des SVM s'exprime alors sous la forme de la relation (2.5).  1 2  min  2 w    w ,b  T avec y  w x  b   1; i i  (2.5) i  i , n  Ce problème d’optimisation peut se résoudre par la méthode classique des multiplicateurs de Lagrange, où le lagrangien est donné par la relation (2.6).  w, b,      n 1 2 w    i yi  wT xi  b   1 2 i 1 (2.6) où les 𝛼𝑖 ≥ 0 sont les multiplicateurs de Lagrange associés aux contraintes. Le lagrangien doit être minimisé par rapport à w et b, et maximisé par rapport à α. La formulation duale du problème est alors exprimée par la relation (2.7). Mémoire d’ingénieur/Master Professionnel 40 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT   n  1 n max   i    i j yi y j  xi .x j   2 i , j 1   i 1   n  avec  i  0;   i yi  0; i  1, n  i 1  (2.7) La solution ne dépend plus alors de p mais du nombre d’exemples n et même 𝑛𝑐 le nombre d’exemples critiques, b est calculé avec les variables primales. La fonction de décision s’exprime alors par la relation (2.8).  n  f( x)  sign   yi i  xi .x j   b   i 1    (2.8) Elle est influencée par les points correspondant à des 𝛼𝑖 ≥ 0. Ce sont les vecteurs de support. Ils sont exactement sur la marge. Leur nombre est généralement petit devant le nombre de données d’entrainement. 2.4.2.2. Le cas de données non séparables En pratique, il est assez rare d’avoir des données linéairement séparables. Afin de traiter également des données non linéairement séparables, la notion de la marge souple (soft margin), a été introduite dans les SVM. Le principe de la marge souple est d’autoriser des erreurs de classification. Des variables ressorts (ou variables d’écart) sont introduites comme le montre la figure 2.3. Mémoire d’ingénieur/Master Professionnel 41 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Figure 2.3: Marge souple On obtient la formulation primale suivante du problème sous la forme de la relation (2.9) n  1  2 min  w  C  i  , C  0 i 1   w ,b  2 avec y wT x  b  1   ;   0; i  i, n   i i i i  (2.9) Sous la forme duale, le problème s’exprime par la relation (2.10).   n  1 n  max   i j yi y j  xi .x j     i  2 i , j 1   i 1   avec C   i  0; i  1, n  (2.10) Le paramètre C règle le compromis entre la marge possible et le nombre d’erreurs admissibles. Plus C est grand, plus faibles seront les valeurs de 𝜉𝑖 autorisées. Ce paramètre C est fixé par l’utilisateur, généralement par validation croisée. 2.4.3. Le cas non linéaire : les noyaux Dans le cas général, la frontière optimale est non linéaire. Dans le cadre des SVM, la prise en compte des non linéarités dans le modèle s’effectue par l’introduction de noyaux non Mémoire d’ingénieur/Master Professionnel 42 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT linéaires. De manière inattendue, l’utilisation de noyaux ne modifie pas fondamentalement la nature des SVM (pourvu que l’on travaille dans le dual). L’idée des SVM est de reconsidérer le problème dans un espace de dimension supérieure, éventuellement de dimension infinie. Dans ce nouvel espace, il est alors probable qu'il existe un séparateur linéaire comme le montre la figure 2.4. Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de dimension plus grande Plus formellement, on applique aux vecteurs d'entrée x une transformation non-linéaire 𝜙. L'espace d'arrivée 𝜙(𝑥) est appelé espace de redescription (Figure 2.5). Dans cet espace, on cherche alors l'hyperplan. Figure 2.5 : Redescription des données pour permettre une séparation linéaire Mémoire d’ingénieur/Master Professionnel 43 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT La forme duale du problème non linéaire est exprimée par la relation (2.11).   n  1 n  max   i j yi y j   xi  .  x j     i  2 i , j 1   i 1   avec C   i  0; i  1, n    (2.11) Le problème de cette formulation est qu'elle implique un produit scalaire entre vecteurs dans l'espace de redescription, de dimension élevée, ce qui est couteux en termes de calculs. Pour résoudre ce problème, on utilise une fonction noyau k donnée la relation (2.12). k  xi , x j     xi  .  x j  avec xi , x j  (2.12) p Ainsi il n’est pas nécessaire de faire la projection 𝜙, l’espace de redescription reste virtuel. La fonction noyau (plus facile à calculer) donne le même résultat dans l’espace d’entrée. Ceci est appelé ’the kernel trick’. Cette fonction peut être vue comme une mesure de similarité non linéaire. L’expression du problème est finalement donnée par la relation (2.13).   n  1 n  max   i j yi y j k  xi .x j     i  2 i , j 1   i 1   n  avec C   i  0;   i yi  0;i  1, n  i 1  (2.13) La fonction de décision, relation (2.14), est alors:  n  f( x)  sign   yi i k  xi .x j   b   i 1    (2.14) La difficulté qui reste à l’utilisateur est celle de choisir une fonction noyau. Il existe quelques familles paramétrables connues (voir tableau 2.2). L’utilisateur va pouvoir choisir une fonction par essai-erreur ou essayer de s’appuyer sur des fonctions déjà définies dans le domaine considéré [43]. Plus la fonction prendra en compte les informations disponibles sur le problème considéré, meilleurs devraient être les résultats. Mémoire d’ingénieur/Master Professionnel 44 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Tableau 2.2: Les fonctions noyaux Fonction noyau Forme fonctionnelle Polynomiale (𝑥𝑖 . 𝑥𝑗 + 𝑐) A base radiale 𝑛 2 ‖𝑥𝑖 − 𝑥𝑗 ‖ ) exp (− 𝜎2 Sigmoïde tanh(𝑎(𝑥𝑖 . 𝑥𝑗 ) − 𝑏) 2.4.4. Les SVM multiclasses L’adaptation des SVM bi classes au cas multi classe peut se faire de trois façons différentes. Le choix va dépendre de la taille du problème. 1- L’approche un contre tous consiste à entrainer un SVM bi classe en utilisant les éléments d’une classe contre tous les autres. Il s’agit de résoudre de l’ordre de c problèmes SVM chacun de taille n. 2- L’approche un contre un : consiste à entrainer 𝑐(𝑐−1) 2 SVM sur chacun des couples de classes, puis à décider la classe gagnante soit par un vote majoritaire soit en post traitant les résultats grâce à l’estimation de probabilités a posteriori. Le nombre de classifieurs SVM à entrainer peut être réduit en utilisant un codage astucieux pour les classes à travers un code correcteur d’erreur ou un graphe direct acyclique. 3- L’approche globale consiste à traiter le problème en une seule fois. Le dual de ce problème est un programme quadratique de même nature que celui des SVM et de taille n*c. L’estimateur associé est non consistant mais donne de bons résultats en pratique. 2.4.5. Support Vector Régression Le principe des SVM est repris et adapté par les SVR pour modéliser un problème de régression. Le but est d’approximer un ensemble de données (xi, yi) par une fonction f [relation (2.15)]. f  x   wT x  b Mémoire d’ingénieur/Master Professionnel 45 (2.15) Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT Telle que |f(xi ) − yi | ≤ ε , avec i ∈ [1, n]. L’idée consiste à minimiser le terme w tout en étant sous la contrainte de ne pas dépasser un taux d’erreur 𝜀. Du point de vue graphique, ceci revient à trouver une zone du plan qui contient tous les exemples xi de largeur 2ε appelé tube, (voir figure 2.6). Si on considère la minimisation de ‖𝑤‖2 on obtient le problème quadratique de la relation (2.16).  2 1 min  2 w      T avec  yi  w xi  b    T   w xi  b  yi    (2.16) Cette description du problème considère donc qu’une fonction linéaire f qui approxime tous les exemples avec une précision " existe. Dans la pratique, ce n’est pas toujours le cas. En présence de bruit trop important ou de valeurs aberrantes, il est aussi plus important d’autoriser certaines erreurs. Dans ce cas, le concept de marge souple est utilisé. Il consiste à introduire des variables de relâchement 𝜉𝑖 , 𝜉𝑖∗ pour rendre faisables les contraintes du problème d’optimisation qui devient la relation (2.17). n  1 2 *  min  w  C  i  i   i 1 2    T avec  yi  w xi  b    i  T *   w xi  b  yi    i  (2.17) où 𝜉𝑖 et 𝜉𝑖∗ représentent respectivement les erreurs positives et négatives. La constante C > 0 est un hyper paramètre permettant de régler le compromis entre la quantité d’erreur autorisé et la platitude de la fonction f. Cette formulation du problème revient à utiliser une fonction d’erreur |𝜉 |𝜀 appelée "ε-insensible (relation (2.18)) et représentée à la figure 2.6. 0, pour y  f  x    y  f  x     y  f  x    , pour y  f  x    Mémoire d’ingénieur/Master Professionnel 46 (2.18) Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT On peut interpréter cette fonction comme créant un tube d’insensibilité de rayon ε autour de la fonction f(x). Les variables 𝜉𝑖 ou 𝜉𝑖∗ représentent alors la distance selon l’axe y entre le point (xi; yi) et le bord du tube. Figure 2.6 : ɛ-insensible En passant par la formulation duale et l’équation de Lagrange, la fonction obtenue peut être écrite sous la forme de la relation (2.19). f  x     i   i*  xiT x  b n (2.19) i 1 où 𝛼𝑖 et 𝛼𝑖∗ sont les multiplicateurs de Lagrange issus de la formulation duale. La résolution d’un problème de régression non linéaire se fait de la même façon que dans le cas de classification. C’est-à-dire en faisant une projection des donnes d’entrées dans un espace de dimension supérieure dans lequel le problème devient linéaire. Une projection implicite par fonction noyaux est utilisée pour les mêmes raisons de cout en temps de calcul. Le modèle dans le cas général est donné par la relation (2.20). f  x     i   i*  k  xi , x   b n (2.20) i 1 2.4.6. Les SVM par la pratique Il s’agit dans cette partie d’exposer la pratique des SVM. Mémoire d’ingénieur/Master Professionnel 47 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT 2.4.6.1. Réglage des hyper paramètres Dans la méthode SVM, différents hyper paramètres apparaissent : C, qui représente le compromis entre la complexité du modèle et l’erreur sur les données d’apprentissage ; ε, qui correspond à la largeur du tube d’insensibilité ; les Eventuels paramètres de la fonction noyau k (σ, γ, . . .). Ces hyper paramètres sont en général réglés en fonction d’une estimation de l’erreur de généralisation qui peut être évaluée sur un jeu indépendant de données de validation ou par validation croisée [21]. Cela implique de réaliser l’apprentissage pour différentes valeurs et d’estimer leurs performances. Dans le cas d’une estimation de l’erreur de généralisation par validation croisée, cette procédure peut se révéler très couteuse en temps de calcul. D’autres approches permettent d’optimiser le réglage des hyper paramètres. Certaines sont basées sur des méthodes évolutionnistes, d’autres sur une recherche par descente de gradient. 2.4.6.2. Réglage automatique du tube : υ-SVM La largeur du tube d’insensibilité " peut être réglé en considérant le niveau de bruit contenu dans les données. En effet, celui-ci détermine le niveau d’erreur qui ne sera pas prise en compte par l’algorithme. Si le modèle du bruit était disponible, le problème d’identification se résumerait à appliquer la méthode du maximum de vraisemblance pour obtenir le meilleur estimateur. Mais en pratique, les connaissances sur le bruit sont généralement très limitées. Il existe néanmoins une technique, appelée υ-SVR, permettant de construire un SVM qui ajuste automatiquement la largeur du tube d’insensibilité. Elle consiste à ajouter un terme dans la formulation du problème d’optimisation pour tenter de minimiser l’erreur. Le problème est donc reformulé ainsi par la relation (2.21). Mémoire d’ingénieur/Master Professionnel 48 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT  1  n  2  w C i  i*   N   min       i 1  2    yi  wT xi  b    i  avec  wT x  b  y     *  i i i   *  i , i  0  (2.21) Avec υ > 0. 2.4.6.3. Algorithmes et optimisation L’implémentation des SVM tant pour la classification que pour la régression consiste à déterminer les αi multiplicateurs de Lagrange optimaux. Si le nombre d’exemples est modeste (de l’ordre de 1000), les méthodes classiques de programmation quadratique tel que les méthodes quasi-Newton [5] ou les méthodes du point intérieur [39], peuvent être utilisées. Si par contre le nombre d’exemples est important (le cas habituel), des méthodes d’optimisation sont indispensables pour résoudre le problème en un temps acceptable. En pratique, quand n est élevé, deux problèmes se posent : premièrement la taille de la matrice du noyau qui devient insupportable par la mémoire principale, deuxièmement le temps de recherche des αi optimaux est exhaustif. Pour résoudre ces problèmes, plusieurs méthodes ont été développées : La méthode de shnuking [18], effectue l’entrainement sur un nombre limité d’exemples, choisis par une heuristique, puis ajoute itérativement les autres jusqu’à atteindre l’hyperplan optimal. Parmi les implémentations classiques de cette méthode on trouve le SVMlight [48]. La méthode SMO (Sequential Minimal Optimisation), est la méthode la plus utilisée actuellement, elle consiste à optimiser à chaque itération, deux αi conjointement. Le point fort de l’algorithme est que l’optimisation des deux multiplicateurs choisis se fait analytiquement, ce qui réduit considérablement le temps d’entrainement. Mémoire d’ingénieur/Master Professionnel 49 Hadnane OURO-AGBAKE CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT En plus, l’algorithme ne fait aucune opération matricielle et n’a pas besoin de maintenir la matrice du noyau en mémoire. Divers packages d’implémentation du SMO peuvent être trouvés dans la littérature, particulièrement LIBSVM [13]. 2.5. Conclusion Nous avons, dans ce chapitre, vu quelques méthodes utilisées pour prédire la vitesse du vent. De la méthode de la persistance aux méthodes de Machine Learning, plusieurs études ont été consacrées à la prédiction de la vitesse du vent prouvant ainsi la nécessité de prédiction pour les centrales éoliennes. Nous avons vu les bases théoriques et pratiques des techniques de SVR. Mémoire d’ingénieur/Master Professionnel 50 Hadnane OURO-AGBAKE 3. Chapitre 3 : analyse et discussions des résultats et étude économique CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE 3.1. Introduction Dans ce chapitre, il sera question dans un premier temps de faire une application des algorithmes des SVM vus chapitre précédant pour prédire la vitesse du vent. Ensuite, les performances des différents modèles seront présentées en vue de dégager le meilleur modèle à partir de la base des critères de performance qui sont présentés plus loin. Enfin, nous ferons une analyse suivie d’une discussion des résultats. 3.2. Environnement Cette étude a été fait en utilisant les outils suivants : les programmes ont été écrits en python, en utilisant des librairies tels que, NumPy pour la gestion de grands tableaux, matplotlib pour générer les graphiques, scikit-learn pour les fonctions d’apprentissage automatique… 3.2.1. Pythons Depuis sa première apparition en 1991, créé par Guido van Rossum, Python est devenu l'un des langages de programmation interprétés les plus populaires, avec Perl, Ruby, et d'autres. Python et Ruby sont devenus particulièrement populaire depuis 2005 ou plus pour la création de sites Web utilisant leur nombreux frameworks web, comme Rails (Ruby) et Django (Python). Ces langues sont souvent appelés langages de script, car ils peuvent être utilisés pour écrire rapidement de petits programmes, ou des scripts pour automatiser d'autres tâches. À la fin de ses 10 ans d’existence, Python est passé d'un point de vue scientifique à la pointe de la technologie faisant du langage l'une des langages les plus importantes pour la science des données, le Machine Learning, et le développement de logiciels généraux dans les universités et l'industrie. Pour l'analyse de données, l'informatique interactive et la visualisation de données, Python fera inévitablement concurrence avec d'autres langages de programmation open source et commerciale et des outils largement utilisés, tels que R, MATLAB, SAS, Stata et autres. Au cours ces dernières années, le développement des bibliothèques (telles que pandas et scikit-learn) a fait de python un choix populaire pour les tâches d'analyse de données. Mémoire d’ingénieur/Master Professionnel 52 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Pour notre travail nous avons utilisé l’environnement de développement Anaconda dans sa version 4.4.0 disponible à l’adresse http//continuum.io/downloads. Anaconda 4.4.0 offre la possibilité de programmer dans deux versions de python soit Python 2.7 et Python 3.6. 3.2.2. Pandas La librairie pandas fournit des structures de données de haut niveau et des fonctions conçues pour rendre le travail avec des données structurées ou tabulaires rapide, facile et expressif. Cela a permis à Python d'être un environnement d'analyse de données puissant et productif. Les objets primaires de pandas sont le DataFrame, une structure de données tabulaire, orientée colonne, avec des étiquettes de ligne et de colonne. Pandas allie les idées performantes de NumPy en matière de calcul matriciel et les capacités de manipulation de données de tableurs et de bases de données relationnelles (telles que SQL). Il fournit une fonctionnalité d'indexation sophistiquée pour le rendre facile à remodeler, découper, effectuer des agrégations et sélectionner des sous-ensembles de données. Depuis la manipulation des données, la préparation et le nettoyage est une étape importante dans l'analyse des données, pandas est l'un des les principaux outils que nous avons utilisés. 3.2.3. NumPy NumPy, abréviation de Numerical Python, a longtemps été la pierre angulaire des calculs numériques en Python. Il fournit les structures de données, les algorithmes et la colle de bibliothèque nécessaires pour la plupart des applications scientifiques impliquant des données numériques en Python. NumPy contient, entre autres : - Un objet tableau multidimensionnel rapide et efficace ndarray. - Fonctions pour effectuer des calculs par éléments avec des tableaux ou des opérations mathématiques entre les tableaux. - Outils pour lire et écrire des ensembles de données sur disque. - Opérations d'algèbre linéaire, transformée de Fourier et génération de nombres aléatoires. Mémoire d’ingénieur/Master Professionnel 53 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE - Une API C pour permettre aux extensions Python et code natif C ou C ++ d'accéder aux structures de données de NumPy. Au-delà des capacités de traitement de tableaux rapides que NumPy ajoute à Python, l'un de ses utilisations principales dans l'analyse des données sont comme un conteneur pour les données à transmettre entre algorithmes et bibliothèques. Pour les données numériques, les tableaux NumPy sont plus efficaces pour le stockage et la manipulation des données que les autres structures de données Python intégrées. Aussi, les bibliothèques écrites dans un langage de niveau inférieur, comme C ou Fortran, peuvent fonctionner sur les données stockées dans un tableau NumPy sans copier les données dans une autre représentation de la mémoire. 3.2.4. Matplotlib Matplotlib est la bibliothèque Python la plus populaire pour la production de graphiques et d'autres visualisations de données bidimensionnelles. Il est conçu pour créer des courbes adaptées pour la publication. Bien qu'il existe d'autres bibliothèques de visualisation disponibles sous Python, matplotlib est le plus largement utilisé et en tant que tel a généralement une bonne intégration avec le reste de l'écosystème. 3.2.5. SciPy SciPy est une collection de paquets abordant un certain nombre de problèmes standard de différents domaines scientifiques. Voici un échantillon des paquets inclus : - scipy.integrate : Routines d'intégration numérique et solveurs d'équations différentielles. - scipy.linalg : Les routines d'algèbre linéaire et les décompositions matricielles qui s'étendent au-delà de celles incluses dans numpy.linalg. - scipy.optimize : Optimiseurs de fonction (minimiseurs) et algorithmes de recherche de racine. - scipy.signal : Outils de traitement du signal Mémoire d’ingénieur/Master Professionnel 54 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE - scipy.stats : Les distributions de probabilité continues et discrètes standard (fonctions de densité, échantillonneurs, fonctions de distribution continue), divers tests statistiques, et d’autres statistiques descriptives. 3.2.6. Statsmodels Statsmodels est un paquet d'analyse statistique. Comparé à scikit-learn, statsmodels contient des algorithmes de statistiques et économétrie classiques. Cela inclut des sousmodules tels que : - Modèles de régression : régression linéaire, modèles linéaires généralisés, linéaires robustes modèles, modèles d'effets mixtes linéaires, etc. - Analyse de variance (ANOVA). - Analyse de séries chronologiques : AR, ARMA, ARIMA, VAR et autres modèles. - Méthodes non paramétriques : estimation de la densité du noyau, régression du noyau. - Visualisation des résultats du modèle statistique. Statsmodels est plus axé sur l'inférence statistique, fournissant des estimations d'incertitude et p-valeurs pour les paramètres. En revanche, scikit-learn est davantage axé sur la prédiction. 3.2.7. scikit-learn scikit-learn est le premier outil d'apprentissage automatique polyvalent pour les programmeurs Python. Il comprend des sous-modules pour des modèles comme : - Classification : SVM, voisins les plus proches, forêt aléatoire, régression logistique, etc. - Régression : Lasso, régression de crête, etc. - Clustering: k-means, clustering spectral, etc. - Réduction de dimensionnalité : sélection de caractéristiques, factorisation matricielle, etc. Mémoire d’ingénieur/Master Professionnel 55 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE - Sélection du modèle : recherche de grille, validation croisée, métriques - Prétraitement : extraction de caractéristiques, normalisation Avec pandas, statsmodels et IPython, scikit-learn a été essentiel pour Python pour être un langage de programmation de science de données productif. 3.3. Description du problème Le problème est de prédire la vitesse du vent pour un horizon 1 heure à Lomé par la technique de « Machine Learning ». Pour atteindre nos objectifs nous nous sommes doté d’une base de données des vitesses du vent recueillies chaque jour par intervalle d’une heure, de septembre 1998 à Avril 2018. 3.4. Méthodologie Pour atteindre nos objectifs nous devons donc avoir une méthodologie de travail qui nous permettra de pouvoir effectuer une évaluation du modèle à la fin. 3.4.1. Mesure de performance Nous évaluerons la performance des prédictions en utilisant la racine carre de l'erreur quadratique moyenne (RMSE), l’erreur absolue moyenne (MAE), l’erreur quadratique moyenne (MSE) et le coefficient de détermination (R2). Erreur absolue moyenne (MAE) : l’erreur moyenne absolue est la moyenne des résidus (c’est-à-dire la différence entre la valeur cible et la valeur prédite). Elle est exprimée par la relation (3.1). MAE  y, yˆ   1 n 1  yi  yˆi n i 0 (3.1) Où : - 𝑦𝑖 est la valeur cible ; 𝑦̂𝑖 est la valeur prédite ; n le nombre de valeur. Mémoire d’ingénieur/Master Professionnel 56 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Erreur quadratique moyenne (MSE) : similaire à l’erreur absolue moyenne, à l’exception que la moyenne quadratique utilise le carré des résidus. L’erreur quadratique est valeur toujours positive, et est meilleur si proche de 0. La formulation mathématique de l’erreur quadratique est donnée la relation (3.2). MSE  y , yˆ   1 n 1 2  yi  yˆi   n i 0 (3.2) La racine carre du MSE donne La racine carre de l'erreur quadratique moyenne (RMSE). Le coefficient de détermination R2 : fournit une mesure de la façon dont les échantillons futurs sont susceptibles d’être prédites par le modèle. Le meilleur score possible est 1.0 et peut être négatif. Le coefficient R2 est obtenu par la relation (3.3). n 1 R2  1    y  yˆ  2  y  y  2 i 0 n 1 i 0 i i i (3.3) i où yi est la moyenne des valeurs cibles. Toute transformation des données sera inversée avant que le calcul des erreurs ne soit effectué, ceci afin de rendre la performance entre différentes méthodes directement comparable. 3.4.2. Stratégie d’apprentissage Les données de vitesse du vent sont une série chronologique tandis que les SVM sont un algorithme d’apprentissage supervise. Rappelons pour une bonne compréhension, ce qu’est les séries temporelles et l’apprentissage supervisé. Les séries chronologiques sont une suite de nombre ordonnée d’après une fréquence de temps donnée. Les données d’une série temporelle se présentent en une liste d’une colonne. L’apprentissage supervisé comme présenté au chapitre 2 est l’apprentissage où on a une ou plusieurs variables d’entrée (X) et une variable de sortie (Y) et où on utilise un algorithme pour apprendre la fonction de mappage de ou des entrées à la sortie Y = f(X). Mémoire d’ingénieur/Master Professionnel 57 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Dans un premier temps nous avons exprimé les données de séries chronologiques dont nous disposons sous forme d’apprentissage supervisé en utilisant la technique de « sliding Window » ou méthode de décalage ou de retard qui consiste à utiliser la valeur de vitesse du vent au temps t comme variable d’entrée et la valeur de vitesse du vent au temps t +δt comme variable de sortie de l’entrée t. La matrice de décalage ainsi obtenue a ensuite été découpée en ensemble de test (testing set) et d’apprentissage (training set) de façon non aléatoire sur lequel nous avons appliqué l’algorithme des SVR. Nous avons reparti la base de données comme suit : - le premier ensemble, constitué de 70 % des données est dédié à l’apprentissage ; - et le second ensemble, constitue de 30 % des données est utilisé pour la validation des modèles Notre objectif est de prédire la moyenne horaire de la vitesse du vent en prenant, en plus de la vitesse du vent à l’instant t-1, des variables physiques exogènes et endogènes du processus comme les paramètres d’entrée de notre modèle. L’utilisation de toutes les variables d’entrée sera coûteuse en temps de calcul. Toutefois certains paramètres sont dépendants et fortement corrélés entre eux, ainsi il n’est pas nécessaire d’utiliser toutes les variables comme paramètres d’entrée. Nous allons utiliser le test de corrélation linéaire entre variables définie par la relation (3.4) dans laquelle x et y sont des variables. r 3.5.  xy  x . y x2  x 2  y2  y 2  (3.4) Modélisation de la vitesse du vent par les SVM Dans cette section nous exposons le travail effectué. Mémoire d’ingénieur/Master Professionnel 58 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE 3.5.1. Analyse exploratoire des données de vitesse La phase d’exploration de données permet de comprendre ses dernières. Grace à l’analyse univariée, on peut déduire certaines hypothèses qui pourront servir lors de la phase de modélisation. L’analyse univariée permet d’explorer une seule feature à la fois. Cette analyse se base sur les statistiques descriptives. Ces dernières permettent de tirer des indicateurs concis sur une feature donnée. Parmi ces indicateurs on retrouve la moyenne, la médiane ainsi que les mesures de dispersion de données. 3.5.1.1. Origine des données de vitesses du vent Les données météorologiques utilisées dans cette étude sont des données recueillies sur le site de la Société Aéroportuaire Lomé-Tokoin au TOGO. Ces données sont enregistrées chaque jour par intervalle d’une heure à une hauteur de 10 m au-dessus du sol et sont obtenues à travers la base de données météorologique du site Web ‘http://weather.uwyo.edu/surface/meteogram’, de l’Université de Wyoming. La fiche de données fournie (Tableau 3.1), comporte pour chaque enregistrement : le nom de site (STN), la date et l’heure d’enregistrement (TIME), la température ambiante (TMPC) en °C, la pression atmosphérique (ALTM) en hPa, la température de la rosée (DWPC) en °C etc. Tableau 3.1: fiche des données Mémoire d’ingénieur/Master Professionnel 59 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE La figure 3.1 montre la représentation temporelle des données de vitesse du vent du 01 janvier 2015 au 10 Avril 2018. Figure 3.1 : La courbe des vitesses du vent de 2015 à 2018 3.5.1.2. Les statistiques des données de vitesses du vent Il s’agit dans cette section de présenter les caractéristiques statistiques des vitesses de vent sur le site de Lomé La moyenne : la moyenne est la somme des valeurs de vitesses divisée par le nombre de valeurs de vitesses. Elle est donnée par la relation (3.5). moy  1 n  xi n 1 (3.5) La moyenne est sensible aux valeurs extrêmes. La médiane : la médiane est la valeur centrale qui partage l'échantillon en 2 groupes de même effectif. La médiane est donnée par la relation (3.6). Mémoire d’ingénieur/Master Professionnel 60 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE  x n 1    2   med   x n  x n       2   2 1  2 si n est impair (3.6) si n est pair Le mode : le mode correspond à la réalisation la plus fréquente. La variance : la variance indique de quelle manière la série de données de vitesse se disperse autour de la moyenne. Une variance élevée indique que les valeurs sont très écartés les uns des autres et vice-versa. Elle est donnée par la relation (3.7). 2  1 n 2  xi  moy   n 1 (3.7) L’écart-type (standard Deviation) : Il est la racine carre de la variance. On utilise souvent l’écart-type que la variance pour mieux appréhender le degré de dispersion des données.la relation (3.8) donne la variance.  1 n 2  xi  moy   n 1 (3.8) Le minimum et le maximum : Étendue ; c'est l'intervalle entre la plus petite et la plus grande valeur. On dit d'un phénomène qu'il présente une « forte dynamique » lorsque l'étendue (ou la dispersion) est grande. Les quantiles : Un quantile d’ordre α (0< α <1) est la plus petite valeur de la série tel qu’au moins α% des autres valeurs lui sont inférieures. Le tableau 3.2 donne un résumé des indices statistiques des données de vitesses du vent du 01 janvier 2015 au 10 Avril 2018. La vitesse du vent de Lomé a une moyenne de 4.249 m/s dans ces dernières années. Les valeurs de l’écart-type et de la variance suggèrent que la plupart du temps la vitesse du vent à Lomé est autour cette moyenne. Mémoire d’ingénieur/Master Professionnel 61 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.2 : Les statistiques du vent Variables statistiques Population Moyenne Ecart-type Variance Min 25% Médiane 75% Max valeur 32963.000000 4.249067 1.906311 1.380662 0.000000 3.000000 4.000000 6.000000 16.000000 L’histogramme : l’histogramme est un hybride d'une représentation graphique exhaustive des données et d'une description par recours à des lois statistiques. La figure 3.2 présente l’histogramme des données de vitesse. L’histogramme ci-dessous nous confirme que les valeurs mesurées de vitesse sont autour de la moyenne. En effet les battons de l’histogramme sont plus longues. Figure 3.2 : Histogramme des données de vitesses Mémoire d’ingénieur/Master Professionnel 62 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE 3.5.1.3. Corrélation Le rôle de l’analyse de corrélation est de déterminer les coefficients de corrélation linéaire entre variables afin de faire un bon choix des variables d'entrée du modèle. Tableau 3.3: Matrice de corrélation des variables d'entrées ALTM TMPC DWPC RELH SPED ALTM 1 -0.437 -0.199 0.232 -0.066 TMPC DWPC RELH SPED 1 0.247 -0.709 0.426 1 0.478 0.06 1 -0.367 1 L’analyse de la matrice de corrélation ci-dessus (tableau 3.3) nous a permis d’éliminer l’humidité relative du vent RELH car étant bien corrélée à la température TMPC. D’autre part, nous avons réalisé diverses séances d’apprentissage sur différentes modèles en faisant plusieurs combinaisons des variables d’entrée. Grâce à La comparaison des diverses MSE (Mean Squared Error c’est à dire Erreur Quadratique Moyenne), nous avons écarté des variables d’entrée moins influençant que d’autres. Le tableau 3.4 présente les différentes variables d’entrée. Tableau 3.4: Variables d'entrée NUMERO DESIGNATION CODE 1 La pression atmosphérique ALTM 2 La Température ambiante TMPC 3 L’humidité relative du vent RELH 4 La température de la rosée DWPC 5 La vitesse du vent SPED Il s’agit donc de prédire les vitesses du vent à partir des combinaisons des variables explicatives mentionnées dans le tableau 3.4 afin de déceler le cas de configuration le plus performant sur la base d’un critère bien défini. Nous avons testé les différents cas de configurations qui sont mentionnés dans le tableau 3.5. Mémoire d’ingénieur/Master Professionnel 63 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.5: les différentes configurations d'entrée Modèle Vecteurs d’entrée 1 [SPED(t-2), SPED(t-1), TMPC(t-1), ALTM(t-1), DWPC(t-1)] 2 [SPED(t-1), TMPC(t-1), ALTM(t-1), DWPC(t-1)] 3 [SPED(t-1), TMPC(t-1), ALTM(t-1)] 4 [SPED(t-1), TMPC(t-1), DWPC(t-1)] 5 [SPED(t-1), ALTM(t-1), DWPC(t-1)] 6 [SPED(t-2), SPED(t-1), TMPC(t-1), DWPC(t-1)] 7 [SPED(t-2), SPED(t-1), ALTM(t-1), DWPC(t-1)] 8 [SPED(t-2), SPED(t-1), TMPC(t-1), ALTM(t-1)] 3.5.2. Prétraitement des données du vent Les données collectées ont été "préparées". Avant tout, elles ont subi un nettoyage puisqu’elles contiennent plusieurs types d’anomalies : des données omises, des données incohérentes. 3.5.2.1. Les données manquantes On dit qu’une observation comporte une donnée manquante s’il existe une feature pour laquelle sa valeur n’est pas renseignée. Evidemment, on peut avoir plusieurs données manquantes pour une même observation. Traiter les données manquantes revient à « réparer » le jeu de données pour qu’il puisse être utilisable parle les algorithmes. Cette réparation peut prendre plusieurs formes : comme supprimer les données manquantes ou les remplacer par des valeurs artificielles (on parle d’imputation). Pour notre étude nous avons opté pour la suppression complète des observations contenants des données manquantes. Mémoire d’ingénieur/Master Professionnel 64 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE 3.5.2.2. Le feature scaling Les données recueillies ont des ordres de grandeurs différents. Cette différence peut conduire à des performances moindres. Pour remédier à cela, nous avons exécuté une Normalisation. La Normalisation : Cette transformation nous a permis de translater les valeurs dans l’intervalle fixe [0,1]. Le but d’avoir un tel intervalle restreint et de réduire l’espace de variation des valeurs d’une feature. La normalisation est effectuée par la technique du Min-Max scaling. La transformation se fait grâce la relation (3.9). xnormalise  x  xmin xmax  xmin (3.9) Où : - 𝑥𝑚𝑖𝑛 est la plus petite valeur observée pour le feature x ; 𝑥𝑚𝑎𝑥 la plus grande valeur observée ; x la valeur de la feature que l’on recherche à normaliser. 3.5.3. Les performances des configurations Nous avons reporté les performances des différents cas de configurations du modèle SVR pour différents kernel (noyau) et pour différents modèles dans les tableaux 3.6, 3.7, 3.8, 3.9, 3.10, 3.11, 3.12 et 3.13. Tableau 3.6: Performances SVR; configuration 1 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.933 1.009 0.994 1.046 Mémoire d’ingénieur/Master Professionnel RMSE 0.966 1.004 0.997 1.023 65 MAE 0.734 0.771 0.764 0.789 R2 0.720 0.697 0.701 0.686 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.7: Performances SVR; configuration 2 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.165 0.214 0.230 0.299 RMSE 0.406 0.462 0.480 0.547 R2 0.950 0.936 0.931 0.910 MAE 0.323 0.364 0.374 0.412 Tableau 3.8 : Performances SVR; configuration 3 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.165 0.216 0.246 0.461 RMSE 0.407 0.464 0.496 0.679 R2 0.950 0.935 0.926 0.861 MAE 0.324 0.357 0.382 0.518 Tableau 3.9: Performances SVR; configuration 4 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.142 0.169 0.171 0.217 RMSE 0.377 0.411 0.414 0.466 R2 0.957 0.949 0.949 0.935 MAE 0.303 0.318 0.315 0.327 Tableau 3.10: Performances SVR; configuration 5 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.128 0.168 0.161 0.201 RMSE 0.357 0.410 0.401 0.448 R2 0.962 0.950 0.952 0.940 MAE 0.295 0.350 0.327 0.350 Tableau 3.11 : Performances SVR; configuration 6 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.902 0.959 0.976 1.003 Mémoire d’ingénieur/Master Professionnel RMSE 0.950 0.979 0.988 1.002 66 MAE 0.721 0.743 0.750 0.758 R2 0.729 0.712 0.707 0.699 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.12 : Performances SVR; configuration 7 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.838 0.894 0.884 0.922 RMSE 0.915 0.946 0.940 0.960 R2 0.748 0.731 0.734 0.723 MAE 0.694 0.722 0.713 0.736 Tableau 3.13 : Performances SVR; configuration 8 Noyau Linéaire Rbf Poly; degree 2 Poly; degree 3 MSE 0.912 0.991 0.990 1.104 RMSE 0.955 0.995 0.955 1.051 MAE 0.726 0.763 0.768 0.824 R2 0.726 0.702 0.702 0.668 3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des entrées L’analyse des performances des différentes configurations nous a permis de détecter pour chaque approche le meilleur modèle. Le tableau 3.14 donnent le récapitulatif des performances des différents configurations. Les meilleurs performances sont obtenues pour la configuration 5 et ce pour le noyau linéaire. Ceci nous permet de choisir les variables d’entrées du modèle SVR. En définitif, les variables d’entrées du modèle sont constituée par la vitesse du vent (SPED(t-1)), la pression atmosphérique (ALTM(t-1)) et la température de rosée (DWPC(t1)), le tout à l’instant t-1; soit au total trois variables d’entrées. La sortie du modèle étant la vitesse du vent (SPED(t)) à l’instant t. sur la figure 3.3 et 3.4 nous présentons respectivement la représentation temporelle de la variable de sortie et celles des variables d’entrées. Mémoire d’ingénieur/Master Professionnel 67 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.14 : Récapitulatif des performances de différentes configurations Config. MSE RMSE MAE R2 1 2 3 4 5* 6 7 8 1 2 3 4 5* 6 7 8 1 2 3 4 5* 6 7 8 1 2 3 4 5* 6 7 8 0.933 0.165 0.165 0.142 0.128* 0.902 0.838 0.912 0.994 0.230 0.246 0.171 0.161* 0.976 0.884 0.990 1.046 0.299 0.461 0.217 0.201* 1.003 0.922 1.104 1.009 0.214 0.216 0.169 0.168* 0.959 0.894 0.991 0.966 0.406 0.407 0.377 0.357* 0.950 0.915 0.955 0.997 0.480 0.496 0.414 0.401* 0.988 0.940 0.995 1.023 0.547 0.678 0.466 0.448* 1.002 0.960 1.051 1.004 0.462 0.464 0.411 0.410* 0.979 0.946 0.995 0.734 0.323 0.324 0.303 0.295* 0.721 0.694 0.726 0.764 0.374 0.382 0.315 0.327* 0.750 0.713 0.768 0.789 0.412 0.518 0.327 0.350* 0.758 0.736 0.824 0.771 0.364 0.357 0.315 0.350* 0.743 0.722 0.768 0.720 0.950 0.950 0.957 0.962* 0.728 0.748 0.726 0.701 0.931 0.926 0.949 0.952* 0.707 0.734 0.702 0.686 0.910 0.861 0.935 0.940* 0.699 0.723 0.668 0.697 0.936 0.935 0.949 0.950* 0.712 0.731 0.702 Mémoire d’ingénieur/Master Professionnel 68 modèle noyau Linéaire* Poly 2 SVR Poly 3 RBF Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Figure 3.3: Courbe de la variable de sortie du modèle a) Mémoire d’ingénieur/Master Professionnel b) 69 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE c) Figure 3.4 : Courbes des variables d’entrée du modèle Les principales caractéristiques du model choisi sont présentées au tableau 3.15. Tableau 3.15:Les principales caractéristiques du model choisi Modèle Noyau Cas configuration C ɛ MSE RMSE MAE R2 3.6. SVR linaire 5 SPED(t-1)- ALTM(t-1)-DWPC(t-1) 1000 0.1 0.128 0.357 0.295 0.962 Prédiction avec le modèle choisi Nous présentons à la figure 3.5, une capture d’écran de quelques-uns des résultats de modélisation de la vitesse du vent sur le site de Lomé. On peut distinguer sur cette figure la valeur de vitesse prédite, la valeur attendue et l’erreur quadratique correspondante. Mémoire d’ingénieur/Master Professionnel 70 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Figure 3.5: Résultats de prédiction La représentation temporelle est la meilleure manière de présenter les résultats. A cet effet la figure 3.6 nous présentons le résultat en superposant la représentation temporelle des données de vitesse mesurées et celle des données de vitesses prédites. On note bien une corrélation presque linéaire entre les vitesses de vent prédites et celles mesurées. Cette corrélation entre les données de vitesses mesurées et prédites est bien plu visible avec la figure 3.7 où nous visualisons un nuage de point ayant pour abscisse les données de vitesses mesurées et pour ordonnée celles prédites qui suit presque linéairement la première bissectrice. Mémoire d’ingénieur/Master Professionnel 71 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Figure 3.6: Vitesses mesurées et vitesses prédites Figure 3.7: Corrélation vitesses mesurées-vitesses prédites Mémoire d’ingénieur/Master Professionnel 72 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Pour valider les résultats nous choisissons d’observer les résultats de prédiction obtenus pour les différentes méthodes. La figure 3.8 permet d’observer la force de modélisation des SVR avec différents noyaux (linéaire, fonction a base radial, polynomial) sur 24 heures. On remarque donc que le modèle avec le noyau linéaire modélise mieux la vitesse du vent à Lomé (R2=0,962 ; MSE= 0.128). Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures L’histogramme des erreurs au cours de la validation du modèle (figure 3.9) montre que plus de 70% des données sont prédites avec une erreur nulle. Mémoire d’ingénieur/Master Professionnel 73 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Figure 3.9: Histogramme des erreurs au cours de la validation Il s’avère aussi important d’observer les puissances prédites correspondantes aux vitesses prédites. Pour cela nous prenons une éolienne du fabricant Indien AUROVILLE ENERGY PRODUCT (puissance nominale = 5 kW, vitesse nominale = 14 m/s, vitesse d’enclenchement = 3.3 m/s). Cette dernière s’est avéré le choix optimal pour le site de Lomé dans [41]. Sa courbe de puissance a été modélisée par la relation 3.10. 0  3 3 1 2 1 4.8.10 V  1.495.10 V  9.162.10 V  1.8 P(V )   5 0 si V  3.3m / s si 3.3m / s  V  14m / s si 14m / s  V  25m / s (3.10) si V  25m / s La figure 3.10 montre la représentation temporelle des puissances mesurées et prédites correspondantes. Sur cette figure on observe une concentration aux basses puissances due aux faibles vitesses sur le site de Lomé. Mémoire d’ingénieur/Master Professionnel 74 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Figure 3.10 : Puissances prédites correspondantes 3.7. Coût du projet Le projet ainsi réalisé, une évaluation financière s’avère nécessaire. Le coût du projet englobe le coût du matériel informatique et celui de la recherche. Ainsi nous avons utilisé le logiciel Anaconda dans sa version 4.4.2 et un ordinateur portable de marque HP pour le traitement des données et des différentes simulations (capacité 500 Go, 4Go de RAM et un processeur de fréquence 1.0 GHz). Les coûts d’acquisition du matériel utilisé sont indiqués dans le tableau 3.16. L’étude du projet est facturée suivant le nombre d’heures de travail par jour. La réalisation du projet a nécessité en moyenne 6 heures de temps par jour. Le projet a duré au total 3 mois et nous avons travaillé en moyenne 22 jours par mois (voir tableau 3.17), ce qui fait au total 396 heures de travail. Le coût de facturation par unité de temps utilisé pendant l’étude du projet est cinq mille francs (5000) FCFA [58]. Mémoire d’ingénieur/Master Professionnel 75 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE Tableau 3.16: Coûts du matériel et du logiciel utilisés Matériel et logiciels utilisés Prix (FCFA) Ordinateur portable 250 000 Connexion internet UL-WIFI, libre pour étudiant Anaconda +librairies Open source Tableau 3.17: Estimation financière du temps de travail Temps de travail en heure 396 Coût horaire (FCFA) 5000 Total partiel (FCFA) 1 980 000 Le coût total du projet est composé du coût du matériel utilisé, du coût du temps de travail et de la taxe sur la valeur ajoutée. Le coût total du projet est présenté dans le tableau 3.18. Tableau 3.18 : Estimation du coût total du projet DENOMINATION DESIGNATION PRIX TOTAL (FCFA) Prix du matériel 1 Ordinateur portatif 250 000 Frais d’étude 6h/jour pendant 66 jours 1 980 000 Total partiel - 2 230 000 TVA 18% du total partiel 401 400 Montant total TTC - 2 631 400 Le coût total du projet est alors de quatre millions six cent dix-neuf mille cinquante francs CFA (2 631 400 CFA). 3.8. Conclusion Ce chapitre a été consacré à la modélisation de la vitesse du vent de Lomé par les SVR. Dans un premier temps nous avons réalisé une analyse exploratoire des données de vitesse Mémoire d’ingénieur/Master Professionnel 76 Hadnane OURO-AGBAKE CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE ECONOMIQUE du vent, étape importante de toute modélisation. Ensuite nous avons présenté l’outil qui a servi à la modélisation (Anaconda). Puis enfin les différents cas de prédictions ont étés développés et testés. L’indicateur statique MSE a été utilisé pour évaluer les performances des différentes configurations. Les résultats obtenus sont satisfaisants comparés aux résultats de A.A. Salami et al. [3] où il est obtenu un MSE de 1.0293. Mémoire d’ingénieur/Master Professionnel 77 Hadnane OURO-AGBAKE Conclusion générale CONCLUSION GENERALE Ce travail traite le problème de prédiction de la vitesse du vent lie à la production d’énergie éolienne. Nous y avons tout d’abord commencé par exposer les techniques d’implantation et d’exploitation d’une éolienne dans le premier chapitre. Cela nous a permis de mettre en évidence la liaison étroite entre la vitesse du vent sur un site éolienne et la production de ce dernier. Dans le deuxième chapitre, nous avons commencé par introduire une revue de littérature complète sur la prédiction de la vitesse du vent à l’issue de laquelle nous avons jugé intéressant la méthode de modélisation de la vitesse du vent par les SVM. Puis nous avons expose les bases théoriques des SVM et de sa variantes pour la régression (SVR). Les résultats issus de la modélisation ont été présentés au troisième chapitre. Plusieurs configurations ont été développées et testées en faisant varier les différentes variables explicatives, l’objectif étant de trouver la configuration qui modélise le mieux les données de vitesses de notre base de données. Toutes les configurations ont été implémentées dans le logiciel Anaconda 4.4.2. L’indicateur MSE (Mean Squarred Error) a été utilisé pour évaluer les différents cas de configuration. Le cas le plus performant de tous est le cas 5 (configuration SPED(t-1)ALTM(t-1)-DWPC(t-1)) avec le noyau linéaire, avec un MSE de 0.128. Les variables explicatives SPED(t-1), ALTM(t-1), et DWPC(t-1) désignent respectivement la vitesse du vent, la pression atmosphérique et la température de rosée, le tout à l’instant t-1. Ce modèle pourra donc être utilisé pour les prédictions futures de la vitesse du vent sur le site de Lomé. Cependant, du travail, il en reste encore dans ce contexte afin d'améliorer les résultats obtenus. Cette amélioration peut être obtenue en développant différents aspects. Ainsi comme perspectives il faut tenir compte des recommandations suivantes : - les données utilisées dans ce projet comportent plusieurs anomalies, il serait plus intéressant de trouver d’autres sources de données plus fiables, ou même de développer des moyens d’enregistrement de la vitesse ; Mémoire d’ingénieur/Master Professionnel 79 Hadnane OURO-AGBAKE CONCLUSION GENERALE - rendre ce travail en application ou outil facilement utilisable et même transportable ; - utiliser d’autres techniques de prédiction comme le Deep Learning. Mémoire d’ingénieur/Master Professionnel 80 Hadnane OURO-AGBAKE Références bibliographiques ANNEXES [1] AHMET D. SAHIN, Progress and recent trends in wind energy, Progress in Energy and Combustion Science 30, pp.501–543, 2004. [2] AKIM A. SALAMI, modélisation du vent à partir des méthodes d’analyse de données imparfaites : étude et réalisation d’un outil d’aide à la décision pour la caractérisation du potentiel éolien, la prédiction de vitesses du vent et l’optimisation du dimensionnement des aérogénérateurs au Togo, thèse de doctorat unique en sciences de l’ingénieur. [3] AKIM A. SALAMI, AYITE. S. A. AJAVON, MAWUGNO. K. KODJO, KOFFISA BEDJA, Prédiction de la moyenne horaire de la vitesse du vent sur le site de Lomé par réseau de neurones. Revue Cames – Sci. Appl. & de l’Ing., Vol. 2(1), pp. 01-12. ISSN 2312-8712. [4] BABUSKA R., Fuzzy Modeling and Identification Toolbox for the user’s guide, Delft University of technology, Delft, the Netherlands, August 1998. [5] B.A. MURTAGH AND M.A. SAUNDERS, Large-scale linearly constrained optimization. Mathematical Programming, 14(1):41–72, 1978. [6] BETZ, A., Das maximum der theoretisch möglichen ausnützung des windes durch windmotoren. Zeitschrift für das gesamte Turbinewesen, pp. 307–309, September 20, 1920. [7] BILGILI M, SAHIN B, YASAR A., Application of artificial neural networks for the wind speed prediction of target station using reference stations data, Renewable Energy 2007; 32(14):235060. [8] BISHOP, C. M., Pattern Recognition and Machine Learning, volume 4 de Information science and statistics, Springer, 2006. [9] BOX, G. E. P., JENKINS, G. M. ET REINSEL, G. C., Time Series Analysis: Forecasting and Control (Wiley Series in Probability and Statistics), Wiley, 1994. Mémoire d’ingénieur/Master Professionnel 82 Hadnane OURO-AGBAKE ANNEXES [10] BUBNOVA R, HELLO G, BENARD P, GELEYN J-F., Integration of the fullyelastic equations cast in the hydrostatic pressure terrain-following coordinate in the framework of the ARPEGE/ALADIN NWP system, Mon Weather Rev 1995; 123:51535. [11] CASSOLA F, BURLANDO M., Wind speed and wind energy forecast through Kalman filtering of Numerical Weather Prediction model output, Appl Energy 2012; 99: 15466. [12] CARLIN P.W., A.S. LAXSON, E.B. MULJADI, the History and State of Art of Variable-Speed Wind Turbine Technology, NREL/TP-500-28607, Février 2001. [13] C.C. CHANG AND C.J LIN, LIBSVM: A library for support vector machines. ACM Transactions on Intelligent Systems and Technology, 2:27:1–27:27, 2011. [14] DORAN, A., Classification of wind turbines, http://www.articlesbase.com/electronics-articles/classification-of-wind-turbines429469.html. [15] EL-ALI, A., MOUBAYED, N. & OUTBIB, R., Comparison between solar and wind energy in Lebanon, Proc. of 9th Int. Conf. on Electrical Power Quality and Utilisation, Barcelona, 2007. [16] ERDEM E, SHI J., ARMA based approaches for forecasting the tuple of wind speed and direction. Appl Energy 2011; 88(4):140514. [17] EUROPEAN WIND ENERGY ASSOCIATION, Wind energy – the facts, part I: Technology, 2009, http://www.wind-energy-the-facts.org/en. [18] E. OSUNA, R. FREUND, AND F. GIROSI, An improved training algorithm for support vector machines, In Proceedings of the VIIth IEEE Workshop on Neural Networks for Signal Processing, pages 276–285. IEEE, 1997. Mémoire d’ingénieur/Master Professionnel 83 Hadnane OURO-AGBAKE ANNEXES [19] FOLEY, A.M., LEAHY, P.G., MARVUGLIA, A. AND MCKEOGH, E.J., Current Methods and Advances in Forecasting of Wind Power Generation, Renewable Energy, 37, 1-8, 2012. [20] FADARE DA, The application of artificial neural networks to mapping of wind speed profile for energy application in Nigeria, Appl Energy 2010; 87(3):93442. [21] GAN H. H., PASQUALI S., SCHLICK T, Exploring the repertoire of RNA secondary motifs using graph theory; implications for RNA design NAR, 31(11): 2926-43, 2003. [22] GIEBEL G, BADGER J, LANDBERG L, NIELSEN HAA, NIELSEN T, MADSEN H, SATTLER K, FEDDERSEN H, VEDEL H, TØFTING J, KRUSE L, VOULUND L., Wind Power Prediction Ensembles, Report 1527, Risoe National Laboratory, Denmark; 2005. [23] HAMILTON, J. D. (1994). Time Series Analysis, volume 3, Princeton Univ Pr. [24] HERWIG WENDT, PATRICK FLANDRIN, PATRICE ABRY, Régressions par machines à vecteurs supports pour la prédiction de séries chaotiques... GRETSI 2005, Sep 2005, Louvain-la Neuve, Belgique, GRETSI, pp.153-156, 2005. <ensl00144560>. [25] HUANG Z, CHALABI ZS, Use of time-series analysis to model and forecast wind speed, J Wind Eng Ind Aerodyn 1995; 56(2):31122. [26] KAVASSERI RG, SEETHARAMAN K., Day-ahead wind speed forecasting using f-ARIMA models, Renewable Energy 2009; 34(5):138893. [27] KANI SP, ARDEHALI MM., Very short-term wind speed prediction: a new artificial neural network Markov chain model, Energy Convers Manage 2011; 52(1):73845. [28] KODJO M. K., BÉDJA K., AJAVON A. S. A., FAYE R. M., LISHOU C., Neural network for predictive control of the mechanism of orientation of wind turbine, Mémoire d’ingénieur/Master Professionnel 84 Hadnane OURO-AGBAKE ANNEXES Journal des Sciences Pour l’Ingénieur(JSPI), Presses Universitaires de Dakar, N° 9, pp. 75-85, 2008. [29] K. MULLER, A. SMOLA, G. RATSCH, B. SCHOLKOPF, O. KOHL-MORGEN, AND V. VAPNIK, Predicting time series with support vector machines, Artificial Neural Networks, ICANN 97 (M. Hasler W. Gerstner, A. Germond and J.-D. Nicoud, eds.), Springer, 1997. [30] KALLEN E. HIRLAM documentation manual, System 2.5, Technical report, Sweden; 1996. [31] LI G, SHI J., on comparing three artificial neural networks for wind speed forecasting, Appl Energy 2010; 87(7):231320. [32] LIU H, TIAN HQ, LI YF., Comparison of two new ARIMA-ANN and ARIMAKalman hybrid methods for wind speed prediction, Appl Energy 2012; 98:41524. [33] LIU H, SHI J, ERDEM E., Prediction of wind speed time series using modified Taylor Kriging method, Energy 2010; 35(12):48709. [34] MA, L., LUAN, S.Y., JIANG, C.W., LIU, H L. AND ZHANG, Y., A Review on the Forecasting of Wind Speed and Generated Power, Renewable and Sustainable Energy Reviews, 13, 915-920, 2009. [35] MITCHELL, T. M., Machine Learning, volume 4 de McGraw-Hill Series in Computer Science, McGraw-Hill, 1997. [36] NELSON, V., Wind Energy Renewable Energy and the Environment, CRC Press, 2009. [37] RAGHEB, M., Optimal rotor tip speed ratio, 2009. [38] RENEWABLE ENERGY RESEARCH LABORATORY/UNIVERSITY OF MASSACHUSETTS AT AMHERST, Wind power: capacity factor, intermittency, and what happens when the wind doesn’t blow? Mémoire d’ingénieur/Master Professionnel 85 Hadnane OURO-AGBAKE ANNEXES [39] R.J. VANDERBEI, An interior point code for quadratic programming. Optimization methods and software, 11(1):451–484, 1999. [40] SALAMI A. A., TIEM S., LISHOU C., BEDJA K., La logique floue pour la prédiction de la moyenne horaire de la vitesse du vent sur le site de Lomé, Journal des Sciences Pour l’Ingénieur (JSPI), Presses Universitaires de Dakar, N° 8, pp. 8896, 2007. [41] SALAMI, A.A, AJAVON, A.S.A, KODJO, M.K. AND BEDJA, K. evaluation of wind potential for an optimum choice of wind turbine generator on the sites of Lomé, Accra, and Cotonou located in the gulf of guinea, int. Journal of Renawable Energy Development, 2016. [42] SALCEDO-SANZ S, PEREZ-BELLIDO AM, ORTIZ-GARCIA EG, PORTILLAFIGUERAS A, PRIETO L, PAREDES D., Hybridizing the fifth generation mesoscale model with artificial neural networks for short-term wind speed prediction, Renewable Energy 2009; 34(6):14517. [43] SCHOLKOPF B., TSUDA K., VERT J.-P., Kernel Methods in Computational Biology, MIT Press, 2004. [44] SHI J, ZENG S., Evaluation of hybrid forecasting approaches for wind speed and power generation time series, Renewable Sustainable Energy Rev 2012; 16(5):347180. [45] S. MUKHERJEE, E. OSUNA, AND F. GIROSI, Nonlinear prediction of chaotic time series using support vector machines, IEEE Workshop on Neural Networks for Signal Processing VII (N. Morgan J. Principe, L. Giles and E. Wilson, eds.), IEEE Press, 1997, p. 511 [46] TASCIKARAOGLU A, UZUNOGLU M., A review of combined approaches for prediction of short term wind speed and power, Renewable Sustainable Energy Rev 2014; 34:24354 Mémoire d’ingénieur/Master Professionnel 86 Hadnane OURO-AGBAKE ANNEXES [47] THE EUROPEAN WIND ENERGY ASSOCIATION, Wind in power 2015 European statistics. [48] T. JOACHIMS, Svm light. Software disponible à http://svmlight.joachims.org/ [49] ULGEN, K. & HEPBASLI, A., Determination of Weibull parameters for wind energy analysis of Izmir, Turkey, International Journal of Energy Research, 26(6), pp. 495–506, 2002. [50] VAPNIK V. N., The nature of statistical learning theory, Springer, 2000. [51] WEIBULL, W., A statistical distribution function of wide applicability, ASME Journal of Applied Mechanics, 18(3), pp. 239–297, 1951. [52] WEI TONG, Wind Power Generation and Wind Turbine Design, Koll morgen Corp., USA, 2010. [53] WEN-YEAU CHANG, A Literature Review of Wind Forecasting Methods, Journal of Power and Energy Engineering, 2014, 2, 161-168 [54] Wikistat.fr [55] WU, Y.K. AND HON, J.S., A Literature Review of Wind Forecasting Technology in the World, Proceedings of the IEEE Conference on Power Tech, Lausanne, 1-5 July 2007, 504-509, 2007. [56] ZHAO, X., WANG, S.X. AND LI, T, Review of Evaluation Criteria and Main Methods of Wind Power Forecasting. Energy Procedia, 12, 761-769, 2011. [57] ZHOU J, SHI J, LI G, Fine tuning support vector machines for short-term wind speed forecasting, Energy Convers Manage 2011; 52(4):1990. [58] “www.votresalaire.org/Togo” consulté le 10 avril 2012. Mémoire d’ingénieur/Master Professionnel 87 Hadnane OURO-AGBAKE