Outils pour utilisateurs

Outils du site


snt:donnee:acsvcroiser

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
snt:donnee:acsvcroiser [2019/09/26 11:08]
techer.charles_educ-valadon-limoges.fr [Je croise les données]
snt:donnee:acsvcroiser [2021/01/29 12:20] (Version actuelle)
techer.charles_educ-valadon-limoges.fr [Je croise les données]
Ligne 2: Ligne 2:
 ===== Présentation du mini projet ===== ===== Présentation du mini projet =====
 Je vais utiliser des **données ouvertes** (Open Data) pour **localiser** des communes qui répondent aux critères suivants : Je vais utiliser des **données ouvertes** (Open Data) pour **localiser** des communes qui répondent aux critères suivants :
-  * **communes** entre 10 000 et **15 000 habitants** ;+  * **communes** entre **10 000** et **15 000** habitants ;
   * **température** de la région de la commune qui **ne dépasse par 30° en été** ;   * **température** de la région de la commune qui **ne dépasse par 30° en été** ;
   * **température** de la région de la commune qui **ne descend pas au dessous de 18°**.   * **température** de la région de la commune qui **ne descend pas au dessous de 18°**.
  
-Pour cela ce projet, je vais **traiter de plusieurs collections de données** et **croiser les données disponibles** pour obtenir les informations voulues.+Pour cela ce projet, je vais **traiter plusieurs collections de données** et **croiser les données disponibles** pour obtenir les informations voulues.
  
 ===== Je récupère la collection de données sur la population ===== ===== Je récupère la collection de données sur la population =====
Ligne 18: Ligne 18:
 <WRAP center round todo> <WRAP center round todo>
   * **Question 1 ** : je prends connaissance des **métadonnées** et je note la **taille du fichier sur disque** en **octets** et en **Mo**.   * **Question 1 ** : je prends connaissance des **métadonnées** et je note la **taille du fichier sur disque** en **octets** et en **Mo**.
-  * **Question 2 ** : **recherche quel calcul** permet d'afficher la taille en Mo à partir de la taille en octet.+  * **Question 2 ** : Quelle **opération de calcul** a permis d'afficher la **taille en Mo** à partir de la taille en octet.
 </WRAP> </WRAP>
  
 ===== Je prépare le fichier sur la population  ===== ===== Je prépare le fichier sur la population  =====
   * Je **cherche** parmi les différentes collections de données situées dans des onglets différentes, la **collection ** qui me parait **la plus intéressante** pour connaître la population des communes ;   * Je **cherche** parmi les différentes collections de données situées dans des onglets différentes, la **collection ** qui me parait **la plus intéressante** pour connaître la population des communes ;
-  * je supprime toutes les autres collections de données ;+  * je **supprime** toutes les autres collections de données ;
   * dans la collection de données que j'ai gardée, je **supprime** les lignes d'entête pour ne garder que les lignes des **descripteurs** et des **données** ;   * dans la collection de données que j'ai gardée, je **supprime** les lignes d'entête pour ne garder que les lignes des **descripteurs** et des **données** ;
 <WRAP center round todo> <WRAP center round todo>
-  * **Question 3 ** : je note les **descripteurs** de cette collection qui sont **utiles** à mon projet : Code région ; Nom de la région ; Nom de la commune ; Population totale . +  * **Question 3 ** : Quels sont **descripteurs** de cette collection qui seront **utiles** à mon projet ? 
-  * **Question 4 ** : Combien de communes contient cette collections de données ? : 35842+  * **Question 4 ** : **Combien** de communes sont contenues cette collections de données ?
 </WRAP> </WRAP>
-  * **j'enregistre** mon travail au **format csv sous un autre nom** pour l'appeler **communes.cvs**+  * **j'enregistre** mon travail au **format xslx sous un autre nom** pour l'appeler **communes.xlsx**
  
 ===== Je récupère la collection de données sur les températures quotidiennes régionales ===== ===== Je récupère la collection de données sur les températures quotidiennes régionales =====
-  * **j'ouvre le fichier des tempatures accède** au site www.data.gouv.fr pour récupérer les données de températures quotidiennes régionales au format cvs. +  * **j'accède** au site www.data.gouv.fr pour récupérer les données de températures quotidiennes régionales au format cvs. 
-  * en ouvrant le fichier csv avec Excel, je constate que les caractères accentués ne sont pas correctement interprétés. Il y a un problème d'encodage des caractères. +  * en **ouvrant** le fichier csv avec Excel, je constate que les caractères accentués ne sont pas correctement interprétés. Il y a un **problème d'encodage des caractères**
-  * Je crée un nouveau classeur Excel puis dans le menu données, je choisis **A partir d'un fichier texte/csv** ;+  * Je **crée** un nouveau classeur Excel puis dans le menu **données**, je choisis **A partir d'un fichier texte/csv** ;
   * je choisis dans mon dossier SNT le fichier **temperature-quotidienne-regionale.csv** ;   * je choisis dans mon dossier SNT le fichier **temperature-quotidienne-regionale.csv** ;
-  * lors de **l'importation** je sélectionne comme **origine** du fichier **65001 : Unicode (UTF-8)** puis le clique sur **Charger** ;+  * lors de **l'importation** je sélectionne comme **origine** du fichier **65001 : Unicode (UTF-8)** puis je clique sur **Charger** ;
 {{  :snt:donnee:excelencodage_01.png  |}} {{  :snt:donnee:excelencodage_01.png  |}}
-  *  **J'enregistre** le fichier ensuite dans mon dossier SNT personnel au **format xls ou xlsx** sous le nom temperature.xlsx+  *  **J'enregistre** le fichier ensuite dans mon dossier SNT personnel au **format xlsx** sous le nom **temperature.xlsx**
 <WRAP center round todo> <WRAP center round todo>
-  * **Question 5 ** : je prends connaissance des **métadonnées** et je note la **taille du fichier sur disque** du fichier temperature.xlsx. 812 Ko +  * **Question 5 ** : je prends connaissance des **métadonnées** et je note la **taille du fichier sur disque** du fichier temperature.xlsx. 
-  * **Question 6 ** : Sur quelles périodes ont été relevé ces mesures de températures ? 1er janvier 2016 au 31 décembre 2017 +  * **Question 6 ** : Sur quelles périodes ont été relevé ces mesures de températures ?  
-  * **Question 7 ** : Comment ces donnés ont-elles été obtenues ? par le réseau de stations météorologiques françaises.+  * **Question 7 ** : Comment ces données ont-elles été obtenues ? 
 </WRAP> </WRAP>
 ===== Je prépare le fichier sur les températures  ===== ===== Je prépare le fichier sur les températures  =====
Ligne 49: Ligne 49:
   *   * J'utilise la fonctionnalité d'Excel **Filtres numériques** pour trouver les régions avec les températures minimales et maximales voulues ainsi que les température de cette année 2019.   *   * J'utilise la fonctionnalité d'Excel **Filtres numériques** pour trouver les régions avec les températures minimales et maximales voulues ainsi que les température de cette année 2019.
 <WRAP center round todo> <WRAP center round todo>
-  * **Question 8 ** : quels sont les codes des régions dont la températures en 2019 étaient comprise en ytre 10 et 30 degrés ? 11 ; 24 ; 27 ; 32 ; 44 ; 52 ; 53 ; 75 ; 76 ; 94 +  * **Question 8 ** : quels sont les codes des régions dont les températures en 2019 ont pu être être comprises sur une journée entre 18 et 30 degrés ? 
 </WRAP> </WRAP>
  
 ===== Je croise les données ===== ===== Je croise les données =====
 <WRAP center round todo> <WRAP center round todo>
-  * **Question 9 ** : quels sont les descripteurs communs aux deux tables **communes.xlsx** et **temperatures.xlsx** ? Code région et Code Insee région+  * **Question 9 ** : quels sont les descripteurs communs aux deux tables **communes.xlsx** et **temperatures.xlsx** ?
 </WRAP> </WRAP>
   * En utilisant les informations des 2 tables **communes.xlsx** et **temperature.xlsx** ainsi que les fonctions de filtre et de tri d'Excel répond aux question suivantes :   * En utilisant les informations des 2 tables **communes.xlsx** et **temperature.xlsx** ainsi que les fonctions de filtre et de tri d'Excel répond aux question suivantes :
-  * <WRAP center round todo> +<WRAP center round todo> 
-  *   * **Question 10 ** : combien de communes de 10 000 à 15 000 habitants sont dans une région où les températures en 2019 sur une journée ont été comprises entre en 18 et 30 degrés ? 258 sur 35382 +  *   * **Question 10 ** : combien de communes de 10 000 à 15 000 habitants sont dans une région où les températures en 2019 sur une journée ont été comprises entre en 18 et 30 degrés ? 
-  *  **Question 11 ** : quelles sont les communes de la Haute-vienne qui répondent à ces critères ? Panazol et Saint-Junien+  *  **Question 11 ** : quelles sont les communes de la Haute-vienne qui répondent à ces critères ? 
 </WRAP> </WRAP>
 +==== Je continue ... ====
 +<WRAP center round info >
 +Je reviens à l'accueil SNT du thème [[:snt:donnee:accueil|Les données structurées et leur traitement]] 
 +</WRAP>
 +
 +
 +
snt/donnee/acsvcroiser.1569488913.txt.gz · Dernière modification: 2019/09/26 11:08 de techer.charles_educ-valadon-limoges.fr