Exercice 2 (6 points)
Un site de vente en ligne de véhicule d'occasion cherche à programmer une machine apprenante qui, à partir de données d'achat déjà récolté, permet à l'utilisateur de visionner si une annonce est intéressante ou non, comme dans l'exemple ci-dessous.
2013 | 82000 km
7 990 €
Offre equitable
Pour cela, un analyste de données (Data Analyst) teste un premier modèle sur une même catégorie de véhicule. Il cherche à mettre en relation, à caractéristiques égales, le prix d'un véhicule et son kilométrage.

Après un premier tri de données, il regroupe ses résultats dans le tableau suivant :
Kilométrage (en km)
70 000
80 000
90 000
100 000
Rang du kilométrage : x,
7
8
10
Prix (en €) : y,
9 600
7 500
8 500
7800
150 000
15
6 500
170 000
17
5 590
200 000
20
5 000
Source: leboncoin.fr
1. Représenter, dans un repère orthogonal, le nuage de points de coordonnées (x,;y,). On prendra en abscisse 1 cm pour une unité, et en ordonnées 1 cm pour 500 € lon débutera les graduations à partir de 6 pour les abscisses, et de 4500 € pour les ordonnées).
2. Une valeur de ce nuage semble erronée. Laquelle ? Justifier votre réponse.
3. On souhaite corriger cette valeur pour limiter les erreurs de la machine apprenante. On la retire donc des données. Le nuage de points restant montre qu'un ajustement affine peut être envisagé. A l'aide de la calculatrice, donner une équation de la droite (d) d'ajustement de y en x, obtenue par la méthode des moindres carrés. On arrondira les coefficients en l'entier.
4. Représenter cette droite dans le graphique précédent.
5. Corriger la valeur pour 80 000 km, en justifiant.
6. Déterminer par le calcul le kilométrage approximatif d'un véhicule de cette catégorie coûtant
7000 €.
7. Un vendeur dépose l'annonce suivante :
2013 62000 km
9990€
La machine va-t-elle affirmer que c'est une bonne affaire, une mauvaise affaire, ou une affaire équitable ? Justifier.
8. L'analyste teste ensuite son modèle sur les données de vente suivantes :
Kilométrage (en km)
41500 62900 189000
Prix (en €)
11500
9589
5200
Il considère son modèle valide si, sur ces 3 données, 2 au moins sont valides à 15 % (c'est-à-dire si sur au moins deux de ces données, il y a moins de 15% d'erreur entre le prix donné par la machine et le prix réel).
Va-t-il valider ce modèle ?
Exercice 3 (6 points)

Répondre :

D'autres questions