In diesem Video zeige ich dir, wie die Funktionen für das Sortieren der Daten aussehen. Eine Schritt für Schritt Anleitung findest du auch unter dem Video.


Aufgabenstellung

  1. Erstelle eine Funktion für das Einlesen der Daten
  2. Erstelle eine Funktion für das Sortieren der Daten
  3. Erstelle eine Funktion für das Ermitteln der ersten 10 Datensätze
  4. Teste dein Programm
  5. Wechsel zur nächsten Aufgabe


Schritt für Schritt

1. Erstelle eine Funktion für das Einlesen der Daten

Schreibe die Funktion für das Einlesen der Daten. Der Name der Funktion ist "daten_laden()". Verwende die für das Laden die Funktion "read_csv()" aus der Bibliothek "pandas".

Dein Programm könnte so aussehen:


import pandas as pd
import matplotlib.pyplot as plt

DATEIPFAD = 'co2.csv'
TITEL_DIAGRAMM = 'Top 10 CO2-Emissionen nach Land'
X_BESCHRIFTUNG = 'Land'
Y_BESCHRIFTUNG = 'Emissionen (in Millionen Tonnen)'

def daten_laden(dateipfad):
	return pd.read_csv(dateipfad)

daten = daten_laden(DATEIPFAD)
daten_sortiert = daten_sortieren(daten)
top_10 = top_10_laender(daten_sortiert)
top_10_darstellen(top_10)

2. Erstelle eine Funktion für das Sortieren der Daten

Schreibe die Funktion für das Sortieren der Daten. Der Name der Funktion ist "daten_sortieren()". Verwende die für die Sortierung Funktion "sort_values()". Die Funktion erwartet zwei Parameter - den Namen der Spalte nach der sortiert wird und die Reihenfolge der Sortierung. 

Gib im ersten Parameterwert an, dass nach der Spalte "Emissionen" sortiert werden soll. Gib im zweiten Parameterwert der Funktion an,  dass die Daten absteigend nach dem Wert der Emissionen sortiert werden sollen.

Dein Programm könnte jetzt so aussehen:


import pandas as pd
import matplotlib.pyplot as plt

DATEIPFAD = 'co2.csv'
TITEL_DIAGRAMM = 'Top 10 CO2-Emissionen nach Land'
X_BESCHRIFTUNG = 'Land'
Y_BESCHRIFTUNG = 'Emissionen (in Millionen Tonnen)'

def daten_laden(dateipfad):
	return pd.read_csv(dateipfad)

def daten_sortieren(daten):
	return daten.sort_values(by="Emissionen", ascending=False)

daten = daten_laden(DATEIPFAD)
daten_sortiert = daten_sortieren(daten)
top_10 = top_10_laender(daten_sortiert)
top_10_darstellen(top_10)

3. Erstelle eine Funktion für das Ermitteln der ersten 10 Datensätze

Schreibe die Funktion für die Rückgabe der ersten 10 Datensätze. Der Name der Funktion ist "top_10_laender()". Verwende dafür die Funktion "head()". Diese Funktion benötigt als Parameter die Anzahl der Datensätze die zurückgegeben werden sollen.

Dein Programm könnte jetzt so aussehen:


import pandas as pd
import matplotlib.pyplot as plt

DATEIPFAD = 'co2.csv'
TITEL_DIAGRAMM = 'Top 10 CO2-Emissionen nach Land'
X_BESCHRIFTUNG = 'Land'
Y_BESCHRIFTUNG = 'Emissionen (in Millionen Tonnen)'

def daten_laden(dateipfad):
	return pd.read_csv(dateipfad)

def daten_sortieren(daten):
	return daten.sort_values(by="Emissionen", ascending=False)

def top_10_laender(daten):
	return daten.head(10)

daten = daten_laden(DATEIPFAD)
daten_sortiert = daten_sortieren(daten)
top_10 = top_10_laender(daten_sortiert)
top_10_darstellen(top_10)

4. Teste dein Programm

Kommentiere die Funktion aus, die später die Darstellung der Daten übernimmt. Gib mit print() deine Top 10 Daten aus.

Dein Programm könnte jetzt so aussehen:


import pandas as pd
import matplotlib.pyplot as plt

DATEIPFAD = 'co2.csv'
TITEL_DIAGRAMM = 'Top 10 CO2-Emissionen nach Land'
X_BESCHRIFTUNG = 'Land'
Y_BESCHRIFTUNG = 'Emissionen (in Millionen Tonnen)'

def daten_laden(dateipfad):
	return pd.read_csv(dateipfad)

def daten_sortieren(daten):
	return daten.sort_values(by="Emissionen", ascending=False)

def top_10_laender(daten):
	return daten.head(10)

daten = daten_laden(DATEIPFAD)
daten_sortiert = daten_sortieren(daten)
top_10 = top_10_laender(daten_sortiert)
print(top_10)

# top_10_darstellen(top_10)