«

»

feb 19

En lektion om regression och korrelation

En av punkterna i det centrala innehållet i den reviderade ämnesplanen i matematik för kurserna Matematik 2b och Matematik 2c är

  • Statistiska metoder för rapportering av observationer och mätdata från undersökningar inklusive regressionsanalys med digitala verktyg.

För Matematik 2b finns även punkten

  • Orientering och resonemang när det gäller korrelation och kausalitet.

Jag kommer i detta inlägg visa ett lektionsupplägg för en lektion som behandlar linjär regression och korrelation. Lektionen är en blandning av analoga (papper, penna och linjal) och digitala (Geogebra) övningar. Varje arbetsblad i Geogebra finns både som länk och som inbäddad applet i inlägget. I inlägget står även att eleverna ska diskutera med varandra på några ställen, då avses diskussioner i grupper om 4-5 elever följt av en helklassdiskussion.

Första delen är att låta eleverna manuellt anpassa en rät linje till ett antal punkter. Låt eleverna göra det med papper, penna och linjal, men också med hjälp av Geogebra. Detta för att visa på att en manuell anpassning bygger på känsla. Den digitala versionen syftar till att enkelt få fram en ekvation för linjen. Låt eleverna jämföra sin anpassningar med sina kamrater och be dem spara ekvationen. Vilken anpassning är bäst?

 

Den andra delen syftar till att ta fram en metod för att besvara frågan “Vilken anpassning är bäst?”. Detta kan göras genom att ge eleverna bilden nedan och be dem ta fram olika mått på hur linjen avviker för punkten. Att de tar fram olika mått är del av den kreativa sidan av lektionen och att de ska vara medvetna om att det inte finns ett givet sätt att mäta avvikelsen. Låt eleverna diskutera de olika måtten och vilket av måtten de tycker är bäst.

När de diskuterat sina olika mått be dem ta fram avvikelsen för de olika punkterna med de mått de valt. Be dem också att summera avvikelserna och se om det leder till något problem för måtten. Om ingen kommit fram till kvadraten på avvikelserna i y-led introducera det och berätta om minsta kvadratmetoden. Be sedan eleverna att manuellt ställa in den ekvationen de fick fram tidigare i detta nya arbetsblad. Vem hade den bäst anpassade ekvationen? Be dem också se om de kan hitta en bättre. Förklara också att det finns metoder som beräknar fram lämpliga funktioner och att dessa metoder finns t ex i Geogebra och de grafritande räknarnas bibliotek. Det vill säga man slipper att själv manuellt leta efter dem.

 

Den tredje delen av lektionen handlar om korrelation. De två första delarna har syftat till att belysa hur man kan få fram den linje som passar bäst, nu ska de undersöka ett mått på hur bra korrelationen mellan variablerna är. Ett sätt är att anta att det inte finns någon egentlig variation i y-värdena, det är slumpvisa avvikelser vid mätningen. Be eleverna diskutera hur man kan avgöra vilket detta egentliga y-värde är. Förhoppningsvis kommer någon elev fram till att man kan använda medelvärdet. Härifrån är steget inte långt till att jämföra kvadratavvikelserna för de båda modellerna. Förklara att man valt ett mått som kallas R^2 för att visa på hur bra korrelationen är och att den definieras enligt R^2 = 1 - \sum (y_i - y(x_i))^2/ \sum (y_i-y_{medel})^2. Måttet gör att med en perfekt anpassning till regressionslinjen så är R^2=1, mindre perfekta anpassningar får R^2 < 1 och katastrofala anpassningar får R^2 < 0. Jag har gjort ett tredje arbetsblad som visar en visuell framställning av R^2.

 

 

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Du kan använda följande HTML etiketter och attribut: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>