Proposta didáctica para materias da ESO e do Bacharelato

Proposta didáctica para a materia de segundo de bacharelato: Métodos estatísticos e numéricos

Aurora Labora Castro, Departamento de Matemáticas, IES Terra de Soneira (Vimianzo, A Coruña); Matilde Ríos Fachal, Departamento de Matemáticas, CPI Cruz do Sar (Bergondo, A Coruña).


Resumo
Neste traballo recollemos uns exemplos extraídos da proposta didáctica que elaboramos para a asignatura de segundo curso de bacharelato “Metodos Estatísticos e Numéricos” (MEN). Concretamente abordamos a introducción conceptual daqueles temas que son novedosos neste nivel de ensino, como son as Cadeas de Markov, a Inferencia e as Series Temporais.
 

Introducción
Cando por parte da editorial Baía se nos encomendou elaborar un texto para a nova materia de MEN, atopámonos coa dificultade de introducir contidos que, por vez primeira, se abordaban a nivel de alumnos de bacharelato. Ante este reto optamos por introducir os conceptos partindo dun problema sinxelo que motivara o alumno, e permitise seguir o tema a partir de distintos apartados.
A metodoloxía que seguimos fai fincapé na aplicación das técnicas estatísticas en detrimento de formalismos teóricos. Concretamente elaboramos un problema facendo uso dun persoaxe fictício, que bautizamos como Don Anselmo, e que fai de nexo de unión entre os distintos temas.


Cadeas de Markov
Como introducción ás cadeas de Markov partimos do seguinte problema: Don Anselmo sempre vai camiñando dende a súa casa á oficina e tamén volve andando. Para tratar de non mollarse cando chove, ten dous paraugas e decide actuar do seguinte xeito. Se antes de saír de casa, pola mañá cedo, observa que chove entón colle un dos paraugas para non mollarse (caso de ter algún na casa). Nese caso, ó chegar a oficina garda o paraugas no seu paraugüeiro. Antes de volver á súa casa dende o traballo realiza o mesmo proceso e, se se decata de que chove, toma un dos seus paraugas para volver a casa, sempre e cando teña algún. Ademais, suponse que Don Anselmo habita nunha húmida terra do noroeste da península ibérica onde a probabilidade de que choiva cando el marcha da casa (ou do traballo) é de 1/2.


Neste contexto, o número dos seus paraugas que hai no lugar no que se encontra (casa ou oficina) pode describirse mediante unha cadea de Markov. Vexamos os seus elementos. Os estados da cadea son 0, 1 e 2, xa que estes son os posibles valores para o número de paraugas que estean no mesmo lugar que Don Anselmo. Se indicamos con primeira etapa o momento en que Don Anselmo está na súa casa o primeiro día en que comeza o proceso, con segunda etapa o momento en que está na oficina nese mesmo primeiro día, con terceira etapa o momento en que xa volveu á casa o primeiro día (que a efecto do número de paraugas é o mesmo que o instante do segundo día xusto antes de que marche cara ó traballo), e así sucesivamente, tense un experimento composto cun número indefinido de etapas. Ademais é obvio que a probabilidade de que Don Anselmo teña 0, 1 ou 2 paraugas no lugar no que se encontra, sabidos os que tiña nas etapas anteriores, tan só depende dos que tiña xusto na etapa anterior. Máis concretamente, se tiña 0 paraugas na etapa n (supoñamos, por exemplo, na súa casa) é obvio que na etapa n+1 (na oficina, seguindo o noso exemplo) terá forzosamente 2, chova ou non chova. Se Don Anselmo ten 1 paraugas na etapa n, pode ter 1 tamén na etapa n+1 (se non chove, con probabilidade 1/2) ou ben 2 (se chove, é dicir, con probabilidade 1/2). Por último, se ten 2 paraugas na etapa n, pode acabar tendo 0, con probabilidade 1/2 (se non chove) ou 1, coa mesma probabilidade (se chove), na etapa n+1. Así pois, temos que o número de paraugas que ten Don Anselmo consigo é unha cadea de Markov que ademais é homoxénea con matriz de probabilidades de transición:

No resto do tema seguimos introducindo conceptos facendo uso do mesmo exemplo, así, por exemplo, se hoxe antes de irse á oficina, Don Anselmo ten dous paraugas na súa casa, a probabilidade de que dentro de tres días (ó volver do traballo) non teña ningún paraugas na casa é:


Para este cálculo facemos uso da potencia sexta da matriz de transición e obviamos o resultado que permite calcular a potencia n-ésima dunha matriz, facendo uso da súa diagonalización ( ), por considerar que estes conceptos quedan fora dos coñecementos do alumno.

Inferencia
Para introducir os conceptos de inferencia, e en particular a distribución da media mostral, consideramos unha poboación (trivial) formada polos catro rapaces que teñen entre 14 e 18 anos e viven no mesmo edificio que Don Anselmo. Os seus nomes e as súas estaturas (en centímetros) adxúntanse nas duas primeiras columnas da seguinte táboa:
 
Nome Estatura (cm) Mostra Estatura media 
Xoan 180 (Xoan, Uxía) 172
Uxía 164 (Xoan, Bieito) 170
Bieito 160 (Xoan, Iria) 179
Iria 178 (Uxía, Bieito) 162
 
 
 (Uxía, Iria) 171
 
 
 (Bieito,Iria) 169

A variable aleatoria X= “estatura dun rapaz escollido ao chou desta poboación” ten a seguinte masa de probabilidade


A media e a varianza poboacional da estatura (para esta pequena poboación) son:


Supoñamos que Don Anselmo non coñece estes valores e que decide estimar a estatura media extraendo unha mostra de tamaño dous da poboación. Se utilizamos a mostraxe aleatoria simple (que de non dicir nada en contra e o que sempre suporemos), as seis posibles mostras de tamaño dous desta poboación son: (Xoan, Uxía), (Xoan, Bieito), (Xoan, Iria), (Uxía, Bieito), (Uxía, Iria) e (Bieito, Iria). Deste xeito, o estimador media mostral, como variable aleatoria que é, ten unha distribución discreta dada pola seguinte masa de probabilidade :


A partir deste exemplo introducimos ao alumno no problema da estimación.


Series temporais
Finalmente no tema de series temporais introducimos unha serie semanal que corresponde ao problema da asistencia a unha academia de inglés (á que supoñemos acude o noso personaxe) e que ten un total de 150 matriculados. O director observa e recopila o número de alumnos que asisten diariamente durante catro semanas co fin de estudiar a súa evolución temporal. Os datos obtidos son os seguintes:
 
Luns Martes Mércores Xoves Venres Total
97 85 101 103 118 504
98 85 99 102 113 497
96 84 100 103 118 501
99 86 102 104 119 510

Na táboa parece observarse que o día da semana inflúe bastante no número de asistentes á academia. Imos comprobalo calculando os coeficientes de autocorrelación a distintos retardos.

Para calcular a correlación para o retardo de orde 1, deberemos calcular previamente a correspondente covarianza:


De forma similar se poden calcular os demais parámetros e representar o gráfico do correlograma, así como calcular tendencias, índices estacionais, etc.


Referencias
Cao R., Labora A. Naya S. e Ríos M. (2001). Métodos Estatísticos e Numéricos. BAÍA EDICIÓNS.

2017  SGAPEIO   globbers joomla templates