Blog del grupo de Probabilidad y Estadística I impartido por Jacinto González Pachón (@jgpachon07) en el Grado de Ingeniería Informática de @informaticaupm
En primer lugar, se realizará un repaso de la Combinatoria y se resolverán algunos problemas del Tema 3, el primero de la UD 2. Para esta parte se utilizarán las trasparencias 19-28 del set de la clase del pasado jueves 23.
El Tema 4 tratará sobre cómo calcular la probabilidad de la intersección de dos sucesos cualesquiera. a)Se establecerán conexiones entre el operador"intersección" del Algebra de Boole y la operación "multiplicación" de la recta real. Se distinguirán dos escenarios:
cuando los sucesos se aportan información mutuamente, el cual dará origen al concepto de probabilidad condicionada
cuando los sucesos no se aportan información, origen de la independencia estocástica.
b)Se tratará de dos resultados básicos asociados al concepto de probabilidad condicionado y, por tanto, al aprendizaje desde el punto de vista probabilístico: el Teorema de la Probabilidad Total y elTeorema de Bayes.
Estas serán las trasparencias que se utilicen en clase:
Se plantearán y resolverán test y problemas de la UD 1. Recordad que el test de esta unidad se realizará el miércoles dia 22 de febrero, a las 14:00 en la antigua biblioteca (Bloque 2). Para la distribución de aulas, consultad la sección "Pruebas de Evaluación" en Moodle. Este es el listado de problemas que se resolverán en clase, por orden de exposición:
Test febrero 2015 y 2013
Ejercicios de autocomprobación nº 1-4, tema 1.
Ejercicios de autocomprobación nº 7, tema 1.
Ejercicios de autocomprobación nº 1-9, tema 2.
Recordad que lo más interesante será poder aclarar las dudas que os hayan surgido al intentar resolver los problemas.
Finalizaremos el Tema 2 desarrollando las medidas de forma y de relación
Las trasparencias que se usarán en este primer bloque serán desde de la 42 a la 60 del set usado en la clase pasad.
Segundo bloque: Primer informe práctico
Se discutirá cada punto del guión del Informe Práctico 1 incluido en Moodle.
En la clase se irá haciendo referencia a un conjunto de videos que, simultáneamente, servirán de guión y de manual práctico. Los videos fueron grabados hace dos años con pocos medios, poco tiempo (prácticamente improvisados, sin ningún guión detrás) y con otras circunstancias personales que detectaréis rápidamente al oirlos; i.e, un "catarro considerable" que me impedía a veces tener un discurso continuado. Aún así, creo que el material puede resultaros de utilidad. Debéis tomarlo como algo orientativo, y como un manual práctico audiovisual. No lo consideréis nunca como referencia para dar una interpretación de vuestros resultados. Para orientaros sobre esas interpretaciones tendremos las clases presenciales y las tutorías; que, os recuerdo, no sólo serán presenciales, sino que podéis utilizar Moodle, Skype, Telegram etc..
Si diera tiempo, en la última parte de la clase se resolverán problemas de la UD1. Aunque será la clase del jueves la que la dediquemos a éstos.
A continuación paso a describiros la práctica, punto a punto:
1.- Análisis Descriptivo de una variable estadística multidimensional
Describir gráficamente ese conjunto de datos multidimensionales
1.1 Diagrama de estrellas:
1.2 Matriz de diagramas de dipersión:
2.- Análisis Descriptivo de una variable estadística unidimensional
2.1. Tabla de frecuencias:
2.2. Histogramas y curvas de frecuencias relativas acumuladas:
2.3 Diagrama tallo-hoja:
2.4 Medidas resumen:
2.5 Diagrama de cajas:
NotaSi deseáis realizar la práctica con R, además del tutorial incluido en Moodle, puede resultaros útil la colección de videos que ha realizado el profesor Raúl García Castro.
--------------------- Importante. Recordad que el viernes dia 10, a las 13:00, finaliza el plazo para entregar los grupos de práctica a través de Moodle. -------------------
Si en el tema 1 nos interesabamos por el patrón subyacente en una serie de datos, en el tema 2 lo haremos por un conjunto de medidas que sintetice dicha serie, o al mismo patrón subyacente.
Dependiendo de lo que se pretenda caracterizar con dicha síntesis o resumen, surgirán diversas medidas:
a) Medidas de tendencia central: buscan caracterizar la uniformidad de los datos
b) Medidas de dispersión: buscan caracterizar la disparidad de los datos
c) Medidas de forma: buscan caractetizar la forma en la que se distribuyen los datos
d) Medidas de relación: buscar caracterizar la vinculación entre variables.
Las trasparencias que se usarán en la clase son las siguientes:
--------------------- Importante. Recordad que el viernes dia 10, a las 13:00, finaliza el plazo para entregar los grupos de práctica a través de Moodle. -------------------
La clase se estructurará en dos bloques.
Primer bloque: Final de Tema 1
Nos centraremos en el análisis estadístico de datosbidimensionales o bivariantes. En esta caso, se introducirán tres tipos de distribuciones de frecuencias: conjunta, marginales y condicionadas.
Se tratará de la representación tabular de la distribución conjunta, tabla de contingencia, así como de su representación gráfica, el histograma tridimensional.
A continuación se hablará de la relación existente entre esa tres distribuciones y del concepto de independencia de variables estadísticas.
Finalmente,se ofrecerá una breve introducción al análisis exploratorio de datos (AED).
Estas son las trasparencias para el primer bloque:
Segundo bloque: Comienzo del Tema 2 Si en el tema 1 nos interesabamospor el patrón subyacente en unaserie de datos, en el tema 2 lo haremos por un conjunto de medidas que sintetice dicha serie, o al mismo patrón subyacente. Dependiendo de lo que se pretenda caracterizar con dicha síntesis o resumen, surgirán diversas medidas: a) Medidas de tendencia central: buscan caracterizar la uniformidad de los datos
Primera clase dedicada a la teoría del Tema 1. En ella se empezará introduciendo las cuatro escalas de medidas de las que pueden proceder un conjunto de datos: nominal, ordinal, de escala y de razón.
En la clase de hoy nos centaremos en los datos unidimensionales
Se tratará la representación tabulary gráficade un conjunto de datos, basándonos en el concepto de frecuencia, o repetición.
El concepto de frecuencia, a su vez, sustentará la noción de patrón a la que hicimos mención en la clase anterior. A veces, para que se puedan dar repeticiones, se necesita agrupar los datos en clases. Se describirá cómo agrupar datosycuál es el número idóneo de clases.
De la representación gráfica se destacará al histograma, de cuyo perfil se extrae el patrón que subyace en un conjunto de datos.
Primera parte de la clase del jueves 2 de febrero de 2017
En esta primera parte de la clase se ha presentado información relevante sobrela asignatura parael curso 2016-17. Seguidamente, se han puesto en perspectiva los diferentes bloques de que consta la asignatura:
Estadística Descriptiva
Cálculo de Probabilidades
Inferencia Estadística.
Para ello se ha utilizado la idea de patrón, o de estructura subyacente a un conjunto de datos, como elemento vertebrador.
Uno de los objetivos de la Estadística Descriptiva es encontrar patrones dentro la información cuantitativa, una vez que estructuras algebraicas o algorítmicas han sido descartadas.
La extrapolación de dichos patrones es el objetivo fundamental de la Inferencia Estadística. Extrapolarimplica asumir posibles errores e incertidumbre. La sintaxis para trabajar en un escenario bajo incertidumbre la proporciona el Cálculo de Probabilidades.
Aquí están las trasparencias que se han usado durante la primera parte de la clase