¿Qué es Mullu?

Mullu es un blog que recoge apuntes acerca de Economía; publica, por lo general, cada martes un artículo tipo ensayo. Su licencia permite que puedas utilizar este contenido de forma libre, con las condiciones de la licencia Creative Commons 4.0 de Reconocimiento Internacional citando a Pablo Iván como su autor excepto cuando se especifique lo contrario. Su autor recoge material bibliográfico de varias fuentes como textos académicos confiables pero como preferencia utiliza contenidos con licencia libre. Los contenidos son de acceso público y no tienen fines comerciales.

¡Esta es toda la letra pequeña!, no son necesarias las cookies para este blog ni nada que ponga en riesgo tu privacidad, ten confianza 🙂

¿Te parece interesante la política que maneja este blog?
¡Involúcrate!, el maravilloso mundo del conocimiento libre te espera para que lo descubras y formes parte de él.

Para recibir actualizaciones en tu lector de RSS, añade: http://mullu.pabloivan.com/?feed=atom

Representación de tallo y hoja

En el caso de la Distribución de frecuencias no se visualiza la identidad de los datos, esto quiere decir que se sabe la frecuencia con la que se repite la inclusión de un observación dentro de una clase pero no el valor real de cada observación. Para ello existen otras formas de representar los datos tal como lo hace el método de Tallo y hoja. Se le llama Tallo al primer dígito desde la izquierda del número de cada observación, así de la observación 100, el tallo es 1 y Hoja se le llama al resto de dígitos o sea al segundo dígito contando de izquierda a derecha que en el caso de la observación 100 son los dígitos 00.

La Representación de tallo y hoja se trata de una técnica para mostrar un conjunto de datos cuantitativos de donde los dígitos principales de cada observación se los considera como tallo y el resto de dígitos como hoja.

Si hipotéticamente tenemos un conjunto de datos como el siguiente:

159

156

255

254

235

217

566

148

169

195

236

325

398

652

458

439

321

123

351

357

159

265

267

213

249

267

168

178

349

367

259

349

179

368

258

194

388

439

401

449

314

303

202

109

455

521

208

166

179

209

357

159

128

265

344

349

127

300

290

150

165

220

349

480

410

205

401

131

307

290

130

404

521

404

301

100

120

160

267

378

129

287

198

355

190

266

370

449

159

267

349

157

395

295

109

246

365

295

426

123

podemos decir que el valor mas bajo es 100 por lo que el primer tallo será de 10 y el mas alto es 652, por el que el último tallo será 62 quedando de la siguiente manera:

Representación de tallo y hoja
Tallo Hoja
10 0,9,9
11  
12 0,3,3,7,8,9
13 0,1
14 8
15 0,6,7,9,9,9,9
16 0,5,6,8,9
17 8,9,9
18  
19 0,4,5,8,
20 2,5,8,9
21 3,7
22 0
23 5,6
24 9
25 4,5,8,9
26 5,5,6,7,7,7,7
27  
28 7
29 0,0,5,5
30 0,1,3,7
31 4
32 1,5
33  
34 4,9,9,9,9,9
35 1,5,7,7
36 5,7,8
37 0,8
38 8
39 5,8
40 1,1,4,4
41 0
42 6
43 9,9
44 9,9
45 5,8
46  
47  
48 0
49  
50  
51  
52 1,1
53  
54  
55  
56 6
57  
58  
59  
60  
61  
62  
63  
64  
65 2

Distribución de frecuencias relativas

Una variación de la Distribución de frecuencias es la Distribución de frecuencias relativas, en donde las frecuencias de cada clase se convierte en un porcentaje del tamaño del total de observaciones. Esto se obtiene dividiendo la frecuencia de cada clase para el total de observaciones. Tomando la siguiente tabla de observaciones:

159

156

255

254

235

217

566

148

169

195

236

325

398

652

458

439

321

123

351

357

159

265

267

213

249

267

168

178

349

367

259

349

179

368

258

194

388

439

401

449

314

303

202

109

455

521

208

166

179

209

357

159

128

265

344

349

127

300

290

150

165

220

349

480

410

205

401

131

307

290

130

404

521

404

301

100

120

160

267

378

129

287

198

355

190

266

370

449

159

267

349

157

395

295

109

246

365

295

426

123

desarrollamos la Distribución de frecuencias y nos queda de la siguiente forma:

Distribución de frecuencias

Clases

Frecuencia

100 a 179

27

180 a 259

19

260 a 339

19

340 a 419

23

420 a 499

8

500 a 579

3

580 a 660

1

Luego de obtener la Distribución de frecuencias, calculamos la frecuencia relativa para cada clase por lo que para la primera clase la operación será: 27/100 = 0,27 y si se desea se puede convertir en porcentaje multiplicando este valor por 100 y agregando el signo % de la siguiente forma: 0,27 * 100 = 27%. Para la segunda clase: 19/100 = 0,19 ; 0,19 * 100 = 29%.

De 100 a 179

Hay 27 observaciones

0.27

27%

De 180 a 259

Hay 19 observaciones

0.19

19%

De 260 a 339

Hay 19 observaciones

0.19

19%

De 340 a 419

Hay 23 observaciones

0.23

23%

De 420 a 499

Hay 8 observaciones

0.08

8%

De 500 a 579

Hay 3 observaciones

0.03

3%

De 580 a 660

Hay 1 observación

0.01

1%

Total de 100 a 660

Hay 100 observaciones

1

100%

y la tabla final quedaría de la siguiente forma:

Distribución de frecuencias

Clases

Frecuencia

Frecuencia relativa

Porcentaje

100 a 179

27

0.27

27%

180 a 259

19

0.19

19%

260 a 339

19

0.19

19%

340 a 419

23

0.23

23%

420 a 499

8

0.08

8%

500 a 579

3

0.03

3%

580 a 660

1

0.01

1%

Total

100

1

100%

Elaboración de una distribución de frecuencias

Dentro de la estadística descriptiva, la necesidad de mostrar los datos agrupados hace que su utilicen diferentes herramientas y entre ellas, tenemos la: Distribución de frecuencias: que es el agrupamiento de todos los datos en categorías, intervalos o clases mutuamente excluyentes y que muestran el número de observaciones por cada clase.

Ejemplo de cómo se elabora una distribución de frecuencias

Vamos a considerar el siguiente conjunto de datos desorganizados o sin procesar que son hipotéticos y que bien pueden representar un caso en donde se ha recolectado información cuantitativa:

159

156

255

254

235

217

566

148

169

195

236

325

398

652

458

439

321

123

351

357

159

265

267

213

249

267

168

178

349

367

259

349

179

368

258

194

388

439

401

449

314

303

202

109

455

521

208

166

179

209

357

159

128

265

344

349

127

300

290

150

165

220

349

480

410

205

401

131

307

290

130

404

521

404

301

100

120

160

267

378

129

287

198

355

190

266

370

449

159

267

349

157

395

295

109

246

365

295

426

123

Primer paso: Es necesario determinar el número de clases. Para ello se debe calcular la cantidad de categorías, intervalos o clases necesarias a mostrar en la distribución de frecuencias. Pocas clases harían que no se visualicen bien los datos y su distribución, así como también demasiadas clases distorsionar una apreciación. Para ello se utiliza la regla 2 a la k que sugiere como cantidad de clases, el menor número k que 2k sea mayor que el número de observaciones. En nuestro ejemplo tenemos 100 observaciones y el menor número k que al ser exponente de 2 su resultado sea mayor a 100 es 7. O sea 27 es la menor potencia de 2 que es mayor al número de observaciones (100)

Segundo paso: Necesitamos determinar la amplitud del intervalo para lo cual determinamos primeramente el valor mas alto (652) y el mas bajo (100) para luego hallar la amplitud de toda la población. Esta amplitud la hallaremos restando del valor máximo el valor mínimo, por lo que la resta sería: 652 – 100 = 552 y esto dividido para el valor k del paso anterior nos quedaría: 552/7 = 78,867. A este valor lo redondeamos hacia algún múltiplo de 1, 10 o 1 000 dependiendo del caso, pero para nuestro ejercicio será 80.

Tercer Paso: con los valores obtenidos en el paso anterior, ahora necesitamos establecer los límites de clase que permita incluir todas las observaciones en una clase de forma mutuamente excluyente. Recordamos que mas bajo es 100 y la amplitud del intervalo es 80. Entonces los límites de clase serán:

100 + 80 = 180

De 100 a 179

180 + 80 = 260

De 180 a 259

260 + 80 = 340

De 260 a 339

340 + 80 = 420

De 340 a 419

420 + 80 = 500

De 420 a 499

500 + 80 = 580

De 500 a 579

580 + 80 = 660

De 580 a 660

Cuarto Paso: Necesitamos averiguar cuántas observaciones hay en cada intervalo. Para ello necesitamos distribuir cada observación en las distintas clases y contar el total de cada clase.

De 100 a 179

Hay 27 observaciones

De 180 a 259

Hay 19 observaciones

De 260 a 339

Hay 19 observaciones

De 340 a 419

Hay 23 observaciones

De 420 a 499

Hay 8 observaciones

De 500 a 579

Hay 3 observaciones

De 580 a 660

Hay 1 observación

Total de 100 a 660

Hay 100 observaciones

Este paso puede ser mas práctico realizarlo ordenando en una hoja electrónica utilizando la función contar(<intervalo de celdas>).

Distribución de frecuencias

Clases

Frecuencia

100 a 179

27

180 a 259

19

260 a 339

19

340 a 419

23

420 a 499

8

500 a 579

3

580 a 660

1

Tipos de estadística

Existen 2 grandes tipos de estadística por una parte tenemos la:

Estadística descriptiva: que se centra en la organización y presentación de datos con fines informativos

En este tipo de estadística, la intención va por el lado de informar datos o índices estadísticos que nos den una idea o proporción de algo. No proyecta, predice o infiere en ningún dato o conjunto de datos.

Para la presentación de estos datos se utilizan algunas medidas de tendencia central como la media, mediana, moda, etc. o en casos donde los datos están desordenados, se utiliza una distribución de frecuencias

Estatura media.svg
De Pioneer_plaque_line-drawing_of_a_human_male.svg: created by *derivative work: Tartaglia (talk) – Pioneer_plaque_line-drawing_of_a_human_male.svg, Dominio público, Enlace

Estadística inferencial: También llamada estadística inferencial o inferencia estadística y estadística inductiva, son los conjuntos de métodos que se utilizan para saber algo acerca de una población, basándose en una muestra.

Dentro de la estadística (al igual que otras ciencias), se utiliza un vocabulario específico para definir algunos conceptos. Por lo que iremos definiendo algunos de ellos.

Población: Conjunto universo de individuos, objetos o medidas de interés

Muestra: subconjunto del conjunto población.

Linear regression.svg
De SewaquTrabajo propio, Dominio público, Enlace

¿Qué es Estadística?

¿Qué es Estadística?

Wikipedia la define como:

es una ciencia formal y una herramienta que estudia usos y análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

O dicho de otra forma:

es la ciencia que recolecta, organiza, presenta, analiza e interpreta datos para una toma de decisiones.

Por lo tanto el primer paso dentro de un investigación es la recolección de los datos que deben organizarse de cierta manera y que puede representarse en gráficos.

The Normal Distribution.svg
De Heds 1 de Wikipedia en inglés – Transferido desde en.wikipedia a Commons por Abdull., Dominio público, Enlace

¿Porqué estudiar estadística?

Dentro de una carrera profesional pueden presentarse muchas necesidades específicas de estudio y análisis de problemas y casos. En una carrera de medicina se necesita para entender y manejar la bioestadística, así como también en Economía, la Estadística es una importante herramienta para la Econometría, Macroeconomía y Microeconomía. Por lo que el estudio de la estadística puede ser necesario en la mayoría de las carreras donde manejamos información numérica.

Metodología de la Econometría

Planteamiento de la teoría o de la hipótesis

Primeramente se toma en cuenta la teoría económica que será analizada con los modelos econométricos, para proponer un ejemplo práctico, escogemos la teoría que propone Keynes, la Propensión Marginal a Consumir o PMC, cuyo enunciado es:

La ley psicológica fundamental… consiste en que los hombres [y las mujeres], como regla general y en promedio, están dispuestos a incrementar su consumo a medida que aumenta su ingreso, pero no en la misma cuantía del aumento en su ingreso.1

Especificación del modelo matemático

La PMC es una relación directa o positiva, sin embargo dentro de la redacción de esta teoría, su autor Keynes, no especifica la forma precisa de la forma funcional de esta ley, por lo que se hace necesario proponer su forma funcional y sería la siguiente:

  • Y = gasto en consumo
  • X = ingreso
  • y = parámetros del modelo. Coeficiente del intercepto () y de la pendiente ( )

Cabe indicar el nombre y la función de cada unos de los elementos que forman esta ecuación:

  • El coeficiente de la pendiente es y en nuestro ejemplo mide la PMC.

  • La variable que aparece al lado izquierdo del signo de la igualdad (Y), se llama variable dependiente, y las variables que aparecen en el lado derecho son las variables independientes, o explicativas.

  • Los coeficientes , , … son los parámetros del modelo.

    • Es el intercepto

    • es la pendiente de la función

Especificación del modelo econométrico

En este paso cambiamos el modelo matemático por un modelo econométrico. Los modelos matemáticos son exactos o deterministas, sus predicciones están basadas en modelos que a menudo no interesan mayormente al econometrista. Las relaciones entre las variables económicas siempre son inexactas pues su naturaleza radica en cuestiones humanas y otras no previsibles. Algunas veces estas variables suelen ser muy influyentes en los modelos econométricos por lo que no se las puede dejar de lado. La diferencia entre un estudio matemático preciso, predecible y exacto con una predicción econométrica, inexacta e impredecible es justamente lo que hace de la econometría una disciplina tan emocionante en algunos casos o abrumadora en otros.

Para incluir todas las variables inexactas que no están previstas en el modelo pero que forman parte de él, se agrega un término de perturbación o error en donde se agrupan todos los factores que están dentro del modelo propuesto pero no lo afectan directamente. Por lo tanto la ecuación de un modelo econométrico tendría la siguiente forma:

En la ecuación 2 tenemos un modelo econométrico en su forma general en el que se puede representar la función de consumo con las perturbaciones agrupadas en el término de perturbación o errorque es una variable aleatoria o estocástica que representa a todos los factores que afectan el consumo pero que no se consideran dentro del modelo en forma explícita.

Esta ecuación es un modelo econométrico y también es un modelo de regresión lineal, el cual planteado de esta manera nos permitirá hacer estimación e inferencias estadísticas.

Obtención de información

Para la obtención de resultados fiables necesitamos datos, entre mas datos fiables, los resultados también serán mas fiables. Dentro de la obtención de datos tal vez haya disciplinas enteras dedicadas a la metodología y manejo para la obtención de datos. Es importante saber cómo se obtuvieron estos para poder hacer una regresión y una estimación confiable.

Para poder presentar ejemplos, tomaremos los datos de la economía de los EEUU de los años entre el periodo de 1960 a 2005, de donde Y representará los gastos personales de consumo agregado, X como el PIB que es una medida de ingreso agregado, ambos medidos en miles de millones de dólares de el año 2000 por lo que se consideran valores reales de los dólares.

Estimación del modelo econométrico

Luego de la obtención de datos y de su tratamiento para ser presentados, estimamos los parámetros de la función, o sea los valores y de la ecuación 2: y para ello utilizamos la técnica estadística conocida como análisis de regresión que es la herramienta principal para obtener las estimaciones de un modelo de regresión econométrico.

Para ello recomiendo usar el software Gretl creado bajo una licencia libre para estimar las regresiones.

Los resultados que nos arroja Gretl al realizar el análisis de regresión sobre los datos de la tabla 1, son: para y para por lo tanto la función de consumo estimada quedaría de la siguiente forma:

y también podemos apreciar en el siguiente gráfico como a través de los años va aumentando el consumo de la misma forma como aumenta el ingreso personal, sin embargo los datos también muestran ciertas perturbaciones que hacen que los puntos no estén precisamente sobre la recta, sin embargo no están tan dispersos como para poder hacer predicciones e inferencias (de esto se trata la econometría).

Gráfico1

Prueba de hipótesis

Luego de obtener los datos de los estimadores, es necesario hacer algunas comprobaciones. En algunos casos los datos bien pueden coincidir con los valores esperados y ser simplemente un fenómeno causado por el azar sin fundamento teórico o también puede suceder que los datos muestren ciertas tendencias por efectos de causas diferentes a las que se proponen en el planteamiento de la teoría o de la hipótesis, por lo que es necesario realizar las pruebas de hipótesis necesarias para darle fiabilidad al proceso y para que pueda ser admitida como investigación científica.

Para realizar estas pruebas de hipótesis se necesitarán utilizar las herramientas de inferencias estadísticas.

Pronóstico o predicción

Luego de realizar las pruebas de hipótesis y no haber sido rechazadas podremos hacer predicciones o pronósticos con el nuevo modelo planteado. La variable dependiente puede ser pronosticada por medio de este modelo para políticas de control o de planificación. Volviendo al ejemplo anterior, de acuerdo a la tabla 1, el gasto de consumo personal agregado en 2005 fue de 7841,2 y el PIB de ese mismo año fue de 11048,6 y se pretender estimar cuál será el gasto de consumo para el año 2006 dados los datos de gasto de consumo y PIB desde 1960. Luego de plantar la hipótesis y hacer las regresiones, deducimos que este sería el modelo de gasto de consumo en EEUU desde 1960 hasta 2005 dado el ingreso (PIB):

Por lo tanto para predecir el gasto de consumo para el año 2006 sustituimos el valor 11 319,4 en X y quedaría de la siguiente manera:

lo que nos daría como resultado 7 870,7516 como gasto de consumo estimado para el año 2006

Uso del modelo para fines de control o políticas

Luego de haber calculado y estimado los valores futuros de las variables, su uso va orientado de acuerdo a las políticas económicas planeadas. Para el ejemplo propuesto suponiendo que estamos en el año 2005 y que deseamos calcular cuál debe ser el nivel de ingresos para que se mantenga en el mismo nivel el desempleo, la pregunta sería: ¿que nivel de ingresos se necesita alcanzar para que se mantenga el gasto de consumo y mantener la misma tasa de desempleo?

Si los datos son fiables, la regresión fue bien realizada y se pasó la prueba de hipótesis, podríamos decir que 8 750 = −299.584 + 0.721833(PIB2006), que da un valor de 12 537 para el valor de X. Lo que se puede concluir que con un nivel de ingresos de alrededor de 12 537 (miles de millones) de dólares mas una PMC de cerca de 0,72 se producirá un gasto aproximado de 8 750 millones de dólares para el año 2006 en los EEUU. Estos resultados marcarán el camino para dictar las políticas fiscal y monetaria que el gobierno debe manejar, utilizando X como la variable de control X para producir el nivel deseado de la variable objetivo Y.

A continuación, a manera de resumen se publica la siguiente presentación

1John Maynard Keynes, The General Theory of Employment, Interest and Money, Harcourt Brace Jovanovich, Nueva York, 1936, p. 96.

¿Qué es Econometría?

La palabra econometría viene del griego οἰκονόμος oikonómos ‘reglas para la administración doméstica’ y μετρία metría, ‘relativo a la medir’ por lo tanto la traducción literal de Econometría vendría a ser “medición de la economía” o “medición económica”, sin embargo esta definición no abarca en su totalidad todos los ámbitos que estudia y analiza esta materia, por lo que revisaremos un par de conceptos mas cercanos a lo que realmente hace la Econometría.

Rama de la economía que utiliza los métodos estadísticos para medir y estimar relaciones económicas cuantitativas.1

Rama de la economía que utiliza técnicas estadísticas y matemáticas con el objeto de estudiar las relaciones entre diferentes variables económicas para su mejor compresión, interpretación y predicción. 2

La teoría económica se encarga de dictar ciertas leyes que regulan los fenómenos económicos, como por ejemplo la Propensión Marginal de Consumo, que indica que si un individuo aumenta sus ingresos, es de esperarse que su consumo aumente pero no en la misma proporción en la que crecieron sus ingresos. La teoría económica nos redacta estas líneas pero es la Econometría la que se encarga de decirnos cuantitativamente cuánto es el aumento de ese consumo (para el ejemplo anterior).

Metodología de la Econometría

La econometría utiliza varias metodologías para la resolución de sus problemas, sin embargo existe un modelo clásico de predomina en la econometría tradicional.

  1. Planteamiento de la teoría o de la hipótesis

  2. Especificación del modelo matemático

  3. Especificación del modelo econométrico o estadístico

  4. Obtención de datos

  5. Estimación de los parámetros del modelo econométrico

  6. Pruebas de hipótesis

  7. Pronóstico o predicción

  8. Uso del modelo en políticas de control o predicciónes.

1Samuelson y Nordhaus, Economía, página 656, 2006.

2Andersen Arthur, Diccionario de Economía y negocios, 1999, página 213