Procesos de producción. Correlación y regresión lineal

Autor: Mario Alberto Caldera Loera

Evaluación de proyectos y economía matemática

21-08-2009

Descargar Original

La estadística es una rama de las matemáticas que se emplea para el estudio de los procesos, así como para su control y es fundamental.

1. Objetivo:

Que el alumno aprenda a realizar predicciones sobres sucesos futuros usando las herramientas estadísticas, parta aplicarlas a procesos de producción.

Enseñar al alumno a utilizar correctamente los diagramas de dispersión teniendo como apoyo el software llamado MINITAB 14.

2. Antecedentes:

Variable

Una variable es un símbolo que representa un elemento no especificado de un conjunto dado. Dicho conjunto es llamado conjunto universal de la variable, universo o dominio de la variable, y cada elemento del conjunto es un valor de la variable. Sea x una variable cuyo universo es el conjunto {1,3,5,7,9,11,13}; entonces x puede tener cualquiera de esos valores: 1,3,5,7,9,11,13. En otras palabras x puede reemplazarse por cualquier entero positivo impar menor que 14. Por esta razón, a menudo se dice que una variable es un reemplazo de cualquier elemento de su universo.

Una variable es un elemento de una fórmula, proposición o algoritmo que puede adquirir o ser sustituido por un valor cualquiera (siempre dentro de su universo). Los valores que una variable es capaz de recibir, pueden estar definidos dentro de un rango, y/o estar limitados por criterios o condiciones de pertenencia, al universo que les corresponde (en estos casos, el universo de la variable pasa a ser un subconjunto de un universo mayor, el que tendría sin las restricciones).

Medición

Es comparar la cantidad desconocida que queremos determinar y una cantidad conocida de la misma magnitud, que elegimos como unidad. Teniendo como punto de referencia dos cosas: un objeto (lo que se quiere medir) y una unidad de medida ya establecida ya sea en Sistema Ingles, Sistema Internacional, o Sistema Decimal.

Al resultado de medir lo llamamos Medida.

Cuando medimos algo se debe hacer con gran cuidado, para evitar alterar el sistema que observamos. Por otro lado, no hemos de perder de vista que las medidas se realizan con algún tipo de error, debido a imperfecciones del instrumental o a limitaciones del medidor, errores experimentales, por eso, se ha de realizar la medida de forma que la alteración producida sea mucho menor que el error experimental que se pueda cometer.

La medida o medición es directa, cuando disponemos de un instrumento de medida que la obtiene, así si deseamos medir la distancia de un punto "A" a un punto "B", y disponemos del instrumento que nos permite realizar la medición.

Unidades de medida

Al patrón de medir le llamamos también Unidad de medida.

Debe cumplir estas condiciones:

1º.- Ser inalterable, esto es, no ha de cambiar con el tiempo ni en función de quién realice la medida.

2º.- Ser universal, es decir utilizada por todos los países.

3º.- Ha de ser fácilmente reproducible.

Reuniendo las unidades patrón que los científicos han estimado más convenientes, se han creado los denominados Sistemas de Unidades.

Sistema Internacional ( S.I.)

Este nombre se adoptó en el año 1960 en la XI Conferencia General de Pesos y Medidas, celebrada en París buscando en él un sistema universal, unificado y coherente que toma como Magnitudes fundamentales: Longitud, Masa, Tiempo, Intensidad de corriente eléctrica, Temperatura termodinámica, Cantidad de sustancia, Intensidad luminosa. Toma además como magnitudes complementarias: Angulo plano y Angulo sólido.

Diagramas de Dispersión

Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlación entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlación positiva) o si cada vez que aumenta el valor de X disminuye en igual proporción el valor de Y (Correlación negativa).

En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las coordenadas de X e Y:

Coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables:

Siendo:

σXY la covarianza de (X,Y)
σX y σY las desviaciones típicas de las distribuciones marginales.

El valor del índice de correlación varía en el intervalo [-1, +1]:

• Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre las dos variables. Estas pueden calcularse con la razón de correlación.

• Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica proporción.

• Si 0 < r < 1, existe una correlación positiva.

• Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en idéntica proporción.

• Si -1 < r < 0, existe una correlación negativa.

Regresión lineal

Ejemplo de una regresión lineal con una variable dependiente y una variable independiente.

En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:

donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

3. ejemplos teóricos.

I. Una compañía de bienes raíces residenciales en una ciudad grande desea poder predecir los costos mensuales de rentas para departamentos, basado en el tamaño de los mismos definidos por los pies cuadrados de espacios. Selecciona una muestra.

Renta mensual

Tamaño

Renta mensual

Tamaño

Departamento

En

Dólares

Pies

cuadrados

Departamento

En

dólares

Pies

cuadrados

1

950

850

14

1800

1369

2

1600

1450

15

1400

1175

3

1200

1085

16

1450

1225

4

1500

1232

17

1100

1245

5

950

718

18

1700

1259

6

1700

1485

19

1200

1150

7

1650

1136

20

1150

896

8

935

726

21

1600

1361

9

875

700

22

1650

1040

10

1150

956

23

1200

755

11

1400

1100

24

800

1000

12

1650

1285

25

1750

1200

13

2300

1985

 

 

 

a) Grafique el diagrama de dispersión (en minitab 14).

b) Utilice el método de mínimos cuadrados para encontrar los coeficientes de regresión a y b.

Sacamos las medias
= 34660
25

Y = ∑y = 28383 =
n 25
Sacamos las desviaciones estándares.

Sx²= ∑(x-x) ² = 3139726 = 130821.41
n-1 24
Sx = (130821.41)½ = 361.69
Sy²= ∑(y-y) ² = 3139726 = 83322.81
n-1 24
Sy = (83322.81)½ = 288.65

Sacamos la covarianza.

Sxy = ∑(x-x) (y-y) = 2130018.8 = 88750.78
n-1 24

Sacamos la correlación.
r = Sxy = 88750.78 = 0.850
SxSy 361.69 (288.65)

b = r (Sy) = 0.850 (288.65) = .6783
(Sx) (361.69)

a = y- bx = 1135.32-.6783 (1386.4) = 194.9249

c) establezca la ecuación de regresión.

Ecuación de regresión:

y = a + bx

d) pronostique la renta mensual promedio para un departamento que tiene 1,000 pies cuadrados.

y = 194.9249+ 0.6783 (1000)
y = 873

2. La materia prima que se usa en la elaboración de una fibra sintética se almacena en un local que no tiene control de humedad. Las mediciones de la humedad relativa en el local y del contenido de humedad de una muestra de la materia prima (ambos en porcentajes) durante 12 días, dieron los siguientes resultados:

Humedad, X

Contenido de Humedad, Y

42

12

35

8

50

14

43

9

48

11

62

16

31

7

36

9

44

12

39

10

55

13

48

11

Ajuste una línea recta y determine el contenido de humedad cuando la humedad del local de almacenamiento es de 40%.

Sacamos las medias
= 533
12

Y = ∑y = 132 =
n 12

Sacamos las desviaciones estándares.

Sx²= ∑(x-x) ² = 854.91 = 77.71
n-1 11

Sx = (77.71)½ = 8.81
Sy²= ∑(y-y) ² = 74 = 6.72
n-1 11

Sy = (6.72)½ = 2.59

Sacamos la covarianza.

Sxy = ∑(x-x) (y-y) = 230 = 20.90
n-1 11

Sacamos la correlación.
r = Sxy = 20.90 = 0.915
SxSy 8.81 (2.59)

b = r (Sy) = 0.915 (2.59) = 0.268
(Sx) (8.81)

a = y- bx = 11 – 0.268 (44.42) = - 0.90

Ecuación de regresión:

Y = a + bx
Y = -0.90 + .268(40) = 9.82

3. Un negocio de ventas por catalogo de artículos para computadoras personales, software y hardware, tiene un almacén centralizado para la distribución de los productos que se le ordenan. La administración examina el proceso de distribución desde el almacén y está interesado en estudiar los factores que afecten los costos de distribución. En la actualidad, se agrega un pequeño cargo por envío independiente del monto de la orden. Se recolectan datos durante los últimos 24 meses que indican los costos de distribución y el número de órdenes recibidas. Los resultados son los siguientes:

 

Costo de

Distribución

 

 

Costo de

distribución

 

Mes

Miles de

Dólares

Número de

Ordenes

Mes

Miles de

Dólares

Número de

Ordenes

1

52.95

4,015

13

62.98

3,977

2

71.66

3,806

14

72.30

4,428

3

85.58

5,308

15

58.99

3,964

4

63.69

4,262

16

79.38

4,582

5

72.81

4,269

17

94.44

5,582

6

68.44

4,097

18

59.74

3,450

7

52.46

3,213

19

90.50

5,079

8

70.77

4,809

20

93.24

5,735

9

82.03

5,237

21

69.33

4,269

10

74.39

4,732

22

53.71

3,708

11

70.84

4,413

23

89.18

5,387

12

54.08

2,291

24

66.80

4,161

a) Establezca el diagrama de dispersión.

b) Suponga una relación lineal y utilice el método de mínimos cuadrados para encontrar los coeficientes de regresión a y b.

Sacamos las medias
= 1710.29
24

Y = ∑y = 104774 =
n 24

Sacamos las desviaciones estándares.

Sx²= ∑(x-x) ² = 3845.13 = 167.17
n-1 23
Sx = (160.21)½ = 12.92
Sy²= ∑(y-y) ² = 14733346 = 640580.26
n-1 23
Sy = (613889.41)½ = 800.36

Sacamos la covarianza.

Sxy = ∑(x-x) (y-y) = 212167.63 = 9224.37
n-1 23

Sacamos la correlación.

r = Sxy = 9224.37 = .892
SxSy 12.92 (800.36)

b = r (Sy) = 0.892 (800.36) = 55.25
(Sx) (12.92)

a = y- bx = 4365.58 – 55.25 (71.26) = 428.46

c) Pronostique los costos de distribución de almacén para un mes en el que el número de órdenes es de 4,500.

Y = a + bx
Y = 428.46 + 55.25(4500) = 249053.46

4. Suponga que el gerente de una cadena de servicios de entrega de paquetería desea desarrollar un modelo para predecir las ventas semanales (en miles de dólares) para las tiendas individuales basado en el número de clientes que realizan las compras. Se seleccionó una muestra aleatoria entre todas las tiendas de la cadena con los siguientes resultados:

Tienda

Clientes

Ventas ($1000)

1

907

11.20

2

926

11.05

3

506

6.84

4

741

9.21

5

789

9.42

6

889

10.08

7

874

9.45

8

510

6.73

9

529

7.24

10

420

6.12

11

679

7.63

12

872

9.43

13

924

9.46

14

607

7.64

15

452

6.92

16

729

8.95

17

794

9.33

18

844

10.23

19

1010

11.77

20

621

7.41

a) Grafique el diagrama de dispersión.

b) Obtenga la ecuación que mejor ajuste a los datos.

Clientes

Ventas

(x-x)

(x-x)2

(Y-Y)

(Y-Y)2

(x-x)(Y-Y)

907

11.2

175.8

30905.64

2.394

5.731236

420.8652

926

11.05

194.8

37947.04

2.244

5.035536

437.1312

506

6.84

-225.2

50715.04

-1.966

3.865156

442.7432

741

9.21

9.8

96.04

0.404

0.163216

3.9592

789

9.42

57.8

3340.84

0.614

0.376996

35.4892

889

10.08

157.8

24900.84

1.274

1.623076

201.0372

874

9.45

142.8

20391.84

0.644

0.414736

91.9632

510

6.73

-221.2

48929.44

-2.076

4.309776

459.2112

529

7.24

-202.2

40884.84

-1.566

2.452356

316.6452

420

6.12

-311.2

96845.44

-2.686

7.214596

835.8832

679

7.63

-52.2

2724.84

-1.176

1.382976

61.3872

872

9.43

140.8

19824.64

0.624

0.389376

87.8592

924

9.46

192.8

37171.84

0.654

0.427716

126.0912

607

7.64

-124.2

15425.64

-1.166

1.359556

144.8172

452

6.92

-279.2

77952.64

-1.886

3.556996

526.5712

729

8.95

-2.2

4.84

0.144

0.020736

-0.3168

794

9.33

62.8

3943.84

0.524

0.274576

32.9072

844

10.23

112.8

12723.84

1.424

2.027776

160.6272

1010

11.77

278.8

77729.44

2.964

8.785296

826.3632

621

7.41

-110.2

12144.04

-1.396

1.948816

153.8392

14623

176.11

-1

614602.6

-0.01

51.3605

5365.074

Sacamos las medias
c) = 14623
d) 20

Y = ∑y = 176.11 =
n 20

Sacamos las desviaciones estándares.

Sx²= ∑(x-x) ² = 614602.6 = 32347.50
n-1 19
Sx = (32347.50)½ = 179.85
Sy²= ∑(y-y) ² = 51.36 = 2.70
n-1 19
Sy = (83322.81)½ = 1.64

Sacamos la covarianza.

Sxy = ∑(x-x) (y-y) = 5365.07 = 282.37
n-1 19

Sacamos la correlación.

r = Sxy = 282.37 = 0.955
SxSy 179.85 (1.64)

b = r (Sy) = 0.955 (1.64) =0.008729
(Sx) (179.85)

a = y- bx = 8.80-0.008729(731.15) = 2.41

Ecuación de regresión:

y = a + bx

c) Pronostique las ventas semanales (en miles de dólares) para las tiendas que tienen 600 clientes.

y = 2.14+0.008729(600)
y = 7.37

3. Solución en Minitab (instrucciones para resolver los ejercicios con graficas, en base a uno de los ejercicios teóricos)

4. Conclusiones

Los diagramas de dispersión nos permite establecer una correlación entre dos características de un objeto o muestra, debe existir una relación entre ambos datos de lo contrario la grafica estará errónea.

Gracias a los diagramas de dispersión se puede observar gráficamente los resultados de análisis de proceso.

El empleo adecuado de estas herramientas estadísticas nos llevara a elevar la competitividad de nuestra empresa pues nos permite hacer predicciones a largo plazo aun sin que estas hallan ocurrido.

5. Experiencia de aprendizaje

La estadística es una rama de las matemáticas que se emplea para el estudio de los procesos, así como para su control y es fundamental.

6. Bibliografía

http://es.wikipedia.org/wiki/Variable
http://es.wikipedia.org/wiki/Medici%C3%B3n#Medici.C3.B3n
http://www.monografias.com/trabajos11/contrest/contrest.shtml
http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson.

Nota: Es probable que en esta página web no aparezcan todos los elementos del presente documento.  Para tenerlo completo y en su formato original recomendamos descargarlo desde el menú en la parte superior

Mario Alberto Caldera Loera

Estudiante de la Universidad Tecnológica del Norte de Coahuila.

alberto-321arrobahotmail.es

Comentarios
comments powered by Disqus

Nuevas publicaciones

⇐ Hazte Fan en Facebook
⇐ Síguenos en Twitter
⇐ Agréganos en Google +
⇐ Suscríbete vía Email
"Si tú tienes una manzana y yo tengo una manzana e intercambiamos las manzanas, entonces tanto tú como yo seguiremos teniendo una manzana. Pero si tú tienes una idea y yo tengo una idea e intercambiamos ideas, entonces ambos tendremos dos ideas"
George Bernard Shaw
Comparte conocimiento
Contenidos publicados con licencia CC BY-NC-SA 3.0 a excepción de los casos en los que se indican derechos de autor específicos. Sugerimos contactar a los autores al usar material públicamente.