Desafíos de estadística II

  • Otros
  • 31 minutos de lectura
Desafío N°1
Se tiene la siguiente función de densidad:
<<
=...;0
1;ln
);( POT
txxa
axf
y se tiene la siguiente m.a.s.:
{}
9,2;8,1;81,3;01.4;3,2;8,2x =
Se pide:
I. Estimar el parámetro
a, por método de máxima verosimilitud.
II. Posterior a la estimación del parámetro a, calcular E(x)).P(xy )3x(P >
I. Al tratar de estimar el pametro, podemos ver que:
=
=
n
1
i
i
xln
*n
a)a(L , resolviendo:
→←==+=
==
+==
01000
a
10
a
)a(Lln
6
1i
i
xln
10
1i
lnaln10)a(Llnln/
i
xln
*10
a)a(L
Por lo cual debemos establecer otro criterio para estimar el valor del parámetro a, ya que MMV, no reporta información, lo cual nos hace
pensar que para que la función de verosimilitud seaxima, el parámetro a, debe alcanzar un máximo, por ende
{}
i
xmáxa
ˆ=, si nos
dejamos llevar por este criterio, tenemos que ir al rango de la variable x y ver que el máximo valor que alcanza o cota superior es
t
, valor
por ende desconocido. Con lo cual el valor del parámetro en cuestión estará en función de la cota superior del rango de
x
que es
t
, por lo
tanto debemos buscar la forma de que estos parámetros se conecten con el fin de encontrar una manera de mezclarlos y estimar a. La
forma en que relacionaremos estos 2 parámetros será a través de un sistema de ecuaciones que relaciona la esperanza y la integral en todo el
recorrido de la función de distribución que resulta una probabilidad del 100%. Esto es:
()
() () ()
===
==
==
=
=
t
1
lnxdx
1
a 1
t
1
lnxdxa1
t
1
xdxlnx
t
1
lnxdx
t
1
*xdxlnxa
t
1
xdxlnxa)x(E pero
t
1
lnxdx
1
t
1
xdxlnx
)x(E
:quetiene se parámetros ambos igualando
t
1
lnxdx
1
a 2y
t
1
xdxlnx
)x(E
a 1
___________________
1
t
1
alnxdx 2
t
1
)x(Exdxlnxa 1
[][]
1ttlnt
1
a
ˆ
1
t
x
1
t
xlnx
1
t
1
lnxdx
1
a +
==
=
Ahora corresponde establecer, que valores de la muestra otorgarle al parámetro
t
, para que el valor de ahaga que la probabilidad de lo
observado en la muestra sea máximo. Con lo cual si observamos la función o distribución, para que seaxima en su probabilidad al
generar la función de verosimilitud, adebe ser máximo.
Con lo cual si generamos una tabla con los datos y los cálculos nos podremos dar cuenta que la función de verosimilitud por las
características ppias de la distribución va generando un aumento decreciente, aumento que se detiene con mayor impacto cuando el valor de
la muestra es 4.01 pq es ahí donde alcanza un máximo y que no es sobrepasado por ningún dato de la muestra, es donde marca la cota
superior del rango o dominio de la variable. Ahora si queremos probar que esto es cierto podemos agregar datos (supuestos) y calcular estos
para ver que hasta ahí (en 4.01) el aumento en forma decreciente, comienza a decrecer en forma mas acelerada. Como lo vemos en la
siguiente tabla:
1 1,8 0,258015997 3,875728685 12182461,5446006000 5,0223121123
2 2,3 0,615690983 1,624191401 2035,0423249340 2,1046870952
3 2,8 1,082934368 0,923416995 7,1809186940 1,1965977848
4 2,9 1,187661137 0,84199101 2,8528301781 1,0910829910
5 3,81 2,286367211 0,437375062 0,0040807646 0,5667667293
6 4,01 2,559052878 0,390769573 0,0013225399 0,5063736187
7 5,8 5,395575922 0,185337027 0,0000007618 0,2401665522
8 6,7 7,044120427 0,141962366 0,0000000530 0,1839600670
9 8,8 11,33781515 0,088200415 0,0000000005 0,1142933492
10 9 11,7750212 0,084925537 0,0000000003 0,1100496419
1ttlnt
+
i
t
1ttlnt
1
a
ˆ+
=
=
=
n
1i
i
nxlna)a(L
)3x(P
>
Con lo cual podemos resumir que el valor a tomar
t
como cota superior de la variable se, 4.01, ya ahí alcanza un máximo o tope de
aumentos decreciente de 0.0013225399 y además se puede ver que la probabilidad que se alcanza en la pregunta en el ítem siguiente genera
un máximo de 0.506373, que se va alejando o decreciendo a medida que la muestra alcanza números mayores o la cota es sobrepasada.
Entonces estimando el parámetro aa partir de este criterio queda como sigue:
390769573.0a
ˆ
101.4ln01.4
1
a
ˆ
1ttlnt
1
a
ˆ=
+
=
+
=
II. Posterior a la estimación del parámetro a, calcular E(x))P(x ),3x(P >.
Como ya está estimado el valor de a, entonces la debemos plantear, como es una variable continua, la probabilidad queda como:
()
[][]
()()
130,49362638870,50637361123ln3*30.390769571
1
3
x
1
3
xlnx*30.39076957
3
1
1lnxdx30.3907695713xP13)P(x
==
===
Para la segunda probabilidad, se debe calcular la esperanza poblacional de la distribución lo cual queda como:
=
01.4
1
xdxlnx390769573.0
01.4
1
xdxln390769573.0x)x(E , si hacemos
2
2
x
v
x
dx
du
xdx/dvy
dx
du
/xlnu
==
==
Entonces podremos integrar por partes (regla de la vaca), quedando:
01.4
1x
dx
2
2
x
1
01.4
xln
2
2
x
39.0
9.2)x(E890103.2)x(E1
2
01.4
4
39.0
)01.4ln(
2
2
01.4
39.0 =
=
Luego:
[]
()
54.0))Ex(x(P54.0536812156.0463187843.01)19.2(39.09.2ln9.2*39.01
9.2
1x
dx
x39.0
1
9.2
xlnx39.01
9.2
1
xdxln39.01)9.2x(P1)9.2x(P))x(Ex(P
=>==
==>=>
Nota: La estimación de este parámetro, no se puede llevar por medio del método de los momentos debido a que al
tratar de calcular su )x(E a través de la definicn para variables continuas, nos encontramos que el parámetro
a, queda en función de otro parámetro asociado que es el parámetro
t
, es por eso que se opta por MMV, el cual no
presenta información, pero se adopta un criterio que viene asociado a la definición de MV, pero a partir de una
característica ppia de las variables continuas, que implica que:
=1);x(f
θ
. Es por esa razón que se llevan a
cabo sistemas de ecuaciones con esperanza y una propiedad de las dist. Continuas a fin de que la esperanza se
eliminase.
Desafío N°2
Se define una variable que representa el número de piezas defectuosas en una producción de una empresa, en promedio, diariamente
durante las semanas de operación de una línea de producto.
Se selecciona una muestra al azar del total de número de piezas defectuosas, en una semana observada (7 días), tal como se muestra a
continuación:
{}
6,5,2,8,9,7,5=x
Se pide:
I. Encontrar la ley de probabilidad que rige a este enunciado.
La ley de probabilidad que corresponde a este enunciado, es una distribución de Poisson.
Sea:
x
~)(P
λ
II. Intervalo de confianza para )x(E al 95% de confianza, (que se puede hacer de 2 maneras: chicuadrado o TCL(pista para uso de TCL,
si
x
~)
2
;(Nx5)(P
λσλµλλ
==> )
1° Forma:
Es llevando la función de distribución de Poisson, a una gamma (a partir de su función de verosimilitud de la Poisson) y luego a una
chicuadrado, en donde esta chicuadrado dependerá del parámetro
λ
, que es su esperanza y luego despejarlo.
Entonces comenzamos por la forma de la función de distribución:
21
10*53,1
427
e
7
1i
!i
x
7
1i
i
x
7
e
)(L
!x
x
e
)(P~x
λ
λ
λ
λ
λ
λ
λ
λ
=
=
=
=
Con ello podemos ver que la función, Gamma haciendo el cambio de la variable
x
, por
λ
=xqueda como:
α
θαΓ
θ
λ
α
λ
)(
e
1
, entonces se puede notar que 7/17
7
e e ==
=
θλ
θ
λ
λ
θ
λ
y 43
142 =
=
α
λλ
Nota: La regla de la INTEGRACIÓN POR PARTE se puede resumir en:
[]
∫∫====
b
a
b
a
f(x)dxdug(x);v f(x);u :dde ,
b
a
vdu
a
b
uvdx)x(g*)x(f , para elegir que parte de las funciones será
v
o u , debe se
g
uirse el criterio LIATE, en donde L(lo
g
arítmicas), I(inversas), A(al
g
ebraicas), T(tri
g
onométricas)
y
(Ex
p
onenciales)
q
ue debe
ser elegido en ese orden en que vayan apareciendo las funciones y la 1° que aparezca dentro de la integral será u, la siguiente se dv . El
criterio “LIATE” y la “INTEGRACIÓN POR PARTE”, asegura que la parte a integrar sea más fácil que lo que era en un ppio producto de
la función original que era un producto de funciones elementales.
Así se puede dar forma a esta
()
()
()
21
10*53,1
43
7/1)43(
*
43
7/1)43(
7/1
e
143
)
7
1
;43;(G
Γ
Γ
λ
λ
θαλ
== ,
Al formar esta dist. )
7
1
;43;(G ==
θαλ
, debemos recordar el teorema que dice lo siguiente:
α
χ
θ
2
2
x2 , pero como x
=
λ
,
λχαθ
14
86
2
43 y
7
1===
Entonces:
)11,8)x(EP(4,45
0.95)110256,84,445617(P95.0)5436,1131423863,62(P
95.0
2
975.0;86
14
2
025.0;86
P
<<
=<<=<<
=
<<
λλ
χλχ
2° Forma: En esta, lo que se ocupa es la convergencia de la Poisson a una estandarización de la normal y esto ocurre cuando el valor del
parámetro 5
>
λ
, en donde )
2
;(N)(P
λσλµλ
==, en este caso, como
λ
, es desconocido, su estimación se llevara a cabo por
MMV que, su estimador es el promedio.
6
ˆ
xPMMV ==
λλ
)
2
;(N)(P
λσλµλ
==, con lo cual se puede llevar a una normal, pero la convergencia
corresponde como si existiera solo un dato de la muestra, cosa que no corresponde, ya que existen 7 datos, entonces, llevaremos esta Poisson
a normal por TCL, lo que implica que
==n
2
;N
tcl
x
λ
σλµ
lo cual corresponde a un pivote, como
sigue: )1,0(Nn
x
Z
=
λ
λ
.
Entonces reemplazando los datos, de la muestra y la estimación de
λ
PMMV, se podrá despejar )x(E=
λ
, en un intervalo de 95% de
confianza.
95,0)81461.7)x(E18539,4(P
95,0)81461.718539,4(P1/*95,0)18539,481461,7(P
95,0)6
7
6
96,16
7
6
96,1(P95,0)96,17
6
6
96,1(P
=<<
=<<=<<
=<<=<
<
λλ
λ
λ
III. Determinar la mejor región critica (Neyman-Pearson), para las siguientes hipótesis:
6)(:/6)(: 10 = xEHsvxEH , ...05.0
s
amy=α anterior.
Para determinar la región se debe utilizar teorema de Neyman-Pearson, que corresponderá a:
Nota:
()
21
10*53,1
43
7/1)43(
Γ
, es un factor que busca mantener la forma de lo original de la Poisson, ya que la idea es buscar
los valores de
θ
α
y para llevar a cabo la construcción del pivote chicuadrado.
()
() ()
()
''k x 'kx
01
pero ,kx7:/
1
0
ln
''k
7
1i i
x
01
7'k
1
0
ln
7
1i i
x
'k
1
0
ln
7
1i
i
x
01
7kln
1
0
ln
7
1i
i
x
01
7
ln/k
7
1i i
x
1
0
01
7
ek
7
1i i
x
1
1
7
e
7
1i i
x
0
0
7
e
k
21
10*53,1
7
1i i
x
1
1
7
e
21
10*53,1
7
1i i
x
0
0
7
e
k
)
1
(L
)
0
(L
><
=
=
=
+
=
+
=
=
=
=
=
λλ
λ
λ
λλ
λ
λ
λ
λ
λλ
λ
λ
λλ
λ
λ
λλ
λ
λ
λ
λ
λ
λ
λ
λ
λ
λ
Con lo cual se puede decir que:
{
}
''k x 'kx/
1
xR.R ><=
Ahora corresponde encontrar los valores de 'k y ''k , lo cual se puede llevar a cabo con el ET1:
{}
81,7 x 19,4x/
1
xR.R
7,814607k'k'661,814607397
6
6'k
96.1
975.0)7
6
6'k
Z(P)7
6
6'k
n
0
0
x
(P1025,0)6/''kx(P025,0
4,185393k'k'696-1,81460737
6
6'k
96.1
025.0)7
6
6'k
Z(P)7
6
6'k
n
0
0
x
(P025,0)6/'kx(P025,0
><=
==+
=
=
<
==>=
==+
=
=
<
<
==<=
λ
λ
λ
λ
λ
λ
En caso de querer concluir si se rechaza o no la hipótesis nula, se ve que el promedio 6x =, está dentro de la zona de aceptación, con lo
cual, con un 95% de confianza, existe suficiente evidencia muestral para aceptar 6:
0
H=
λ
. Otro criterio es calculando el P-valor de la
prueba, en donde 1)0Z(P207
6
66
Zn
0
0
x
Z==
=
=
λ
λ
Lo cual hace que
αα
>
*, entonces se acepta con 95% de
confianza. (Con este criterio, se rechaza cuando
αα
<
*). Nota: *
α
es la probabilidad de la prueba.
Desafío N°3:
Determinar por M.M.V., los parámetros a y k respectivamente seg. función densidad y m.a.s.
><<<
=
...;0
0;50;
1
),,(
POT
kax
k
a
k
kx
kaxf
{}
26,2;51,1;14,3;06,2;11,2x =
En este caso aplicamos
()
k5
a
5
1i
1k
i
x
5
k
a;k;
i
xL
=
=, aplicamos
()
alnk5
5
1
i
i
xln1kkln5ln
=
+
Derivamos con respecto a a
k5
a
e igualamos a cero →←==050
a
k5 , lo que implica que MMV no reporta información,
con lo cual, debemos irnos al recorrido de la variable y se puede ver que la cota superior es el parámetro buscado, con lo cual
{}
,
i
xmaxa
ˆ=que hará que
()
a;k;
i
xL sea máximo, lo cual hace que se opte por el valor de aque sea el mínimo valor posible de la
muestra ya que es un valor que esta en el denominador de tal función, pero sin que sea sobrepasado por otro dato de la muestra. Por lo
tanto 14.3a
ˆ= Ahora corresponde, determinar k: desde
()
14.3lnk5
5
1i
i
xln1kkln5
=
+ , derivamos con respecto a
k y obtenemos: 2,659542k
ˆ
1,1442230,768218
1
k
ˆ
14.3lnxln
1
k
ˆ
014.3ln5
5
1i
i
xln
k
5=
+
=
+
==
=
+
Desafío N°4:
Se tiene la siguiente función de densidad que se define como sigue:
<<<<+
=.P.O.T;0
11;1x0;1x2
);x(f
θθθ
θ
y se presentan a continuación las siguientes hipótesis respecto al parámetro
θ
0:
1
/0:
0θ=θ HsvH , con 1042,0 ==α ny
Se pide:
I. Determinar la región critica para el contraste de hipótesis ya dado
Para esto, se debe construir tal región a partir del teorema de Neyman-Pearson: k
)
1
(L
)
0
(L
θ
θ
,
En donde
=
=
n
1
i
);
i
x(f)(L
θθ
,
Entonces k
1
1
1
x2
0
1
0
x2
k
)
1
(L
)
0
(L
+
+
θθ
θ
θ
θ
θ
, ya que 1n = solo se puede despejar como especie de estadístico, la
Nota: En este caso, aunque MMV, no reporta información para la estimación del parámetro, no se utiliza el sistema de
ecuaciones, utilizado en el desafío N°1, debido a que, la cota superior del rango de la variable, es el parámetro, por lo tanto
está directamente relacionado con la expresión y la distribución, por ende se adopta directamente el método de
i
xmax ,
que corresponde al mínimo valor posible de a, pero que no sea sobrepasado por ningún dato de la muestra, ya que a es
cota del rango de la variable.
variable lo que corresponde a:
()
()
[]
()
()
()
[]
''kx 'kx
11
pero 'kx
k
10
2
0
1
1
1k
x
0
1
1
1kk
10
2x
0
1k
1
kk
1
x2
0
x2
k
1
kk
1
x2
0
1
0
x2
1
1
1
x2k
0
1
0
x2
><
+
+
+
++
++
θθ
θθ
θθ
θθθθ
θθθθ
θθθθ
θ
θ
θ
θ
{}
'k'x 'kx/
1
xRR ><=
A continuación corresponde, determinar tales valores 'k' y 'k , esto se realizará con ET1 y dividiendo
en 2 partes, es decir
979.0
2
-1y 021.0
2==
, debido a que se presenta una zona de rechazo bilateral. Aquí no hay posibilidades de crear un pivote
probabilístico conocido, debido a que 1n =, el calculo de los valores limite de la región de rechazo, deberá generarse a partir de la
distribución original, que es de carácter continuo, por lo cual al resolver, la probabilidad de que x sea mayor o menor a un valor
desconocido, corresponderá solo a la inte
g
ral desde el valor mínimo del dominio del ran
g
o de la variable hasta ese valor desconocido o
desde el valor desconocido hasta la cota superior de tal rango, seg. sea el caso.
{}
979.0x 021.0x/
1
xRR
979.0''k''k10.021
1
k
x/0.021dx
1
'k'
10.0210)
0
/''kx(P021.0
2
k'0.021
k'
0
x/0.021dx
k'
0
10.0210)
0
/'kx(P021.0
2
><=
=
=====>==
=====<==
θ
α
θ
α
II. Determinar ETII y P )(θen 1
=
θ
En este caso, se pide ETII, lo que es el error al aceptar H0 cuando realmente es falsa. Entonces lo que nos piden en otras palabras es que
aceptamos H0 cuando H1 es realmente verdadera. Y es así debido a que se da como valor aceptable, aceptar H0 cuando realmente es
falsa 1
=
θ
, que es “distinto”, de 0
H, pero con un valor determinado. Lo cual hace que debamos calcular una región de rechazo nueva,
porque la bilateralidad se rompe al existir un valor específico de la hipótesis alternativa.
Partiremos entonces desde lo que se hizo anteriormente antes de despejar
x
y se agregarán los valores de los parámetros, para generar
facilidad en el ejercicio (producto de que, n valores específicos de los parámetros de ambas hipótesis)
Las hipótesis a analizar, ahora son: 1:
1
Hs/v0:
0
H==
θθ
Con lo cual la regn de rechazo se presenta de la siguiente forma,
seg. sgte. Desarrollo:
()
{}
kx/
1
xRR
kx2
k2
1
x
k2
1
2x
2x
k2
1
k
2x2
1
k
2x2
1
k
)
1
(L
)
0
(L
>=
>+
>
>
+
θ
θ
Como siempre el valor de k, es desconocido, con lo cual debemos afirmarnos en ET1 y con un 042.0
=
, ya que la Región de Rechazo es
unilateral.
()()
[]
()
{}
795.0x/
1
xRR
795061,0k
1x0 pero 1,204939,k v 0,795061k0958.0k2
2
k
042.0k21
2
kk22
2
k1042.0k12
2
k1042.0
k
1
x2
1
kk
1
2
x042.0dx2x2042.01
1
/kxP042.0
>=
=
<<===+
=+
++=+
=
+
=+===>=
θ
Entonces ahora corresponde determinar el ET2:
[] []
()
[]
αβθ
θ
====
=+=+
+
=+===
0,042025-1ETII-1)P(
957975.0)ETII(P59.1-0,63203)ETII(P795.020795
0
795.0
x2
0
795.0
xdx2x2ETII)1/795.0x(PETII
2
2
795.0
0
Desafío N°5:
Se presenta una variable que refleja el nivel de impureza que se desprende de la elaboración de un producto químico y el parámetro de la
esta distribución mide la proporción de tales impurezas:
<<=
.P.O.T;0
1x0;x
1
);x(f
1
1
θ
θ
α
{}
5,0;85,0;9,0;7,0;25,0=x y )exp(~xlnE
θ
=
Se pide: Construir un intervalo de confianza al 95% de confianza para )(
E
1° Calcular )(
E
:
1
1
)x(E
1
1
1
1
0
1
x
1
dxx
1
dxx
1
x)x(E
1
1
1
1
0
1
1
1
0+
=
+
=
+
=
+
θθ
θ
θ
θ
θ
αθ
θ
αθ
2° Ahora con )exp(~xlnE
θ
= , formaremos una Chi-cuadrado, con el fin de despejar
θ
y formar:
0.950,791126))x(E0,375156(P
0.950,791126)
1
1
0,375156(P
0.95/()2.665556)1P(1,264021
10.95/1,665556)0,264021(P
0.95/()3,787574)
1
0,6004(P
95.0)20,4832
54080.0*10
3,246963(P
95.0)
xln10
(P
xln10
xln2E2
E2
1-
1-
2975.0;10
2025.0;10
2
10
5
1i
i
2
10
5
1i
2
2
=<<
=<
+
<
=<+<
+=<<
=<<
=<<
=<
<
==
θ
θ
θ
θ
θ
χ
θ
χ
χ
θθ
χ
θ
χ
θ
Desafío N°6
Una persona consulta el tarot, con el fin de ver su suerte, en el acto se puede ver que en el mazo de cartas del tarot contiene 22 cartas
denominadas “mayores” y 56 “menores”, luego en una tirada de 10 cartas elegidas al azar, se puede ver que no salieron cartas mayores, lo
que hace pensar al consultante que al mazo le faltaban cartas mayores.
Se pide:
I. Definir variable aleatoria.
II. Definir que modelo probabilístico lo rige
III. Definir los parámetros y su significado en el contexto del problema.
IV. Plantear las hipótesis y la región critica.
V. Encontrar el tamaño de significancia )(α de la prueba de hipótesis.
Respuesta:
I. Debido al enunciado del problema, la variable representa la cantidad o numero de cartas “MAYORES” que aparecen o salen a partir de
una tirada al azar de 10 cartas tomadas al azar.
:
x
s
ea N° de cartas MAYORES que aparecen en una tirada de l0 cartas elegidas al azar.
II. El modelo probabilístico que lo rige es: Hipergeométrico:
kNnknnxdde
n
N
xn
kN
x
k
nkNxf
N,k,n
H
x
<<=
=; ;,.......2,1,0,
*
),,,(
)(
~
III. Los parámetros que son relevantes en este problema seg. distribución son:
56 :Poblaciónla en fracasos o MENORES"" cartasde Numero :kN
10 :muestrala en éxitos omuestra de Tamaño :n
78 :menores)y (mayores cartasde total Numero :N
22:
p
oblaciónla en exitos o MAYORES
"
" carta
s
de
N
:
k
°
IV. Las hipótesis a ser relevantes son en respecto al parámetro k, ya que es el parámetro en cuestionamiento respecto de la inquietud del
consultante.
22k:
1
Hs/v22k:
0
H<=
La región crítica irá construida en relación de que se rechazará la hipótesis nula si de las cartas tiradas (10) no aparezca ninguna de la
categoría “MAYOR” (cosa que sucedió al hacer el experimento con las cartas de tarot)
{
}
0x/xRR ==
V. El tamaño de significancia, será calculado a partir de la definición de lo que corresponde al ETI, que no es más que el limite de la región
de rechazo, que implica un riesgo al errar cuando la hipótesis fuese verdadera, o por otro lado puede, definirse como el máximo error que
se puede cometer en esta prueba al rechazarla y que fuese verdadera.
028297385,0
10
78
10
56
*
0
22
)22k/0x(P)V
0
H/
0
Hrechazar(P)ETI(P
=
=
======
αα
ααα
Esto implica que la prueba, tendrá un riesgo de errar en el rechazo de la hipótesis alternativa, cuando esta sea verdadera de un %83,2 y
por otro lado la hipótesis se rechazará cuando el estadístico de prueba y su P-valor asociado sea más bajo que este limite que se asocia como
limite de la región critica. A modo de resolver la duda del consultante del tarot, se puede decir que esta probabilidad de errar que, en una
tirada no aparezcan cartas mayores es muy baja, con lo cual la sospecha del consultante es válida, con lo cual se puede inferir que al mazo le
faltaban cartas “MAYORES”.
Desafío N°7:
Un distribuidor de motores está a la espera de la llegada de un pedido de 79 de motores que distribuye, en donde tiene convenido que
rechazala partida completa si más de 2 de estos motores no cumplen los estándares convenidos con el productor. A la llegada de estos
motores, el distribuidor elige al azar 2 motores como fin de chequear que las condiciones sean las convenidas. El productor asegura que en el
lote de 79 motores no hay motores fuera de estándares convenidos.
Se pide:
I. Definir variable aleatoria.
II. Definir que modelo probabilístico lo rige
III. Definir los parámetros y su significado en el contexto del problema.
IV. Plantear las hipótesis y la región critica.
V. Encontrar a cuanto ascendería el error, de que el distribuidor rechace esta partida, siendo que las condiciones que el le exige al productor
se cumplan.
Respuesta:
I. :
x
s
ea Motores que cumplan con los estándares convenidos con el productor de una muestra tomada al azar.
II. El modelo probabilístico que lo rige es: Hipergeométrico:
kNn;kn ;2,1,0xdde,
n
N
xn
kN
*
x
k
)n,k,N,x(f
)N,k,n(H~x
<=
=
Los parámetros que son relevantes en este problema seg. distribución son:
77 :"requeridos estandares los con cumplan noque " motoresde Numero :kN
0 :muestrala en fracasos :x-n
2:muestrala en exitos :x
2:muestrade Tamaño :n
79 :no)que aquellosy estandares con cumplanque (motores motores,de total Numero :N
2:
p
oblaciónla en exitoso"requerido
s
estandare
s
los con cumplanque " motoresde
N
:
k
°
III. Las hipótesis a ser relevantes son en respecto al parámetro k, ya que es el parámetro en cuestionamiento respecto de la inquietud del
distribuidor (en este caso, lo que es de interés es de aquellos motores que no cumplan con los requerimientos para ser adquiridos y que la
partida de motores no ingresen en las bodegas del distribuidor)
2k:
1
Hs/v2k:
0
H
2k:
1
Hs/v2k:
0
H
>=
>
La región crítica irá construida en relación de que se rechazará la hipótesis nula si mas de 2 motores no cumplieran con los estándares
convenido anteriormente entre distribuidor y productor, esto dentro de los 2 motores que elige al azar con el fin de comprobar la calidad de
estos.
{
}
2x/xRR >=
IV. En este ítem, nos preguntan, por el ET1, ya que dice relación, con el hecho de que el distribuidor rechace la partida de motores, siendo
que los motores malos o que no cumplan con los estándares sean menos que 2 o todos los cumplan.
[]
[]
0990,000324560,049983770,94969-1-1
2)P(x1)P(x0)P(x-12)P(x-12)2/kP(xV)
0
H
0
H P(rechazarP(ET1)
=++=
+
+
=+=+==>==
2
79
0
77
2
2
2
79
1
77
1
2
2
79
2
77
0
2
/
Lo cual implica que el error de que rechace la partida siendo que ésta, esté con los estándares convenidos es de un 0%, es decir que no hay
error por rechazar la hipótesis nula, el error no existe. Hay un 100% de confianza de que los motores están en regla.
Desafío N°8:
A continuación se define un modelo denominadoEdumétrico, en donde la variable representa o mide, el rendimiento o calificación
estudiantil de cada uno de los trabajadores, que se encuentran en un proceso de capacitación que se ha llevado a cabo al interior de una
empresa a través del tiempo. Tiempo que se representa por el parámetro
t
, que está medido anualmente.
0t;1x0; x1tx2)t;x(f t1t ><<
=
y se entrega una muestra de las calificaciones o rendimiento de 10 estudiantes, alcanzados, medidos en porcentajes de los ítems medidos:
{}
94.0;85.0;92.0;75.0;83.0;66.0;88.0;79.0;6.0;98.0x =
Se Pide:
I. Determinar un estimador puntual para el parámetro
t
, por los métodos puntuales conocidos (máxima verosimilitud y por momentos) y
estime la media poblacional. (aplicando muestra aleatoria simple).
Lo primero es determinar el primer momento poblacional de la distribución:
()( )
1t21t
2
t2
)x(E
1t2
t2
1t
t2
1t2
1
0
1t2
xt2
1t
1
0
1t
xt2
1
0
dx
t2
tx2dx
1
0
1
0
t
tx2)x(Edx
t
x1
1t
tx2xdx);x(xf)x(E
++
=
+
+
+
+
+
+
=
=∫∫∫∫
θ
Ahora corresponde estimar y juntar los momentos muestrales ya que el k-ésimo momento poblacional es similar al k-ésimo momento
poblacional y como es un solo parámetro, basta solo con una ecuación correspondiente al 1° momento muestral ya que corresponde
solamente al 1° momento muestral y poblacional
7.2t
~
ˆ
7.15t
ˆ
0t pero 32.0
2
t
ˆ
y 15.7
1
t
ˆ
tpara esestimacion 2082.0t
ˆ
46.2
2
t
ˆ
36.0
82.0t
ˆ
46.2
2
t
ˆ
64.1
2
t
ˆ
2)1t
ˆ
3
2
t
ˆ
2(82.0
2
t
ˆ
2)1t
ˆ
2)(1t
ˆ
(82.0
2
t
ˆ
2
82.0
)1t
ˆ
2)(1t
ˆ
(
2
t
ˆ
2
x
)1t
ˆ
2)(1t
ˆ
(
2
t
ˆ
2
x(x)E
ˆ
1k como
k
x)
k
x(E
==
>===
++=++=++=
=
++
=
++
==
Ahora corresponde determinar el estimador puntual por método de máxima verosimilitud lo cual queda:
()
3,18691518t
ˆ
t
ˆ
xln3
20
0xln3
t
20
xln2xlnt3tln20
xln1t2tln102ln10xln)1t(tln102ln10
xt2xt2
10
1i
i
10
1i
i
10
1i
i
10
1i
i
10
1i
i
10
1i
i
1t2
10
1i
i
1010
1t
10
1i
i
1010
==
=
+
+
++
++
=
=
==
==
=
=
Ahora corresponderá determinar la media poblacional máximo verosímil, que se llevará a cabo aplicando el parámetro determinado
anteriormente ya que es un parámetro que posee la propiedad de la invarianza, la cual hace que tal parámetro al evaluarlo que cualquier
expresión que dependa de este, haga valido su valor.
60,65793607
1t1t2
t2
)x(E
2
=
+
+
=
II. Determinar un intervalo de confianza al 95% para el parámetro
t
, con la utilización de siguiente pivote:
2
2n
n
1i
i~xlnt*
3
4
EDUM
χ
=
=
Para llevar a cabo esto, debemos buscar los extremos del intervalo, que como el pivote se asemeja a una Chi-cuadrado, es en esta
distribución (tabla) que debemos encontrar 34.17
2
0975;20
y 9.59
2
025.0;20 ==
χχ
()
()
95.025.12t43.3P :es tpara confianza de 95% al intervalo el
95.025.12t43.3P95.0
092.2
1
4
3
17.34t
092.2
1
4
3
59.9P
092.2
10
1i
i
xln como 95.017.34
10
1i
i
xlnt*
3
4
59.9P
=<<
=<<=
<<
=
=
=
<
=
<
III.Dadas las siguientes hipótesis respecto al parámetro
t
, determinar la mejor región de rechazo con 05,0=
7t:
1
Hs/v7t:
0
H=
Para realizarlo debemos utilizar Neyman-Pearson:
() ()
()
[]
()
[]
>
<
=
>
<
+
==
==
=
=
==
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
kx ln 'kx ln/xRR
kx ln 'kx ln
tt pero
tt3
tln20
x ln
tln20tt3x ln
tln20xln2t3xln2t3
ln/xktxktxtxt
xxtkxtxt
k
xx
xx
t
t
k
xtxt2
xtxt2
k
xt2xt2
xt2xt2
10
1i
i
10
1i
i1
10
1i
i
10
1i
i
10
10
1
10
1i
i
110
10
1i
i
1
10
1i
i1
10
1i
i0
1
1
t2
10
1i
i
1
10
1
1
t
10
1i
i
10
1
1
0
t2
10
1i
i
10
0
1
0
t
10
1i
i
10
0
1
1
t2
10
1i
i
1
1
t
10
1i
i
10
1
1
0
t2
10
1i
i
10
0
1
0
t
10
1i
i
10
0
1
1
t2
10
1i
i
1
1
t
10
1i
i
1
0
t2
10
1i
i
1
0
t
10
1i
i
10
1
0
1
1
t2
10
1i
i
10
1
1
1
t
10
1i
i
10
1
10
1
0
t2
10
1i
i
10
0
1
0
t
10
1i
i
10
0
10
1
1
t2
10
1i
i
10
1
10
1
1
t
10
1i
i
10
1
10
1
0
t2
10
1i
i
10
0
10
1
0
t
10
1i
i
10
0
10
Ahora corresponde determinar los valores críticos:
>
=
<
=
=
=
==
=
=
>
=
=
=>
=
=
=
==
<=
<
=
=
=<
=
=
66.3
10
1i
i
x ln 0275.1
10
1i
i
x ln/
1
xRR
66,3''k''k
3
28
17,34
2
975.0;20
''k
3
28
2
20
P975.0''k
3
28
2
20
P1025.0
''k7
3
4
10
1i
i
xlnt
3
4
P025.07t/'k
10
1i
i
x lnP025.0
0275,1'k'k
3
28
59.9
2
025.0;20
´k
3
28
2
20
P025.0
'k7
3
4
10
1i
i
xlnt
3
4
P025.07t/'k
10
1i
i
x lnP025.0
χ
χχ
χχ
De la muestra se observa si se calcula el estadístico, 092,2
10
1i
i
x ln =
=
, está dentro de la zona de aceptación, ya que debe tomarse el
valor absoluto de esta prueba.
IV. Estimar la proporción del total de la población de estudiantes, que posean calificaciones con un rendimiento superior a 0.8.
Sugerencia:
Identificar y definir una nueva variable con su distribución correspondiente.
Debido al enunciado del problema, la variable representa a los estudiantes que posean calificaciones con un rendimiento superior a 0.8 de
una selección al azar de 10.
:
y
s
ea Estudiantes que posean calificaciones con un rendimiento superior a 0.8 de una selección al azar de 10.
Identificar y definir él o los parámetros involucrados.
Los parámetros que son relevantes en este problema seg. Distribución son:
Estimar por método de los momentos el parámetro que se exige.
Esta distribución en su esperanza se presenta de la sgte manera:
Lo cual implica que la proporción de estudiantes del total de alumnos en entrenamiento al interior de la empresa que tiene
un rendimiento superior a 0.8, es de un 8.2%.
082.0p
ˆ
10
82.0
p
ˆ
n
x
p
ˆ
xp
ˆ
n
especial caract con lpoblaciona proporcionpos)desconocidparametros los sonjusto(
N
k
erop
x
N
nk
)x(E
:óncontinuacia sigue como tal Momentos,de Metodo alrecurre se conocidos, son k"" ni N"" como
====
=
=
()
4 :muestrala de fracasos :y-n
6:)k"" especialtica caracteris con nes(extracciomuestra la de exitos :y
10 :muestrala en éxitos omuestra de Tamaño :n
fracaso.de proporcion p-1 con lespoblaciona fracasos ???:0.8orendimient con sestudiantede N :kN
??? :0.8) rend tienenque aquellosy 0.8to(rendimien s,estudiantede total Numero :N
éxito.de proporción p"" con lespoblaciona exitos ??? :0.8orendimient con sestudiante N:k
<°
<>
>°
10......2,1,0xdde,
n
N
yn
kN
*
y
k
)n,k,N,x(f
)N,k,n(H~x
=
=
Nota: Cuando la distribución hipergeométrica se presenta con una proporción y no con su parámetro k, que refleja sus
elementos con características especiales de la población, la función de distribución se presentará tal como sigue:
Nq)p1(NNpNk-Nvez sua y Npk
N
k
pque ya
10......2,1,0xdde,
n
N
yn
Nq
*
y
Np
)n,k,N,y(f
)
N
,k,n(
H
~
x
====
=
=
Desafío N°9
Se tiene la siguiente función de densidad, la cual se define como:
=);x(f
β
<<
TOP;o
3x0si1;
3
X1
β
β
β
{
}
n3,2,1 x.........................xxxx =
Determinar él estimador puntual para la media poblacional (Esperanza).
Desarrollo:
I. Aplicación de método máximo verosímil:
Entonces lo 1° a llevar a cabo es determinar un estimador para el parámetro
β
por el método máximo verosímil. Con la consecución de los
siguientes pasos:
1° Aplicación de la pitatoria en la función de densidad con el fin de determinar la distribución conjunta (función de verosimilitud):
()
n
n
1i
1
i
n
n
1i
1
n
1i
i
3
X
3
X
);x(f
=
=
=
=
β
β
β
β
β
β
β
2° Aplicación de Logaritmo natural a la aplicación anterior:
()
()
)3ln(n)Xln()1(lnn
)3ln(nXln)1(lnn
3
X
ln);x(fln
n
1
i
i
n
1i
i
n
n
1i
1
i
n
n
1i
i
βββ
βββ
β
β
β
β
=
=
=
=
+
+
=
3° Derivar la función de verosimilitud con el fin de encontrar el máximo, esto se hace derivando con respecto al parámetro desconocido:
)3ln(n)Xln(
ˆ
n
);x(L n
1i
i
i
=
+=
β
β
β
Nota 1: Recordando las propiedades de los lo
g
aritmos sabemos que: ln(a1*a2)=ln(a1)+ln(a2), con lo
cual si se generaliza para los a-ésimos términos quedaría: Σln(ai). Siendo en este caso ai = Xi.
4° de lo anterior, la expresn resultante posterior al derivar se iguala a cero con el fin de,
0)3ln(n)Xln(
ˆ
n
0
);x(L n
1i
i
i=+=
=
β
β
β
5° Despejar y encontrar un estimador para el parámetro
β
[]
)3ln(Xln
1
ˆ
)3ln(xlnn
n
ˆ
)3ln(n)Xln(
n
ˆ
%
ˆ
n
1i
i
=
=
==
=
β
β
ββ
II. Estimación de la media poblacional por medio de método máximo verosímil:
Posteriormente se deberá calcular la media poblacional o esperanza matemática que corresponde a las sgte forma de cálculo según sea el tipo
de variable (continua o discreta).
continuaiablevarxsi,dx);x(xf)x(E
discretaiablevarxsi,);x(xf)x(E
n
1i
=
=
=
θ
θ
Nota 2: Las expresiones poblaciones siempre en su forma aparecen como función de
parámetros que son desconocidos, que no debe ser confundido con las expresiones muestrales
(que son estadísticas), determinadas en base a muestra aleatoria; errores a modo de e
j
emplo
como los si
g
uientes: Media poblacional (esperanza) con media muestral o media aritmética o
promedio muestral que a su vez sirven para inferir (sus parámetros poblaciones =
característica de la población) desde las características de la muestra hacia la población.
En el caso particular de este ejercicio, corresponde a la segunda forma de cálculo, ya que el recorrido de la variable está descrito por un
rango.
Entonces procedemos a calcular la media poblacional o Esperanza:
() ()
1β
3β
E(x)
1β
3β
1β3
3β3
1β3
β3
1β
X
3
β
dx
3
βX
dx
3
βX
XE(x)
β
β
β
1β
3
0
1β
β
3
0β
β
β
1β
3
0
+
=
+
+
+
+
=
+
+
A continuación deberemos aplicar la propiedad de invarianza que poseen todos los estimadores máximos verosímiles, en donde estos se
ajustan a cualquier expresión que esté en función de un parámetro en particular y en donde este parámetro tenga una expresión que lo
permita estimar por método máximo verosímil.
Entonces:
3lnXln1
3
)x(E
3lnXln1
3
)x(E
:ndosimplificaydodesagregan
1
3lnXln
1
3lnXln
1
3
1β
ˆ
β
ˆ
3
E(x)
+
=
+
=
+
+
=
Desafío N°10
Suponga que la vida útil de cierto tipo de baterías de una empresa distribuidora, acepta la siguiente función:
Si en una muestra de 4 baterías de una caja de 20 unidades, se obtuvo una vida útil promedio de 25 hrs. y se sabe además que el distribuidor
garantiza una vida útil de al menos 10 horas, lo que de no ocurrir implica la devolución del valor de la venta asumiendo el distribuidor el
costo de la cada unidad devuelta.
Se pide: Estimar la utilidad esperada del distribuidor por caja, utilizando el método de máxima verosimilitud, asumiendo que el costo por
cada caja de batería es de $2.500 y el precio de venta es $4000c/caja.
Desarrollo:
1° Definir la variable en donde :
x
Vida útil de una batería. );2(Gx
=
Estimación portodo máximo verosímil del parámetro desconocido
:
3° Estimación de utilidad esperada por caja: para llevar a cabo esto se debe, definir otra variable en cuestión que estará en función de la
variable original.
Sea :
y
N° de baterías con una vida útil de a lo menos de 10 horas.
Se sabe también que si el experimento se repite "n" veces, es decir para n baterías, la suma de los procesos bernoullí, se transforma a
binomial )p,n(By con lo cual como 20n =, ))10x(Pp;20(By = se sabe que
=
)10x(P20p
ˆ
n)y(E , con todo
esto se puede construir la función utilidad asociada que corresponde a:
()
5.12
ˆ
25xcomo
2
x
ˆ
)PMMV(
2
x
ˆ
n2
n
1i
i
x
ˆ
%
ˆ
ˆ
n2
2
ˆ
n
1i
i
x
0
2
ˆ
n
1i
i
x
ˆ
n2
0
n
1i
);
i
x(fln
2
ˆ
n
1i
i
x
ˆ
n2
0
n
1i
);
i
x(fln
n
1i
i
x
lnn2
n
1i
i
xln
n
1i
);
i
x(fln
x
e
n
2
n
1i
i
x
n
1i
x
e
2
x
n
1i
);
i
x(f
n
1i i
===→∴=
=
==
=
=
=
=
+=
=
=
+=
=
=
=
=
=
=
=
=
=
=
βββββ
β
ββ
β
β
β
β
β
β
β
β
ββ
β
β
β
β
β
)p,y(f)p;1(by =
<=
=
10)(x0y si p-1
10)(x 1y si p
000.50$y000.4$)y(U
000.50$y500.2$y500.1$)y(U
)y20(2500$y)500.2$000.4($)y(U
=
+=
=
0x;
x
e
2
x
)b;x(f >
=
β
β
Para calcular cual es la probabilidad de la variable )p,n(By , probabilidad que está en función de la variable
)5.12
ˆ
;2(Gx ==
βα
Se recurrirá al teorema Chi-cuadrado 2
grados de libertad que implica que si 4
2
2
2
x2
);2(Gx
χ
α
χ
β
βα
=
Al hacer el cálculo de la probabilidad queda como
81.0p
ˆ
0,8087921410)P(x
80879214.0)6.1
4
2
(P
0,191207861)6.1
4
2
(P1
:que obtyenemosy
1.6 percentil ely 4 libertadde grado elseg inv -Chiprueba funcion
en excel utilizando o .chicuadradla de tabla la en probabilidla buscamos
)6.1
4
2
(P)
5.12
20
4
2
(P
)
ˆ
10*2x2
(P));2(Gx(izandochicuadrad)10x(P
===
=>
=
>>
=
χ
χ
χχ
β
β
βα
Nota: Se recomienda esta opción debido, a que la probabilidad acumulada está tabulada, la opción de cálculo, que se muestra a
continuación es muy extensa en su forma de cálculo debido a que requiere de inte
g
rales, lo que trae asociado los
y
a conocidos
cambios de variables y evaluaciones de la variable en los limites superior e inferior que el cálculo requiere.
Otra manera de llevarlo a cabo es determinando la probabilidad desde la función originaria, la Gamma (considerando 5.12
ˆ
;2 ==
βα
),
Entonces para calcular la utilidad esperada por la venta de una caja de baterías de 20 unidades, deberemos calcular la esperanza de la
función utilidad:
Pero:
Una vez calculado este valor esperado, que corresponde al número de baterías que cumplen con una vida útil de a lo menos 10 horas, que
corresponde a la probabilidad de éxito de la variable
y
, se puede aplicar la esperanza a la función de utilidad, lo cual queda como sigue:
14.800$))y(U(E
000.50$)2.16(000.4$))y(U(E
000.50$)y(E000.4$))y(U(E
000.50$y000.4$)y(U
=
=
=
=
16,2)y(E
)0,81(*20)y(E
)10x(P20p
ˆ
n)y(E
=
=
=
()
0.81p
ˆ
p
ˆ
10)P(x como pero 0,80879214)10P(x)
5.12
10
P(z
1
5.12
10
e1ee
5.12
10
11ee
5.12
10
1)
5.12
10
z(P
0
5.12
10
e
0
5.12
10
ze1dze
0
5.12
10
ze1)
5.12
10
z(P
evdzedv dzdu
dz
du
zu
donde en
:parte por integrando dzze1)
5.12
10
z(P
5.12
10
z10xsi,0z0x siiteslimnuevosdecálculo
5.12
dx
dz
dx
dz
5.12
x
zsea variable de cambio
dxe
5.12
x
1)10x(P1)10x(P
5.12
10
5.12
10
5.12
10
5.12
10
5.12
10
zz
5.12
10
0
zz
zz
5.12
10
0
z
10
10
0
5.12
x
2
=
==
=
+++
+=
+
+
====
=
====
==
=<=

Compártelo con tu mundo

Escrito por:

Cita esta página
Palomo David. (2005, julio 5). Desafíos de estadística II. Recuperado de http://www.gestiopolis.com/desafios-de-estadistica-ii/
Palomo, David. "Desafíos de estadística II". GestioPolis. 5 julio 2005. Web. <http://www.gestiopolis.com/desafios-de-estadistica-ii/>.
Palomo, David. "Desafíos de estadística II". GestioPolis. julio 5, 2005. Consultado el 28 de Abril de 2015. http://www.gestiopolis.com/desafios-de-estadistica-ii/.
Palomo, David. Desafíos de estadística II [en línea]. <http://www.gestiopolis.com/desafios-de-estadistica-ii/> [Citado el 28 de Abril de 2015].
Copiar
Imagen del encabezado cortesía de josecamoessilva en Flickr
Tu opinión vale, comenta aquíOculta los comentarios

Comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

También en Otros