viernes, 29 de mayo de 2015

Correlación entre dos variables. Tablas de doble entrada ... ( Artículo escrito en catalán )

ENUNCIAT
Per als 100 alumnes de primer cicle d'ESO d'un institut s'ha fet un estudi de les qualificacions de matemàtiques i de llengua. Les dades se'ns han donat així:
Superen les dues matèries: 64
No han superat les matemàtiques: 30
No han superat la llengua: 27
Creieu que les dades són coherents? Hi ha molta relació entre les notes de les dues àrees ?

SOLUCIÓ

Observant la taula, que omplim seguint l'ordre codificat en color a partir de les dades de l'enunciat, veiem que sí que hi ha coherència amb les dades (els totals parcials sumen el conjunt de 100 alumnes) i que hi ha molta relació entre les notes de les dues matèries perquè el nombre d'alumnes que suspenen/aproven una de les dues és proper al nombre d'alumnes que suspenen/aproven l'altra.

Observació:
És remarcable el fet que amb poques operacions aritmètiques (restes i sumes) podem posar en clar una correlació entre dues variables estadístiques. Les taules de doble entrada constitueixen una senzilla però eficaç eina a l'hora d'investigar possibles relacions.

$\square$

[nota del autor]

Números índice ... ( Articulo escrito en catalán )



L'índex de preus al consum és una variable macroeconòmica adimensional, com tots els nombres índex, i ve referit a una base de 100; per això és dóna en tant per cent, tot i que, naturalment es pot expressar en tant per u. L'IPC recull i compara els preus d'un conjunt de productes, béns i serveis al llarg del temps. Aquest índex s'obté per procediments estadístics a partir del mostreig de la població i, la seva anàlisi, permet diagnosticar una situació inflacionària o deflacionària. Per altra banda, el valor de l'índex en un determinat moment serveix per actualitzar el valor de les rendes i controlar els preus del béns de primera necessitat. L'estudi de l'IPC anual, i la publicació dels resultats per part del Instituto Nacional de Estadística es produeix durant el mes d'octubre.

El següent exercici de càlcul mostra les nocions elementals de com es fan les ponderacions segons els diversos sectors de productes de consum, bén i serveis. Les ponderacions no corresponen a les que es fan servir actualment i les dades, tot i que es refereixen a anys anterior, no estan del tot contrastades. L'exercici s'ha d'entendre, per tant, com una simple tasca didàctica, pràcticament, una simulació:



Observent les indicacions de la figura, També podeu veure com es calcula l'IPC de l'any en curs, a partir de l'increment anual dels seus component. L'última columna és especialment important perquè reflecteix la taxa de variació de l'IPC, en tant per cent (enguany, novembre de 2007, ha estat de 3,6%). Aquesta taxa de variació és molt útil a l'hora de calcular la revalorització dels productes de serveis i rendes, els preus de lloguer de la vivenda, etcètera. d'un mes d'un determinat any, al mateix mes del següent.

Fa poc que l'INE va publicar l'informe sobre l'IPC anual (14 de novembre): la variació general de l'índex de preus al consum, prenent com a base l'índex de 2006 és de 3,6%. Aquesta informació serveix, entre altres coses, per fer càlculs de revalorització de rendes i preus. Considerem, per exemple, que el mes d'octubre de 2006 el valor d'una renda era de 600 € al mes. Quin serà el valor de la renda actualitzada l'octubre de 2007 ?


font: Instituto Nacional de Estadística


Primer que tot cal fer remarca que, ens interessa saber la variació anual de l'índex (+3,6%). Expressant la variació en tant per u, tenim que, d'acord amb el significat de la taxa de variació anual del nombre índex:


Valor actualitzat de la renda = Valor inicial de la renda. (1 + taxa de variació anual de l'índex)     (entre els mateixos mesos)
Així tenim que
valor actualitzat de la renda = 600.(1+0,036) = 621,60 €

O, si es vol, també es pot plantejar segons la mateixa definició de taxa de variació:
0,036 = (renda actualizada - 600)/600
D'aquí, trobem igualment que x = 621,60 €

Val a dir que també podem calcular el varlor actualitzat si fem servir els nombres índex (cal disposar d'unes taules amb els valors dels índexs) enlloc de les taxes de variació d'aquests:

Valor actualitzat de la renda = Valor inicial de la renda x (índex del mateix mes de 2007)/(índex d'un mes donat de 2006)



Això és així per la següent raó:
El valor de la taxa de variació en un interval dn es defineix de la forma
dn=(xn-x0)/x0     (n=0,1,2,...)
i, per tant,
xn=x0(dn+1)     (1)
per al pas n+1 tindrem
xn+1=x0(dn+1+1)     (2)
Ara bé, dn+1 no és més que el valor de l'índex en el pas n: in
Per tant, (1) i (2) es poden reescriure així:
xn=x0 in     (3)
xn+1=x0 in+1     (4)
Dividint (4) entre (3), membre a membre, obtenim:
xn+1/xn = in+1/in
I, d'aquí,
xn+1 = xn. (in+1/in)


[nota del autor]

Tasa de variación ... ( Artículo escrito en catalán )


Donada una determinada variable estadística X que conté valors d'una sèrie temporal discrets, entenem per taxa de variació d'aquesta, una quantitat adimensional, una altra variable, els valors de la qual estan referits a un determinat valor de la variable X, que es prendrà com a base.

Així, podem definir la taxa de variació de la forma:
dn=(xn-x0)/x0     (n=0,1,2,...)

Una taxa de variació pot servir, per tant, per expressar la variació en el temps d'una magnitud, amb la finalitat de fer estudis de tipus estadístic o bé models d'evolució discrets. És habitual expressar els valors de la taxa en tant per cent, però també en tant per unitat o en la proporció adequada (tant per deu, tant per mil, ...).

A l'exemple que us comento a continuació, podeu veure una taula on s'expressa l'evolució dels preus de la gasolina des l'any 1977; el preu d'aquest any (37 unitats monetàries, de les antigues pessetes) es el valor que prendrem com a valor de referència. A l'última columna podem llegir els resultats del càlcul dels valors de l'índex anual que mostra l'evolució del preu d'aquest producte així com la manera de calcular-ho amb l'ajut d'un full de càlcul.



Suposem, ara, per tal d'ensenyar l'ús pràctic d'aquesta taxa, que no disposem de les dades dels preus de la gasolina (columna de color groc), llevat del preu de la mateixa l'any 1977 (37 unitats). Ens podríem plantejar la següent qüestió. Quin preu p correspon a l'any 1979 ?


Respondrem a la pregunta tenint en compte la definició donada més amunt. Com que el valor de la variació d'aquest per a l'any 1979 és de 0,2432 (en tant per u), podrem plantejar aquesta senzilla equació:

0,2432 = (p-37)/37
D'aquí, trobem fàcilment que p = 46 (arrodonint a la xifra de les unitats)


[nota del autor]

martes, 12 de mayo de 2015

Resolver las siguientes ecuaciones ... ( Artículo escrito en catalán )

1. Resoleu el sistema d'equacions:    

$\left.\begin{matrix} x + y = 1\\ \\ \log{x} + \log{y} = \log{\big(\dfrac{1}{100}\big)}\\ \end{matrix}\right\}$

Per les propietats dels logaritmes, la segona equació es pot posar de la forma

$\log{(x\,y)}=\log{\big(\dfrac{1}{100}\big)}$

és a dir

$x\,y = \dfrac{1}{100}$

Llavors, aïllant una de les dues variables (per exemple $y$) queda

$y = \dfrac{1}{100\,x}$

que, substituïda a la primera equació, ens permet escriure una equació amb una sola variable

$x+\dfrac{1}{100 \, x}=1$

equivalent a

$100\,x^2-100\,x+1=0$

d'on traiem que

$x_1=\dfrac{5+2\,\left|\sqrt{6}\right|}{10} > 0$

i

$x_2=\dfrac{5-2\,\left|\sqrt{6}\right|}{10} > 0$

valors aparellats amb els de la variable $y$ (substituint):

$y_1=\dfrac{5-2\,\left|\sqrt{6}\right|}{10}> 0$

i

$y_2=\dfrac{5+2\,\left|\sqrt{6}\right|}{10}> 0$

Per tant, trobem dues solucions

a) $x_1=\dfrac{5+2\,\left|\sqrt{6}\right|}{10}$, $y_1=\dfrac{5-2\,\left|\sqrt{6}\right|}{10}$

b) $x_2=\dfrac{5-2\,\left|\sqrt{6}\right|}{10}$, $y_2=\dfrac{5+2\,\left|\sqrt{6}\right|}{10}$

$\square$


2. Calculeu el valor aproximat de $x$ amb cinc xifres significatives
        $3^x=7$


Extraient logaritmes de cada membre de la igualtat

$\ln{\big(3^x\big)}=\ln{7}$

d'on, per les propietats dels logaritmes, queda

$x\, \ln{3}=\ln{7}$

i, aïllant la variable, podrem escriure

$x=\dfrac{\ln{7}}{\ln{3}} \approx 1,7712 \, \text{(5 x.s.)}$

$\square$


3. Resoleu l'equació
        $2^{x^2+5x+8}=4$


Podem expressar el terme independent del segon membre com una potència de de base dos

$2^{x^2+5x+8}=2^2$

d'on es desprèn que els exponents de tots dos membres han de ser iguals (les bases són les mateixes)

$x^2+5x+8=2$

equació que, tota vegada l'hem preparat per ser resolta, queda de la forma

$x^2+5x+6=0$

i dóna els següents resultats

$x=\left\{\begin{matrix} -2\\ \\ -3\\ \end{matrix}\right.$

$\square$


[nota del autor]

Alicia lanza una moneda ...

ENUNCIADO
Alicia lanza una moneda; y, de manera independiente, Bernardo lanza dos monedas. ¿ Cuál es la probabilidad de que ambos coincidan en el número de caras que obtienen ?.

SOLUCIÓN:

Debemos considerar los siguientes sucesos en relación al experimento aleatorio de Alicia:
$A_0$: "Alicia obtiene 0 caras" $P(A_0)=\dfrac{1}{2}$
$A_1$: "Alicia obtiene 1 cara" $P(A_1)=\dfrac{1}{2}$
$A_2$: "Alicia obtiene 2 caras" $P(A_2)=0$ ( suceso imposible )

Y en cuanto al experimento de Bernardo:
$B_0$: "Bernardo obtiene 0 cares" $P(B_0)=\dfrac{1}{2} \cdot \dfrac{1}{2}=\dfrac{1}{4}$
$B_1$: "Bernardo obtiene 1 cara" $P(B_1)=2\cdot \dfrac{1}{2} \cdot \dfrac{1}{2}=\dfrac{1}{2}$
$B_2$: "Bernardo obtiene 2 cares" $P(B_2)=\dfrac{1}{2} \cdot \dfrac{1}{2}=\dfrac{1}{4}$

Con lo cual la probabilidad de que Alicia y Bernardo obtengan el mismo número de caras es igual a $P\left((A_0 \cap B_0) \cup (A_1 \cap B_1) \cup (A_2 \cap B_2)\right)$; y, como estos tres sucesos son incompatibles, dicha probabilidad es igual a $P(A_0 \cap B_0) + (A_1 \cap B_1) +(A_2 \cap B_2)$   (1). Y, desdes luego, $A_0$ y $B_0$ son independientes, como también lo son $A_1$ y $B_1$, y $A_2$ y $B_2$; por lo tanto, (1) es igual a $\dfrac{1}{2}\cdot \dfrac{1}{4}+\dfrac{1}{2}\cdot \dfrac{1}{2}+0\cdot \dfrac{1}{4}$
    $=\dfrac{1}{8}+\dfrac{1}{4}+0$
    $=\dfrac{1}{8}+\dfrac{1}{4}+0$
    $=\dfrac{3}{8}$

$\square$

[nota del autor]

Un grupo de 12 personas quieren alojarse en ... ( Artículo escrito en catalán )

Enunciat:
Un grup de 12 persones es volen allotjar en un refugi de muntanya. Hi han tres habitacions disponibles: a la primera hi han dos llits, a la segona quatre, i a la tercera sis. De quantes maneres es poden ordenar ?


Solució:
Pel principi multiplicatiu i tenint en compte que els llits són indistingibles i que per tant no importa l'ordre amb què les persones que van a una determinada habitació escullen els llits, tenim un total de
    $C_{12,2}\cdot C_{12-2,4}\cdot C_{12-(2+4),6} = 13860 \; \text{possibilitats}$


[nota del autor]

domingo, 10 de mayo de 2015

Calcular los siguientes límites ... ( Artículo escrito en catalán )

Enunciat:
Calculeu els següents límits:
    a) $\displaystyle \lim_{n \rightarrow \infty} \, \bigg(\dfrac{5n+1}{5n}\bigg)^{2n}$
    b) $\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{3\,n^2+n-1}{(1-2\,n)^2}$
    c) $\displaystyle \lim_{n \rightarrow \infty} \, \big(\sqrt{n}-n\big)$


  a)
Per les propietats dels límits podem comprovar que
$\displaystyle \lim_{n \rightarrow \infty} \, \bigg(\dfrac{5n+1}{5n}\bigg)^{2n}=\Bigg(\lim_{n \rightarrow \infty} \, \bigg(\dfrac{5n+1}{5n}\Bigg)^{\displaystyle \lim_{n \rightarrow \infty} \, 2n}$
d'on s'obté una indeterminació del tipus $1^{\infty}$

Aquest tipus d'indeterminacions es resolen fent ús de la propietat
$\displaystyle \lim_{n \rightarrow \infty}\Big(1+\dfrac{1}{f(n)}\Big)^{f(n)}=e$
Llavors, cal transformar (de manera equivalent) l'argument del límit per tal que adopti aquest esquema
$\displaystyle \lim_{n \rightarrow \infty} \, \bigg(\dfrac{5n+1}{5n}\bigg)^{2n}=\Bigg(\lim_{n \rightarrow \infty} \, \bigg(1+\dfrac{1}{5n}\Bigg)^{5n}\Bigg)^{\displaystyle \lim_{n \rightarrow \infty}\, \frac{2}{5}}=e^{\frac{2}{5}}$
resultat que també es pot expressar de la forma
$\sqrt[5]{e^2}$
$\square$


  b)
En passar al límit trobem que
$\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{3\,n^2+n-1}{(1-2\,n)^2}$
dóna una indeterminació del tipus
$\dfrac{\infty}{\infty}$

Aquest tipus d'indeterminacions es resolen dividint el numerador i el denominador per $n$ elevada a l'exponent més gran que figuri a l'expressió; fent-ho, obtenim
$\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{3\,n^2+n-1}{(1-2\,n)^2}=\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{3+\frac{1}{n}-\frac{1}{n^2}}{4-\frac{4}{n}+\frac{1}{n^2}}$
I, ara, en tornar a passar al límit trobem

$\dfrac{3+\frac{1}{\infty}-\frac{1}{\infty}}{4-\frac{4}{\infty}+\frac{1}{\infty}}$

que és igual a

$\dfrac{3}{4}$

$\square$


  b)
En passar al límit trobem que

$\displaystyle \lim_{n \rightarrow \infty} \, \big(\sqrt{n}-n\big)$

dóna una indeterminació del tipus

$\infty-\infty$

Calculant uns quants valors de la successió ens adonem de seguida que els termes d'aquesta successió són negatius, que és monòtona decreixent, i que no està fitada

per tant
$\displaystyle \lim_{n \rightarrow \infty} \, \big(\sqrt{n}-n\big)=-\infty$

Procediment alternatiu:

A mode de comprovació, el resoldrem d'una altra manera: desfent algèbricament la indeterminació. Les indeterminacions d'aquest tipus d'indeterminació, podem multiplicar i dividir per l'expressió conjugada

$\displaystyle \lim_{n \rightarrow \infty} \, \big(\sqrt{n}-n\big)=\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{\big(\sqrt{n}-n\big)\cdot \big(\sqrt{n}+n\big)}{\sqrt{n}+n}=\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{n-n^2}{\sqrt{n}+n}$

Si, ara, tornem a passar al límit, ens trobem amb una indeterminació del tipus
$\dfrac{\infty}{\infty}$
que, com és ben sabut, es pot resoldre dividint el numerador y el denominador per la potència de $n$ amb l'exponent més gran present a l'expressió: en aquest cas $n^2$

Fent això trobem

$\displaystyle \lim_{n \rightarrow \infty} \, \big(\sqrt{n}-n\big)=\displaystyle \lim_{n \rightarrow \infty} \, \dfrac{\frac{1}{n}-1}{\sqrt{\frac{1}{n^3}}+\frac{1}{n}}=\dfrac{\frac{1}{\infty}-1}{\frac{1}{\infty}+\frac{1}{\infty}}=-\dfrac{1}{0}=-\infty$

$\square$


[nota del autor]

Ejercicio de correlación lineal ... (Artículo escrito en catalán)

Enunciat: [ lectura preliminar ]
  A la taula de sota, es mostren les qualificacions d'un grup de $20$ alumnes en dues assignatures afins (Matemàtiques i Física, per exemple), on $x$ i $y$ representen els valors de les corresponents v.e., i $f$ el nombre d'alumnes que han obtingut cada un dels parells de notes referits:

X

Y

f

$2$

$3$

$2$

$4$

$5$

$3$

$5$

$4$

$6$

$6$

$6$

$2$

$6$

$5$

$2$

$7$

$6$

$2$

$7$

$7$

$1$

$8$

$9$

$1$

$10$

$10$

$1$

Us demanem:

  a) el gràfic del núvol de punts

  b) el valor de la covariància $\sigma_{xy}$, i de les desviacions estàndard $\sigma_{x}$ i $\sigma_{y}$

  c) el valor del coeficient de correlació lineal (o de Pearson) $r$

  d) el grau de fiabilitat de la regressió lineal: $r^2$ (expressat en tant per cent)

  e.1) l'equació de la recta de regressió lineal de $Y$ sobre $X$

  e.2) si un alumne no ha pogut assistir a l'examen de l'assignatura $Y$, i té un $4$ a l'assignatura $X$, quant val la nota estimada $\hat{y}$ de $Y$ ?

  g.1) l'equació de la recta de regressió lineal de $X$ sobre $Y$

  g.2) si un alumne no ha pogut assistir a l'examen de l'assignatura $X$, i té un $5$ a l'assignatura $Y$, quant val la nota estimada $\hat{x}$ de $X$ ?

      [Resolució (no mireu la resolució abans d'intentar fer l'exercici)]



Lectura preliminar:
Donat un conjunt de $N$ punts experimentals $\displaystyle \{P(x_i,y_i)\}_{i=1,\ldots,n}$, amb freqüències $\{f_i\}_{i=1,\dots\,n}$ i de tal manera que $N=\sum_{i=1}^{n}\,f_i$,
recordem que per fer l'estimació d'un valor $\hat{y}$ de $Y$, a partir d'un valor donat $x$ de $X$, fem ús del la recta de regressió de $Y$ sobre $X$ que, en forma explícita, s'escriu
$y=a+b\,x$
on
$b = \dfrac{\sigma_{xy}}{\sigma_{x}^2}$
i
$a=\bar{y}-b\,\bar{x}$

També se solt escriure la recta de regressió lineal de $Y$ sobre $X$ en la forma punt-pendent

$y-\bar{y}=\dfrac{\sigma_{xy}}{\sigma_{x}^2}\,\big(x-\bar{x}\big)$

on la covariància de $X$ i $Y$ es defineix de la forma

$\displaystyle \sigma_{xy}=\dfrac{1}{N}\,\sum_{i=1}^{n} \,(x-\bar{x})\,(y-\bar{y})\,f_{i}$

i es demostra fàcilment que es pot calcular també de la forma

$\displaystyle \sigma_{xy}=\dfrac{1}{N}\,\sum_{i=1}^{n} x_{i}\,y_{i}\,f_{i}-\bar{x}\,\bar{y}$

amb

$N=\sum_{i=1}^{n}\,f_{i}$   (   $N$ és el nombre de punts experimentals)




Semblantment, per fer l'estimació d'un valor $\hat{x}$ de $X$, a partir d'un valor donat $y$ de $Y$, fem ús del la recta de regressió de $X$ sobre $Y$ que, en forma explícita, s'escriu
$x=a^{'}+b^{'}\,y$
on
$b^{'} = \dfrac{\sigma_{xy}}{\sigma_{y}^2}$
i
$a^{'}=\bar{x}-b^{'}\,\bar{y}$

recta que també se solt escriure en la forma punt-pendent

$x-\bar{x}=\dfrac{\sigma_{xy}}{\sigma_{y}^2}\,\big(y-\bar{y}\big)$


El coeficient de correlació lineal (o de Pearson)

$r=\dfrac{\sigma_{xy}}{\sigma_{x}\,\sigma_{y}}$

és tal que $-1 \le r \le 1$

informa del grau de validesa de la regressió lineal ( el model de regressió és òptim quan $\left|r\right|$ s'apropa a $1$ ) i, en els casos extrems:

  • si $\left|r\right|=1$, la dependència entre les variables $X$ i $Y$ és funcional

  • si $\left|r\right|=0$, les variables $X$ i $Y$ són independents

Propietats:

  • La intersecció de les rectes de regressió (de $Y$ sobre $X$, i de $X$ sobre $Y$   ) és el punt de coordenades $G(\bar{x},\bar{y})$

  • Es demostra que, si $r=0$, la recta de regressió de $Y$ sobre $X$ és igual a $y=\bar{y}$, i que la recta de regressió de $X$ sobre $Y$ és igual a $x=\bar{x}$. Per tant, ambdues rectes són perpendiculars.

[nota del autor]

sábado, 9 de mayo de 2015

La media aritmética de ... ( Artículo escrito en catalán )

Exercici 1:
Considereu que la mitjana aritmètica d'un conjunt de $n$ valors d'una v.a. $X$ val $m$, i que la variància val $v$. Si a cada un dels valors $\{x_i\} \quad (i=1,\ldots,n)$ li sumem una constant $k$ (coneguda), calculeu el valor de la nova mitjana aritmètica i el valor de la nova variància.

      [Resolució (no mireu la resolució abans d'intentar fer l'exercici)]

Exercici 2:
Tres grups d'alumnes (A, B i C) han obtingut els següents resultats en una mateixa prova:
$\text{grup A}:\,\{2\;,\;3\;,\;5\;,\;6\;,\;7\;,\;8\}$
$\text{grup B}:\,\{1\;,\;2\;,\;7\;,\;8\;,\;6\;,\;9\}$
$\text{grup C}:\,\{4\;,\;2\;,\;6\;,\;5\;,\;5\;,\;7\}$
Des del punt de vista estadístic, quin dels tres grups podem afirmar que és més eficient en el seu procés d'aprenentatge ?

      [Resolució (no mireu la resolució abans d'intentar fer l'exercici)]


Solució de l'exercici 1:
La nova mitjana aritmètica és igual a $m+k$, i la variància pren el mateix valor, $v$.
$\square$


Solució de l'exercici 2:
Calculant els paràmetres estadístics corresponents als tres grups, trobem:


grup

$\bar{x}$


$\sigma$


$\dfrac{\sigma}{\bar{x}}$


$A$


$5,2$


$2,1$


$0,40$


$B$


$5,3$


$2,9$


$0,55$


$C$


$4,8$


$1,6$


$0,33$

Observem que la mitjana aritmètica és similar en tots tres grups: $5$, aproximant a les unitats. Llavors, per determinar quin dels tres grups obté millors resultats, ens fixarem amb el valor del coeficient de variació; el més petit correspon al grup $C$, i amb una diferència significativa de deu punts percentuals en relació al grup $A$, i de vint en relació al grup $B$. Per tant, segons aquest raonament estadístic, el millor grup de treball és el grup $C$.
$\square$

[nota del autor]

Una urna contiene ... ( Artículo escrita en catalán )

Enunciat:
Una urna A conté 3 boles vermelles i 1 bola blanca; una altra urna B conté 5 boles vermelles i 2 boles blanques, i una tercera urna c conté 1 bola vermella i 2 boles blanques. Escollim a l'atzar una de les tres urnes i, a continuació, fem l'extracció (a l'atzar) d'una de les boles que conté. Calculeu la probabilitat que:
  a) la bola sigui blanca
  b) sigui una bola de la urna A, sabent que la bola és blanca


Resolució:
apartat a)
Anomenem:
  A al succés a l'atzar "escollir la urna A"; B, al succés a l'atzar "escollir la urna B"; i C, al succés "escollir a l'atzar la urna C".

Per altra banda, designem amb la lletra W el succés "extraure una bola blanca" (d'una de les tres urnes, escollida aleatòriament).



D'acord amb el teorema de la probabilitat total podem escriure
$P(W)=P(W|A)\cdot P(A)+P(W|B)\cdot P(B)+P(W|C)\cdot P(C) \quad \quad (1)$

Tenint en compte el contingut de cada urna, assignem les probabilitats condicionades corresponents d'acord amb el principi de Laplace
$P(W|A)=\dfrac{1}{4}$
$P(W|B)=\dfrac{2}{7}$
$P(W|A)=\dfrac{2}{3}$

Pel que fa a l'elecció de la urna, cal suposar que els successos A, B i C, són equiprobables i, d'acord amb el principi de Laplace
$P(A)=P(B)=P(C)=\dfrac{1}{3}$

Substituint aquests coeficients de probabilitat a l'expressió (1) trobem la probabilitat demanada
$P(W)=\dfrac{1}{4} \cdot \dfrac{1}{3}+ \dfrac{2}{7} \cdot \dfrac{1}{3}+\dfrac{2}{3} \cdot \dfrac{1}{3}$
    $=\dfrac{101}{252}\approx 40 \text{\%}$

apartat b)
Del teorema de Bayes tenim que
$P(A|W)=\dfrac{P(W|A)\cdot P(A)}{P(W)}$

            $=\dfrac{\dfrac{1}{4} \cdot \dfrac{1}{3}}{\dfrac{101}{252}}$

            $=\dfrac{21}{101}$

            $\approx 21 \,\%$

$\square$

[nota del autor]

En un examen, la puntuación media ha sido de ... ( Artículo escrito en catalán )

Enunciat:
En un examen, la puntuació mitjana ha estat de 4,5 punts, i la desviació estàndard d'1,5. Suposant que les puntuacions es distribueixen normalment, quin percentatge d'alumnes han obtingut més d'un $5$ ?


Resolució:
Designem amb $X$ la variable ateatòria "puntuació", els valors de la qual pertanyen a l'interval
$\left[ 0, 10 \right] \in \mathbb{R}$
D'acord amb l'enunciat,
$X \sim N(4,5 \; , \; 1,5)$
Llavors,
$P(X > 5) = 1-P(X \le 5) \quad \quad (1)$
I, per calcular $P(X\le 5)$, farem el canvi de variable
$Z=\dfrac{X-\mu}{\sigma}$
amb la qual cosa
$P(X\le 5)=P(Z \le k)$
on
$k=\dfrac{5-4,5}{1,5}=\dfrac{1}{3}$
Tenint en compte que
$P(Z \le \frac{1}{3})=F(\frac{1}{3}) \approx 0,333$
    - on $F(z)$ és la funció de distribució de probabilitat de $Z$ -
farem, ara, ús de les taules de $Z$ que és una $N(0,1)$
i trobem que
$F(0,33) = 0,6293$
i
$F(0,34) = 0,6331$
Interpolant linealment,
$\dfrac{F(0,34)-F(\frac{1}{3})}{0,34-0,333}=\dfrac{F(0,34)-F(0,33)}{0,34-0,33}$
d'on
$F(0,333)\approx 0,6304$
Per tant
$P(X \le 5) \approx 0,6304$
i (1) queda
$P(X>5) \approx 0,3696$
de la qual cosa interpretem (estadísticament) que el tant per cent demanat és, aproximadament, del $37 \,\%$
$\square$

[nota del autor]

viernes, 8 de mayo de 2015

Demostrar que una forma de calcular la covarianza ... ( Artículo escrito en catalán )

Enunciat:
Donat el conjunt de $N$ valors emparellats $\{x_i,y_i\}\,\,(i=1,2,\ldots,N)$ de les variables estadístiques $X$ i $Y$, demostreu que la covariància definida de la forma
$\displaystyle \text{Cov}(X,Y)=\dfrac{1}{N}\sum_{i=1}^{N}\,\big(x_i-\bar{x}\big)\big(y_i-\bar{y}\big)$
es pot cal calcular també fent ús de l'expressió
$\displaystyle \dfrac{1}{N}\sum_{i=1}^{N}\,x_i\,y_i-\bar{x}\,\bar{y}$


Resolució:
De la definició
$\displaystyle \text{Cov}(X,Y)=\dfrac{1}{N}\sum_{i=1}^{N}\,\big(x_i-\bar{x}\big)\big(y_i-\bar{y}\big)$
i a partir de la propietat commutativa (de la multiplicació i de la suma) i de la p. distributiva de la multiplicació respecte de la suma podem escriure:
$\text{Cov}(X,Y)=$
    $\displaystyle=\dfrac{1}{N} \,\sum_{i=1}^{N}\,x_i\,y_i - \dfrac{\bar{x}}{N}\,\sum_{i=1}^{N}\,x_i-\dfrac{\bar{y}}{N}\,\sum_{i=1}^{N}\,y_i+\bar{x}\,\bar{y} \quad \quad (1)$
            [ Observació: l'últim sumand resulta de
            $\displaystyle \dfrac{1}{N}\,\sum_{i=1}^{N}\,\bar{x}\,\bar{y}=N\,\dfrac{1}{N}\,\bar{x}\,\bar{y}=\bar{x}\,\bar{y}$]
i tenint en compte que
        $\displaystyle \bar{x}=\dfrac{1}{N}\,\sum_{i=1}^{N}\,x_i$
        $\displaystyle \bar{y}=\dfrac{1}{N}\,\sum_{i=1}^{N}\,y_i$
podem posar l'expressió (1) de la forma
    $\displaystyle \dfrac{1}{N} \,\sum_{i=1}^{N}\,x_i\,y_i - \bar{x}\,\bar{y} - \bar{y}\,\bar{x} + \bar{x}\,\bar{y}$
amb la qual cosa ens queda
    $\displaystyle \text{Cov}(X,Y)=\dfrac{1}{N} \,\sum_{i=1}^{N}\,x_i\,y_i - \bar{x}\,\bar{y}$
$\square$

[nota del autor]

Calcular la probabilidad de que entre los cuatro hijos de ... ( Artículo escrito en catalán )

Enunciat:
Calculeu la probabilitat que entre els quatre fills d'una parella hi hagi com a màxim 3 nois.


Resolució:
Anomenem $X$ a la variable aleatòria discreta "nombre de nois entre els quatre fills". Naturalment, els valors de $X$ són $\{0,1,2,3,4\}$, i el model matemàtic amb què es distribueixen aquests valors correspon a una distribució binomial, amb $p=\frac{1}{2}$ (probabilitat que un fill escollit a l'atzar sigui un noi) i $n=4$ (nombre de proves repetides); és a dir, $X \sim B(4,\frac{1}{2})$


La probabilitat demanada la podem expressar de la forma
$P(X \le 3)$
i tenint en compte que
$\displaystyle \sum_{i=0}^{4}\,P(X=i)=1$
és clar que
$P(X \le 3)=1-P(X=4)$
    $=1-\big(\frac{1}{2}\big)^4$
    $=\dfrac{15}{16}$
    $\approx 94,75 \, \%$
$\square$

[nota del autor]

miércoles, 6 de mayo de 2015

Calcular el límite de la sucesión ... ( Artículo escrito en catalán )

Enunciat:
Calculeu el límit de la successió de nombres reals de terme general
    $a_{n}=\sqrt{n}-\sqrt{n+1}$


Solució:
En passar al límit

    $\displaystyle \lim_{n \rightarrow \infty}\,\sqrt{n^3}-\sqrt{n+1}$

ens trobem amb una indeterminació del tipus $\infty - \infty$
que mirarem de desfer multiplicant i dividint per l'expressió conjugada

    $\sqrt{n^3}+\sqrt{n+1}$

llavors,
    $\displaystyle \lim_{n \rightarrow \infty}\,\sqrt{n^3}-\sqrt{n+1}$

      $\displaystyle=\lim_{n \rightarrow \infty}\,\dfrac{\big(\sqrt{n^3}-\sqrt{n+1}\big)\big(\sqrt{n^3}+\sqrt{n+1}\big)}{\sqrt{n^3}+\sqrt{n+1}}$

        $\displaystyle=\lim_{n \rightarrow \infty}\,\dfrac{\big(\sqrt{n^3}\big)^2-(n+1)}{\sqrt{n^3}+\sqrt{n+1}}=\lim_{n \rightarrow \infty}\,\dfrac{n^{\frac{3}{2}}-(n+1)}{n^{\frac{3}{2}}+(n+1)^{\frac{1}{2}}}$

i dividint el numerador i el denominador per $n^{\frac{3}{3}}$,

        $\displaystyle=\lim_{n \rightarrow \infty}\,\dfrac{1-n^{-\frac{1}{2}}-n^{-\frac{3}{2}}}{1+\big(\frac{n+1}{n^3}\big)^{\frac{1}{2}}}$

        $\displaystyle=\lim_{n \rightarrow \infty}\,\dfrac{1-\frac{1}{\sqrt{n}}-\frac{1}{\sqrt{n^3}}}{1+\sqrt{\frac{n+1}{n^3}}}$

i tornant, ara, a passar al límit,

        $=\dfrac{1-0-0}{1+0}$

        $=1$

$\square$


[nota del autor]