\documentstyle[12pt, catalan,a4]{article}
\language=1
\def\tit{\bigskip\bigskip\pagebreak[1]\noindent\large\sf}
\newenvironment{taulaVars}[1]%
{\medskip
\noindent\begin{tabular}
{rll}$N=#1$ & & \\
\hline &{\em Variable}  & DescripciÆ \\ \hline}%
{\hline \end{tabular}}

\textwidth 16cm
\textheight 24cm
\hoffset -1.5cm
\voffset -1cm

\begin{document}
\begin{center}
{\bf{\Large{AN¡LISI DE DADES}}}
\end{center}

DescripciÆ d'alguns conjunts de dades interessants. 

Material per a l'assignatura d'AnÈlisi de Dades.

Departament d'EconomÕa, UPF.
(F. Udina, Marc SÄez, Octubre 1994)

{\tit Lake}

Font: Minitab Handbook

Arxiu: {\tt LAKE.MTW en el directori de dades de Minitab}

SÆn llacs dels comptats de Vilas i Oneida del nord de Wisconsin. Les
mesures es van prendre en 1959--1963.

\begin{taulaVars}{71}
&AREA &    ¡rea del llac mesurada en acres \\
&DEPTH &   MÈxima fondÈria del llac \\
&PH &      pH, una mesura d'acidesa \\
& & (pH menors sÆn mÅs Ècids, un pH de 7 Ås neutre)\\
&WSHED & ¡rea de {\em Watershed} en milles quadrades\\
&HIONS & ConcentraciÆ d'ions d'hidrÊgen\\
\end{taulaVars}

{\tit Pulse}

Font: Minitab handbook

Arxiu: {\tt PULSE.MTW en el directori de dades de Minitab}

Els estudiants d'un curs introductori d'EstadÕstica van particiapr en
un experiment senzill. Els estudiants es van prendre el seu propi
nombre de pulsacions per minut (posant-se els dits Õndex i polze sobre
les artÉries del coll). DesprÅs se'ls va dir que llencessin una moneda.
Si els sortia cara havien de cÊrrer durant un minut. DesprÅs tothom es
prenia el pols per segona vegada.


\begin{taulaVars}{92}
1 & PULSE1 & Primer nombre de pulsacions \\
2 & PULSE2 & Segon nombre de pulsacions \\
3 & RAN    & 1 = Els ha tocat cÊrrer, 2= No \\
4 & SMOKES & 1 = Fuma regularment, 2 = No \\
5 & SEX    & 1 = Mascle, 2 = Femella \\
6 & HEIGHT & Al\c{c}ada en polzades (1 inch = 2.56 cm) \\
7 & WEIGHT & Pes en lliures (1 pound = \dots) \\
8 & ACTIVITY & Nivell d'activitat fÕsica habitual: \\
& &            1 = lleuger, 2 = moderat, 3 = alt \\
\end{taulaVars}

{\tit Trees}

Font: Minitab handbook

Arxiu: {\tt TREES.MTW en el directori de dades de Minitab}

Es necessari poder estimar la quantitat de fusta en una Èrea donada d'un
bosc. Per tant, Ås necessari tenir una manera rÈpida i fÈcil de
determinar el volum d'un arbre donat. Evidentment no Ås fÈcil mesurar
el volum d'un arbre, perÊ no Ås difÕcil mesurar l'al\c{c}ada i, encara
menys, el diÈmetre de l'arbre. El tallador dels boscos estÈ interessat
en tenir una fÊrmula que li dongui el volum de l'arbre en funciÆ de
l'al\c{c}ada i el diÈmetre. Es van tallar una mostra d'arbres i se'ls
va mesurar l'al\c{c}ada, diÈmetre i volum. Aquesta mostra Ås de {\em
black cherry trees} del Allegheny National Forest a Pennsylvania,
USA. (Naturalment, diferentes varietats d'arbre i diferents llocs
donaran resultats diferents i caldrÈ, per tant, preparar diferents
estudis per cada espÉcie i lloc)

\begin{taulaVars}{31}
1&DIAMETER&   DiÈmetre en polzades a una al\c{c}ada de 4.5 peus del
terra\\
2&HEIGHT&     Al\c{c}ada de l'arbre en peus\\
3&VOLUME&     Volum de la fusta de l'arbre en peus cÇbics\\
\end{taulaVars}

{\tit Bages}

Font: Cens 1991, publicaciÆ de l'Institut CatalÈ d'EstadÕstica

Arxiu: {\tt libiya:/WWW/pub/dades/bages.dat}

2.03 PoblaciÆ de dret per sexe i estat civil. Municipis per
comarques. 1991. Total.

\begin{taulaVars}{35}
1&POBLACIO&  El nom (retallat a 8 carÈcters i \\
& &lleugerament modificat en alguns casos\\
2&SOLTERS& Habitants solters/es \\
3&CASATS& Habitants casats/des \\
4&VIDUS& Habitants vidus/ues \\
5&SEPARATS& Habitants separats/des legalment\\
6&DIVORCIATS & Habitants divorciats/des\\
7&TOTAL& Total d'habitants censats\\
\end{taulaVars}

{\tit Europe}

Font: Euromonitor (1979, pp 76--7) recollit de B.F.J. Manly,
Multivariate Statistical Methods, Chapman\&Hall, 1986 (p 11).

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europe.dat}

Percentatges de gent empleada en nou grups d'industries a
Europa. Segons diu Manly, la xifra de treballadors en Finances a Spain
ha sigut corregida de 14.7 a la quantitat mÅs raonable de 8.5.


\begin{taulaVars}{26}
1& COUNTRY   &   Nom del paÕs, 10 carÈcters  \\
2&  AGR  &  \% de empleats en el sector Agricultura   \\
3&  MIN  &   id. Mineria  \\
4&  MAN  &   id. Manufacturing  \\
5&  PS   &   id. Power supplies, centrals energÉtiques \\
6&  CON  &   id. ConstrucciÆ  \\
7&  SER  &   id. Serveis  \\
8&  FIN  &   id. Finances  \\
9&  SPS  &   id. Serveis socials i personals  \\
10&  TC  &   id. Transports i Comunicacions  \\
\end{taulaVars}


{\tit Forbes}

Font: Sanford Weisberg, Applied Linear Regression, Wiley 1985, pag 3

Arxiu: ftp://libiya.upf.es:/WWW/pub/data\_sets/forbes.dat

Al voltant de 1840, el fÕsic escocÉs James D. Forbes volia poder
estimar al\c{c}ades sobre el nivell del mar mesurant el punt
d'ebulliciÆ de l'aigua. En l'experiment que es recull aquÕ, estudiava
la relaciÆ entre la pressiÆ atmosfÉrica i el punt d'ebulliciÆ de
l'aigua. Forbes va recollir dates als Alps i a EscÊcia. Les pressions
atmosfÉriques estan registrades en plozades de mercuri, ajustades a
una temperatura estÈndar. El punt d'ebulliciÆ estÈ enregistrat en
graus Fahrenheit. Les dades de 17 llocs diferents s'han pres d'un
article publicat per Forbes al 1857. Seguint les idees de Forbes, les
dades es presenten juntament amb el logaritme de les pressions, i
tambÅ aquests multiplicat per 100.

\begin{taulaVars}{17}
1& NUM   & NumeraciÆ dels casos     \\
2& TEMP   & Temperatura (oF) d'ebulliciÆ de l'aigua    \\
3& PRESSIO   & PressiÆ atmosfÉrica en polzades de Mercuri    \\
4& LOGPRESS   & Logaritme decimal de PRESSIO    \\
5& LOGPRESS100   & L'anterior multiplicat per 100    \\
\end{taulaVars}

{\tit Amazon}

Font: Sanford Weisberg, Applied Linear Regression, Wiley 1985, pag 31

Arxiu: ftp://libiya.upf.es:/WWW/pub/data\_sets/amazon.dat

La selva amazÊnica, la mÅs gran del mÆn, esta sotmesa a fortes
pressions per la activitat humana. Els anys 70 es van obrir moltes
carreteres per atravesar-la i accedir al seu interior, provocant un
rÈpid creixement de la poblaciÆ en l'Èrea i una deforestaciÆ a gran
escala. AixÊ pot provocar canvis climÈtics importants que han de
reflectir-se en el propi riu. Les dades recullen els nivells mÈxim i
mÕnim del riu Amazones a Iquitos, PerÇ, pels anys 1962 a 1978. Les
dades de 1962 a 1969 poden ser considerades com de control, mentre que
les posteriors a 1970 representen valors obtinguts desprÅs del
desenvolupament.

\begin{taulaVars}{17}
1& ANY   &     \\
2& HIGH   & Al\c{c}ada mÈxima en metres del riu    \\
3& LOW   & Al\c{c}ada mÕnima en metres del riu    \\
\end{taulaVars}

{\tit Fuel}

Font: Sanford Weisberg, Applied Linear Regression, Wiley 1985, pag 35

Arxiu: ftp://libiya.upf.es:/WWW/pub/data\_sets/fuel.dat


Dades de 48 estats de USA recollides del {\em American Almanac} de 1974 i
del {\em 1974 World Almanac}. Les podem utilitzar per estudiar el
consum de benzina en funciÆ d'altres variables. SerÈ de particular
interÉs l'estudi de la relaciÆ entre les taxes d'impostos i el consum
de benzina.

\begin{taulaVars}
1& CASE   & NumeraciÆ dels casos    \\
2& STATE   & Dues lletres per codificar l'estat en qÏestiÆ    \\
3& POP   &  PoblaciÆ en milers, any 1971   \\
4& TAX   &  Impostos (centaus per galÆ) any 1972    \\
5& NLIC   & Milers de permisos de conduir a l'any 1971    \\
6& INC   &  Ingressos per cÈpita en milers de dÊlars, 1972   \\
7& ROAD   & Milers de milles de carreteres federals    \\
8& FUELC   & Millions de galons de benzina consumida, 1972    \\
9& DLIC & Percentatge de permisos de conduir sobre la poblaciÆ total\\
 &      & 100$\times$FUELC/POP \\
10& FUEL & Galons consumits per persona: 1000$\times$FUELC/POP\\
\end{taulaVars}

{\tit Mammals}

Font: Sanford Weisberg, Applied Linear Regression, Wiley 1985, pag 144

Arxiu: ftp://libiya.upf.es:/WWW/pub/data\_sets/mammals.dat

Es tenen dades dels pesos mitjans del cervell i de tot el cos de 62
espÉcies de mamÕfers. Destaquen els casos 19 (Elefant asiÈtic) i 33
(Elefant AfricÈ), 32 (HumÈ). Veure Weisberg per llistat complet,
discussiÆ i grÈfics. Proposa prendre logaritmes en les dues variables.

\begin{taulaVars}{62}
1&BODY & Pes corporal promig de l'espÉcie (Kg)   \\
2&BRAIN    &  Pes promig del cervell (g)   \\
\end{taulaVars}


{\tit Land Rent}

Font: Sanford Weisberg, Applied Linear Regression, Wiley 1985, pag 162

Arxiu: ftp://libiya.upf.es:/WWW/pub/data\_sets/land\_rent.dat

SÆn dades dels 67 comptats de Minnesota amb quantitat apreciable de
terra agrÕcola llogada.

\begin{taulaVars}{67}
1& RENT &Lloguer promig per acre de terra plantada amb aufals   \\
2& RENTALL   & Lloguer promig per acre de terra cultivable    \\
3& COWS   &  Densitat de vaques (nombre per milla quadrada)   \\
4& PASTURE   & ProporciÆ de terra agrÕcola usada per a pastura    \\
5& LIMING   &  1 si cal adobar per plantar aufals, 0 si no   \\
\end{taulaVars}

{\tit Despesa en salut}

Font:  OECD-CREDES

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europa60-90/despesa.dat}

Despesa nacional en salut per cÈpita, real  (deflactat en
base 1985) de tots els paÕsos de la UE (excepte GrÉcia i
Portugal). Üs a dir, despesa pÇblica i privada en salut (sous
dels metges i infermeres, despesa en medicaments, etc). Per
poder-la comparar entre paÕsos estÈ en 'paritat del poder de
compra' (PPA) Ås a dir, quina quantitat de bÅns compra en cada
paÕs un dÊlar de 1985. Les dades sÆn dels anys 1960-1990, 31 anys.

\begin{taulaVars}{31}
 1&        ALEMANYA     \\
 2&        B£LGICA      \\ 
 3&        DINAMARCA    \\ 
 4&        ESPANYA      \\ 
 5&        FRAN´A       \\ 
 6&        IRLANDA     \\  
 7&        IT¡LIA      \\  
 8&        LUXEMBURG   \\  
 9&        HOLANDA      \\ 
10&        REGNE UNIT     \\
\end{taulaVars}

{\tit Preus a Europa}

Font:  OECD-CREDES

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europa60-90/preus.dat}

Deflactor implÕcit del PIB (base 1985=100) de tots els paÕsos
de la UE (excepte GrÉcia i Portugal). Üs un Õndex de preus mÅs
ampli que el IPC doncs no contÅ  nomÅs preus de consum. Les dades sÆn
dels anys  1960-1990.

\begin{taulaVars}{31}
 1&        ALEMANYA     \\
 2&        B£LGICA      \\ 
 3&        DINAMARCA    \\ 
 4&        ESPANYA      \\ 
 5&        FRAN´A       \\ 
 6&        IRLANDA     \\  
 7&        IT¡LIA      \\  
 8&        LUXEMBURG   \\  
 9&        HOLANDA      \\ 
10&        REGNE UNIT     \\
\end{taulaVars}


{\tit PIB a Europa}

Font:  OECD-CREDES

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europa60-90/pib.dat}

PIB real per cÈpita (deflactat amb base 1985=100) de tots els
paÕsos de la UE (excepte GrÉcia i Portugal). Per poder-lo
comparar entre paÕsos estÈ en 'paritat del poder de compra' (PPA)
Ås a dir, quina quantitat de bÅns compra en cada paÕs un dÊlar
de 1985.

\begin{taulaVars}{31}
 1&        ALEMANYA     \\
 2&        B£LGICA      \\ 
 3&        DINAMARCA    \\ 
 4&        ESPANYA      \\ 
 5&        FRAN´A       \\ 
 6&        IRLANDA     \\  
 7&        IT¡LIA      \\  
 8&        LUXEMBURG   \\  
 9&        HOLANDA      \\ 
10&        REGNE UNIT     \\
\end{taulaVars}

{\tit Preus de salut}

Font: OECD-CREDES

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europa60-90/ph.dat}

åndex de preus de la despesa en salut (base 1985=100) de tots
els paÕsos de la UE (excepte GrÉcia i Portugal). Üs un Õndex de
preus semblant al IPC, perÊ  nomÅs de la despesa en salut.

\begin{taulaVars}{31}
 1&        ALEMANYA     \\
 2&        B£LGICA      \\ 
 3&        DINAMARCA    \\ 
 4&        ESPANYA      \\ 
 5&        FRAN´A       \\ 
 6&        IRLANDA     \\  
 7&        IT¡LIA      \\  
 8&        LUXEMBURG   \\  
 9&        HOLANDA      \\ 
10&        REGNE UNIT     \\
\end{taulaVars}


{\tit Cross-1990}

Font: OECD-CREDES

Arxiu: {\tt ftp://libiya.upf.es:/WWW/pub/data\_sets/europa60-90/cross1990.dat}

Üs un tall transversal per l'any 1990 dels fitxers PIB.DAT,
DESPESA.DAT, PREUS.DAT i PH.DAT. Tots els paÕsos de la UE
(excepte GrÉcia i Portugal) en l'ordre abans dit. Per poder
comparar PIB i Despesa entre paÕsos estan en 'paritat del poder
de compra' (PPA) Ås a dir, quina quantitat de bÅns compra en cada
paÕs un dÊlar de 1985.

\begin{taulaVars}{10}
 1&     PIB      &     PIB real per cÈpita (deflactat base 1985)  \\
 2&     DESPESA  &     Despesa en salut real per cÈpita (base 1985)  \\
 3&     PREUS    &     Deflactor implÕcit del PIB (1985=100)  \\
 4&     PH       &     åndex de preus de salut (1985=100)  \\
\end{taulaVars}



\end{document}

