ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Inferencia


Enviado por   •  8 de Octubre de 2014  •  15.197 Palabras (61 Páginas)  •  156 Visitas

Página 1 de 61

ste capítulo contiene una selección de la informa- 13.2 PRECISIÓN Y EXACTITUD

ción básica acerca del análisis de las incertidumbres,

y el tratamiento de grandes cantidades de datos. Se

13.2.1 DEFINICIONES

empieza con una discusión de los “errores”, para lle-

gar a un método que ayude a juzgar cuan probable

Resulta importante distinguir entre precisión y exac-

es un resultado final.

titud.

1) La precisión de un resultado es una medida de la

reproductividad de una observación, o sea de

13.1 ERRORES

cuan bien se puede reproducir el resultado, inde-

En los diccionarios la palabra error se define como la pendientemente de lo cerca que se encuentre del

diferencia entre el valor aproximado que resulta de valor “verdadero”. Al “error” asociado se le

una observación, una medida o un cálculo, y el valor denomina incertidumbre de un resultado.

verdadero. El problema surge cuando se ha de cono-

2) La exactitud es una medida de lo correcta que es

cer el “valor verdadero”, que generalmente se obtie-

una observación, o sea cuan cerca está del valor

ne como resultado de una medida o de un cálculo.

“verdadero”.

Por este motivo se debe encontrar un método para

estimar la “fiabilidad” del resultado obtenido.

Los dos conjuntos de definiciones se pueden relacio-

nar de manera sencilla.

La palabra “errores” no está bien definida como tal.

Por lo tanto, la definición ha de ser más rigurosa. Los

• La precisión es una medida de las dimensiones de

errores se pueden clasificar como:

los errores aleatorios. Si se consiguen reducir los

errores aleatorios, por ejemplo a partir de un

1) Equivocación o error en la medida o en el cálcu-

equipo mejor o de procedimientos mejores, la

lo; son normalmente aparentes, ya que se

precisión de la medida será mejor, el resultado

encuentran lejos de los valores esperados. Se

será más preciso, y el análisis más reproducible. El

detectan repitiendo la medida o el cálculo.

trabajo de cada laboratorio por separado consis-

2) Errores sistemáticos, que son más difíciles de te en reducir los errores aleatorios para aumentar

detectar. Estas discrepancias son reproducibles. A la precisión.

menudo es el resultado de un fallo en la instru-

• Por otro lado, un error sistemático afecta directa-

mentación o provienen de una consistencia

mente la exactitud de la medida; si se evitan o se

matemática insuficiente. Estos errores se encuen-

eliminan los errores sistemáticos, el resultado será

tran (y se corrigen) repitiendo el análisis con dife-

más exacto y más creíble. A menudo, el objetivo

rentes equipos o repitiendo el cálculo (por otros

de la comparaciones internas que se llevan a

medios, o por un compañero).

cabo en algunos laboratorios a nivel internacional

3) Errores aleatorios, que son los más comunes. Son consiste en incrementar la exactitud del resultado

debidos a la inevitable limitación de la calidad de mediante el análisis de muestras que se encuen-

los instrumentos. Sólo se pueden eliminar par- tren bajo las mismas condiciones y utilizando

cialmente si se refina el equipo o el método ana- estándares definidos.

lítico, y repitiendo las medidas (como por ejem-

Para poder estudiar y eventualmente reducir los erro-

plo, leer una temperatura o el pH) o aumentan-

res sistemáticos es importante disponer de datos con

do el tiempo de observación (como por ejemplo

el tiempo de medida de radioactividad). pequeños errores aleatorios, que posean una preci-

159

Errores, Medias y Ajustes

sión relativamente elevada. Por otro lado, cuando el cha. A modo de regla puede decirse que la precisión

error sistemático es grande, es una perdida de tiem- de la incertidumbre (esto es, el grado de certeza de

po y de dinero invertir mucho esfuerzo en incremen- la incertidumbre) nunca es mejor que 10% de la

tar la precisión. La Fig.13.1 ilustra la diferencia entre incertidumbre. Por ejemplo, si la medida de la radio-

la precisión y la exactitud. actividad de una muestra es 13,56 Bq, podría pre-

sentar una incertidumbre de 13,56±0,12 o

13,56±0,08, pero si se da un dígito más en la incer-

tidumbre, es decir, 13,56±0,081 se estaría exageran-

13.2.2 CIFRAS Y DÍGITOS SIGNIFICATIVOS

do la “certeza de la incertidumbre”.

Una regla muy común a la hora de publicar números

La incertidumbre también determina el número de

consiste en indicar la incertidumbre mediante cifras

dígitos citados. Por ejemplo, seria correcto citar

y los dígitos del número que se escribe. Cuando se

13,56±0,12 Bq, pero no seria consistente escribir

describe una distancia como 5000 km, por sentido

común normalmente se consideran las cifras situa- 13,564±0,12 Bq.

das más a la izquierda. No obstante, si se sabe con

En los cálculos realizados con ordenador se conser-

certeza la cifra siguiente (el 0 situado más a la

van todos los dígitos; sólo se redondea el resultado

izquierda), se escribirá como 5,0⋅103 km. Por lo

final. Sin embargo, los resultados que se van escri-

general es preferible escribir los números según la

biendo durante un cálculo matemático se han de dar

notación científica, es decir, el argumento en nota-

con un número de dígitos que pueda ser justificado.

ción digital con un número de dígitos, multiplicado

No obstante, el cálculo completo se efectúa sin rea-

por una potencia de 10. Los dígitos que presentan

lizar un redondeo intermedio.

más incertidumbre son los situados más a la dere-

Fig.13.1 Gráficas que ilustran la precisión y exactitud. Se muestran dos series de resultados de 19 medidas de la misma

radioactividad.

A. Los datos son imprecisos pero exactos; el valor medio adecuado es 13,56 Bq. El área sombreada representa el nivel 1σ

de confianza; es decir, el 68% de los datos debe estar dentro de este rango (véase el ejemplo en el Apt.13.5.2).

B. Los datos son precisos pero inexactos, probablemente por los errores sistemáticos; el valor medio ahora es 13,50 Bq,

en lugar del valor "verdadero" 13,56 Bq.

160

Errores, Medias y Ajustes

13.2.3 INCERTIDUMBRES 13.3.2 DISTRIBUCIÓN DE LOS DATOS

Existen dos tipos de incertidumbres. Los resultados de un número de medidas se pueden

representar por medio de un histograma, que es un

1) Incertidumbres instrumentales, debido a fluctua- gráfico que representa el número de veces (eje de las

ciones en el resultado de cualquier observación y) que fueron obtenidos los diferentes resultados en

instrumental, independientemente si se mide la el eje de las x (Fig.13.2). Es obvio que la probabilidad

temperatura del exterior o se pesa una carta en de obtener un resultado que se encuentre cada vez

una balanza de cartas, o si se aplica un equipo de más lejos del valor más frecuente es menor.

medida más sofisticado para medir el tiempo en

el laboratorio. A partir de una “conjetura razona-

ble” o mediante la repetición de la medida

observando posteriormente la distribución de los

resultados se puede estimar la dimensión de la

incertidumbre.

2) Incertidumbres estadísticas, debido a que ciertos

procesos, incluso teóricamente, muestran fluc-

tuaciones. Un ejemplo adecuado sería la desinte-

gración radioactiva. Incluso un equipo ideal (no

real) que la medida de la actividad fluctua, o sea

que hay una “dispersión estadística” de los resul-

tados. En casos como estos existen procedimien-

tos para determinar la incertidumbre más allá de

la duda.

13.3 INCERTIDUMBRES INSTRUMENTALES

13.3.1 VALORES MEDIOS

Fig.13.2 Histograma (en forma de bloques); indica la dis-

La media o el valor medio que resulta de un número tribución irregular de las medidas dentro de un rango de

de medidas se define como la suma de los resultados xi(∆x), es decir, entre xi y xi + ∆x alrededor de la media; en

dividido entre el número de medidas: lugar de dar los resultados, se dan las desviaciones respec-

to del valor medio (x ) junto con el número de observa-

ciones (eje y) para valores que pertenezcan a un determi-

(13.1) nado rango. La curva suavizada ilustra una distribución

Gausiana, que seria el resultado hipotético cuando se

N es el número de medidas, i representa el número cuenta con infinitas medidas. También representa la pro-

babilidad de distribución (P) de los datos alrededor de un

de serie de una medida arbitraria y x es el parámetro

valor medio. Las desviaciones respecto de la media se

medido. A menudo se omite N e i = 1, y simple-

expresan en función de la desviación estándar (σ).

mente se escribe Σxi.

En la parte superior se muestra la integral o la suma de las

El número de medidas siempre es limitado. No obs- probabilidades: la probabilidad de observar valores entre

tante, si se pudiese aumentar este número hasta infi- x + σ y x − σ es 68 %, entre x + 2σ y x − 2σ es 95 %

nito, se obtendría una media mejor, definida como y finalmente entre x + 3σ y − 3σ es 99,7 %.

El histograma (o diagrama de bloques) consiste en

(13.2)

unas columnas que representan el número de veces

(Ni) que se observa el resultado xi(∆x) dentro de un

La mediana se define como el valor que, en un con-

cierto rango xi y xi + ∆x. Esto recibe el nombre se dis-

junto de datos, presenta tantos datos superiores

tribución muestral. El valor medio es:

como inferiores a él. Para una distribución simétrica,

la media y la mediana son idénticas. Posteriormente

se utilizan las desviaciones de un resultado único

respecto de la media (o la mediana), x − xi; por defi-

y (13.4)

nición, la desviación media de los resultados a partir

del valor medio es igual a cero:

N = ΣNi

(13.3)

161

Errores, Medias y Ajustes

Si a la hora de construir el histograma se escoge un

∆x o una amplitud de la clase muy grande, casi todos

los datos se encontraran dentro de una columna, lo (13.7)

cual implicaría una buena certeza estadística, pero

una mala resolución; si ∆x es demasiado pequeña la Por lo tanto la varianza es la media de los cuadrados

menos el cuadrado de las medias. La medida cuanti-

resolución incrementará, pero se tendrán escasos

tativa de las dimensiones de los errores aleatorios, es

datos en cada columna y por lo tanto será menos

decir, de la dispersión estadística de los datos alrede-

fiable (histograma disperso).

dor de la media, o en otras palabras, de la precisión

Cuantas más medidas se realicen, se tendrá una se representa a partir de la desviación estándar σ,

mejor impresión de la distribución de los datos alre- que es la raíz cuadrada de la varianza. Cuanto más

dedor de un cierto valor medio. Para un número infi- pequeña sea la desviación estándar, mejor es la pre-

nito de resultados con errores aleatorios la distribu- cisión, y más estrecha es la Gausiana.

ción de la muestra se representa por medio de una

Si a continuación se considera el conjunto real de

distribución normal o Gausiana en forma de campa-

medidas, la desviación estándar del conjunto será:

na, en la que la probabilidad de observar un cierto

valor de y = yi en x = xi es:

(13.8)

(13.5)

El motivo por el que se considera N−1 en lugar de N

en el denominador se explica en libros de textos

yi es el valor medido de la variable dependiente, y

especializados en análisis estadístico. No se puede

f(xi) es el valor de y calculado para la variable inde-

utilizar esta definición cuando se tiene una única

pendiente xi; σi es la desviación estándar de yi, que

medida; no se puede utilizar una sola medida para

se define posteriormente. El valor más probable, la

determinar la precisión de ésta. Por lo tanto, puede

moda, corresponde al pico de la distribución, es

que la fracción no sea un número realista.

decir, la parte superior de la curva suavizada. Para los

datos con errores aleatorios, la distribución es simé- En la actualidad todas las calculadoras de bolsillo

poseen instalada las funciones para calcular x y σ.

trica alrededor de la parte superior. La Fig.13.2

muestra la curva Gausiana junto con el histograma

En la Fig.13.2 se indican varios intervalos de con-

que se obtiene con un número limitado de medidas.

fianza. La probabilidad de que una medida aleatoria

se encuentre entrex + σ yx − σ vale 68%. Esto sig-

nifica que si se repite una medida se obtendrá un

13.3.3 DESVIACIÓN ESTÁNDAR

nuevo resultado dentro de ±σ de la media en el 68%

de los casos (intervalo de confianza 1σ), de ±2σ en

el 95% de los casos (intervalo de confianza 2σ), y de

13.3.3.1 PRECISIÓN DE LOS DATOS

de ±3σ en el 99,7% de los casos (intervalo de con-

Resulta obvio que si los errores aleatorios son peque- fianza 3σ).

ños, los valores de la desviación (xi −x) serán peque-

ños y la distribución de los resultados alrededor de la

13.3.3.2 PRECISIÓN DE LA MEDIA

media será más estrecha. La desviación media es una

medida de la dispersión de los datos alrededor de la

La discusión anterior se ha centrado en la precisión

media. A ésta se la conoce con el nombre de disper-

de los datos, que se caracteriza por la desviación

sión del conjunto de datos. La Ec.13.3 demuestra

estándar. Es igualmente de importante determinar la

que no se puede utilizar un simple promedio de

incertidumbre del resultado final de un número de

todas las desviaciones, ya que este se deriva de la

medidas. Por este motivo se ha de calcular la preci-

definición de media. El promedio de los valores

sión de la media o, más concretamente, la desvia-

absolutos de las desviaciones, esto es, independien-

ción estándar de la media.

temente de su signo, caracteriza mejor la dispersión:

A continuación se discute brevemente la propaga-

ción de los errores; es decir, la incertidumbre media

(13.6)

obtenida a partir de un determinado número de

resultados. Como conclusión, la varianza de la media

Sin embargo, por razones matemáticas no resulta

es la varianza del conjunto de datos multiplicado por

apropiado utilizar valores absolutos. Por este motivo,

el número de medidas:

si se pretende caracterizar la distribución se deberán

considerar los cuadrados de las desviaciones. El valor

(13.9)

que resulta recibe el nombre de varianza:

162

Errores, Medias y Ajustes

La desviación estándar de la media será:

(13.13)

(13.10)

Como es obvio, la precisión relativa será mejor cuan-

to mayor sea la tasa de detecciones y el tiempo de

Como ejemplo se calcula la media y las desviaciones

medida.

estándar de los datos que se muestran en la

Fig.13.1A y en la Tabla 13.1. Se supone que todos

El problema de los rangos de confianza de los datos

los datos poseen la misma incertidumbre / precisión.

observados con incertidumbres estadísticas es similar

a las incertidumbres instrumentales de las que se

habla en la sección previa. La probabilidad de que un

Tabla 13.1 Conjunto de datos correspondientes a la “valor verdadero” observado durante un periodo

infinito de tiempo se encuentre entre xi + σ y xi − σ

Fig.13.1A.

del valor medido representa el 68%: la desviación

xi −x xi −x

Nr. xi Nr. xi estándar representa el 68% del intervalo de confian-

−0,01 −0,05 za, 2σ representa el 95% del intervalo de confianza,

13,55 13,51

1 11

y 99,7% representa el 3σ del intervalo de confianza.

−0,11

13,45 13,63 +0,07

2 12

−0,04

13,57 +0,01 13,52

3 13

−0,01

13,68 +0,12 13,55

4 14

13.5 PROPAGACIÓN DE ERRORES

−0,11

13,63 +0,07 13,45

5 15

−0,09

13,47 13,62 +0,06

6 16

13.5.1 DESVIACIÓN ESTÁNDAR

13,69 +0,13 13,74 +0,18

7 17

−0,16

13,40 13,65 +0,09

8 18 A menudo resulta necesario conocer una cantidad A

−0,11

13,56 +0,00 13,45 que es función de una o más variables, cada una de

9 19

las cuales posee su propia incertidumbre. La incerti-

−0,04

13,52

10

dumbre de cada variable contribuye a la incertidum-

bre global. A continuación se presentan las expresio-

Media x = 13,56 nes matemáticas de σ2 para varios casos. Dichas

Desviación estándar σx = {Σ(xi − ±0,095

13,56)}1/2/18 = ecuaciones se basan en la relación general de la fun-

σ de la media = σx/191/2 = ±0,022 ción:

A = f (x, y, z)

13.4 INCERTIDUMBRES ESTADÍSTICAS En el caso que las incertidumbres sean estadísticas,

la desviación estándar de A dependerá de las varia-

Las incertidumbres estadísticas, definidas en el

bles independientes x, y, z de la siguiente manera:

Apt.13.2.3, surgen de las fluctuaciones aleatorias

del número de sucesos, por ejemplo, el número de

desintegraciones radioactivas por unidad de tiempo, (13.14)

y no como consecuencia de la limitada precisión del

equipo de medida. Para estas fluctuaciones estadís-

Si se estima que las incertidumbres son instrumenta-

ticas la teoría estadística proporciona la técnica

les, se utilizan ecuaciones similares para calcular la

matemática para describir la distribución de los

incertidumbre del resultado final. Para la relación

datos y la desviación estándar. Por consiguiente, la

general:

desviación estándar de un número de detecciones M

durante un periodo de tiempo t simplemente es:

A = f(x, y, z)

σ = M1/2 (13.11)

con las incertidumbres instrumentales ∆x, ∆y y ∆z, la

incertidumbre para A será:

La desviación estándar para la tasa de detecciones R,

esto es, el número de detecciones por segundo,

será: (13.15)

obteniendo ecuaciones equivalentes para ∆A y para

(13.12)

σA según las Ecs.13.16-13.19. En estos ejemplos a y

b son coeficientes constantes, x e y son variables

La incertidumbre relativa de la tasa de detecciones se

independientes; A es la variable dependiente.

expresa mediante:

163

Errores, Medias y Ajustes

1) A = ax + by; también A = ax, con las incertidum- obtener el ajuste más probable de una función res-

bres σx y σy; en ambos casos: pecto a una serie de datos, tanto gráfico como alge-

braico. El ajuste más utilizado es la línea recta, ya

σA2 = a2σx2 + b2σy2 (13.16) que normalmente se considera que los datos siguen

una relación lineal.

2) A = ± a xy; también A = ± a x/y

13.6.1 AJUSTE LINEAL

(13.17)

El principio fundamental del ajuste por mínimos cua-

drados consiste en minimizar la suma de los cuadra-

e± bx

3) A = a

dos de las desviaciones de la variable dependiente (y)

σA/A = ± bσx (se considera que la incertidumbre en x es despre-

(13.18)

ciable) de la línea recta definida con los coeficientes

4) A = a ln(± bx) a y b:

σA = a σx/x (13.19) y = a + bx (13.22)

La desviación de cualquier valor de y (yi) respecto de

la línea recta se expresa como

13.5.2 MEDIA PONDERADA

∆yi = yi − f(xi) = yi − a − bxi (13.23)

Hasta el momento se ha considerado que todos los

valores promediados poseían la misma precisión y Al minimizar la suma de las desviaciones resulta:

por tanto el mismo peso. Si se aplica a cada número

Σ∆yi = 0

su propia desviación estándar, la media se calculará (13.24)

según:

Si se hiciese lo mismo con los valores absolutos de

∆yi no se obtendría un procedimiento matemático

útil. Por consiguiente, es imprescindible buscar un

(13.20)

procedimiento que proporcione los coeficientes a y b

que caracterizan la línea recta, el cual cumpla que la

suma de los cuadrados de las desviaciones:

mientras que la desviación estándar de la media se

expresa como: Σ(∆yi)2 = Σ(yi − a − bxi)2 (13.25)

sea mínima. Las condiciones para el ajuste son:

obteniendo así:

y (13.26)

(13.21)

El peso de cada resultado es inversamente propor-

Los valores de a y b que se obtienen son:

cional al cuadrado de la desviación estándar, 1/σ2,

que recibe el nombre de factor de ponderación.

(13.27a)

Si las desviaciones estándar σi son iguales, la expre-

sión de σ de la media se reduce a la de la Ec.13.10: y

σx2 = 1 / Σ(1/σi)2 = 1 / [N(1/σi)2] = σi2 / N o sea

(13.27b)

σx = σi / N1/2

siendo

13.6 AJUSTE POR MÍNIMOS CUADRADOS

(13.27c)

Por lo general, cualquier medida se relaciona con

otras variables, por ejemplo y = f(x). Esta función

podría tener cualquier forma: lineal, cuadrática,

armónica, etc. El objetivo de este apartado es discu-

tir brevemente algunos métodos que se utilizan para

...

Descargar como  txt (32 Kb)  
Leer 60 páginas más »