Inferencia
Enviado por • 8 de Octubre de 2014 • 15.197 Palabras (61 Páginas) • 156 Visitas
ste capítulo contiene una selección de la informa- 13.2 PRECISIÓN Y EXACTITUD
ción básica acerca del análisis de las incertidumbres,
y el tratamiento de grandes cantidades de datos. Se
13.2.1 DEFINICIONES
empieza con una discusión de los “errores”, para lle-
gar a un método que ayude a juzgar cuan probable
Resulta importante distinguir entre precisión y exac-
es un resultado final.
titud.
1) La precisión de un resultado es una medida de la
reproductividad de una observación, o sea de
13.1 ERRORES
cuan bien se puede reproducir el resultado, inde-
En los diccionarios la palabra error se define como la pendientemente de lo cerca que se encuentre del
diferencia entre el valor aproximado que resulta de valor “verdadero”. Al “error” asociado se le
una observación, una medida o un cálculo, y el valor denomina incertidumbre de un resultado.
verdadero. El problema surge cuando se ha de cono-
2) La exactitud es una medida de lo correcta que es
cer el “valor verdadero”, que generalmente se obtie-
una observación, o sea cuan cerca está del valor
ne como resultado de una medida o de un cálculo.
“verdadero”.
Por este motivo se debe encontrar un método para
estimar la “fiabilidad” del resultado obtenido.
Los dos conjuntos de definiciones se pueden relacio-
nar de manera sencilla.
La palabra “errores” no está bien definida como tal.
Por lo tanto, la definición ha de ser más rigurosa. Los
• La precisión es una medida de las dimensiones de
errores se pueden clasificar como:
los errores aleatorios. Si se consiguen reducir los
errores aleatorios, por ejemplo a partir de un
1) Equivocación o error en la medida o en el cálcu-
equipo mejor o de procedimientos mejores, la
lo; son normalmente aparentes, ya que se
precisión de la medida será mejor, el resultado
encuentran lejos de los valores esperados. Se
será más preciso, y el análisis más reproducible. El
detectan repitiendo la medida o el cálculo.
trabajo de cada laboratorio por separado consis-
2) Errores sistemáticos, que son más difíciles de te en reducir los errores aleatorios para aumentar
detectar. Estas discrepancias son reproducibles. A la precisión.
menudo es el resultado de un fallo en la instru-
• Por otro lado, un error sistemático afecta directa-
mentación o provienen de una consistencia
mente la exactitud de la medida; si se evitan o se
matemática insuficiente. Estos errores se encuen-
eliminan los errores sistemáticos, el resultado será
tran (y se corrigen) repitiendo el análisis con dife-
más exacto y más creíble. A menudo, el objetivo
rentes equipos o repitiendo el cálculo (por otros
de la comparaciones internas que se llevan a
medios, o por un compañero).
cabo en algunos laboratorios a nivel internacional
3) Errores aleatorios, que son los más comunes. Son consiste en incrementar la exactitud del resultado
debidos a la inevitable limitación de la calidad de mediante el análisis de muestras que se encuen-
los instrumentos. Sólo se pueden eliminar par- tren bajo las mismas condiciones y utilizando
cialmente si se refina el equipo o el método ana- estándares definidos.
lítico, y repitiendo las medidas (como por ejem-
Para poder estudiar y eventualmente reducir los erro-
plo, leer una temperatura o el pH) o aumentan-
res sistemáticos es importante disponer de datos con
do el tiempo de observación (como por ejemplo
el tiempo de medida de radioactividad). pequeños errores aleatorios, que posean una preci-
159
Errores, Medias y Ajustes
sión relativamente elevada. Por otro lado, cuando el cha. A modo de regla puede decirse que la precisión
error sistemático es grande, es una perdida de tiem- de la incertidumbre (esto es, el grado de certeza de
po y de dinero invertir mucho esfuerzo en incremen- la incertidumbre) nunca es mejor que 10% de la
tar la precisión. La Fig.13.1 ilustra la diferencia entre incertidumbre. Por ejemplo, si la medida de la radio-
la precisión y la exactitud. actividad de una muestra es 13,56 Bq, podría pre-
sentar una incertidumbre de 13,56±0,12 o
13,56±0,08, pero si se da un dígito más en la incer-
tidumbre, es decir, 13,56±0,081 se estaría exageran-
13.2.2 CIFRAS Y DÍGITOS SIGNIFICATIVOS
do la “certeza de la incertidumbre”.
Una regla muy común a la hora de publicar números
La incertidumbre también determina el número de
consiste en indicar la incertidumbre mediante cifras
dígitos citados. Por ejemplo, seria correcto citar
y los dígitos del número que se escribe. Cuando se
13,56±0,12 Bq, pero no seria consistente escribir
describe una distancia como 5000 km, por sentido
común normalmente se consideran las cifras situa- 13,564±0,12 Bq.
das más a la izquierda. No obstante, si se sabe con
En los cálculos realizados con ordenador se conser-
certeza la cifra siguiente (el 0 situado más a la
van todos los dígitos; sólo se redondea el resultado
izquierda), se escribirá como 5,0⋅103 km. Por lo
final. Sin embargo, los resultados que se van escri-
general es preferible escribir los números según la
biendo durante un cálculo matemático se han de dar
notación científica, es decir, el argumento en nota-
con un número de dígitos que pueda ser justificado.
ción digital con un número de dígitos, multiplicado
No obstante, el cálculo completo se efectúa sin rea-
por una potencia de 10. Los dígitos que presentan
lizar un redondeo intermedio.
más incertidumbre son los situados más a la dere-
Fig.13.1 Gráficas que ilustran la precisión y exactitud. Se muestran dos series de resultados de 19 medidas de la misma
radioactividad.
A. Los datos son imprecisos pero exactos; el valor medio adecuado es 13,56 Bq. El área sombreada representa el nivel 1σ
de confianza; es decir, el 68% de los datos debe estar dentro de este rango (véase el ejemplo en el Apt.13.5.2).
B. Los datos son precisos pero inexactos, probablemente por los errores sistemáticos; el valor medio ahora es 13,50 Bq,
en lugar del valor "verdadero" 13,56 Bq.
160
Errores, Medias y Ajustes
13.2.3 INCERTIDUMBRES 13.3.2 DISTRIBUCIÓN DE LOS DATOS
Existen dos tipos de incertidumbres. Los resultados de un número de medidas se pueden
representar por medio de un histograma, que es un
1) Incertidumbres instrumentales, debido a fluctua- gráfico que representa el número de veces (eje de las
ciones en el resultado de cualquier observación y) que fueron obtenidos los diferentes resultados en
instrumental, independientemente si se mide la el eje de las x (Fig.13.2). Es obvio que la probabilidad
temperatura del exterior o se pesa una carta en de obtener un resultado que se encuentre cada vez
una balanza de cartas, o si se aplica un equipo de más lejos del valor más frecuente es menor.
medida más sofisticado para medir el tiempo en
el laboratorio. A partir de una “conjetura razona-
ble” o mediante la repetición de la medida
observando posteriormente la distribución de los
resultados se puede estimar la dimensión de la
incertidumbre.
2) Incertidumbres estadísticas, debido a que ciertos
procesos, incluso teóricamente, muestran fluc-
tuaciones. Un ejemplo adecuado sería la desinte-
gración radioactiva. Incluso un equipo ideal (no
real) que la medida de la actividad fluctua, o sea
que hay una “dispersión estadística” de los resul-
tados. En casos como estos existen procedimien-
tos para determinar la incertidumbre más allá de
la duda.
13.3 INCERTIDUMBRES INSTRUMENTALES
13.3.1 VALORES MEDIOS
Fig.13.2 Histograma (en forma de bloques); indica la dis-
La media o el valor medio que resulta de un número tribución irregular de las medidas dentro de un rango de
de medidas se define como la suma de los resultados xi(∆x), es decir, entre xi y xi + ∆x alrededor de la media; en
dividido entre el número de medidas: lugar de dar los resultados, se dan las desviaciones respec-
to del valor medio (x ) junto con el número de observa-
ciones (eje y) para valores que pertenezcan a un determi-
(13.1) nado rango. La curva suavizada ilustra una distribución
Gausiana, que seria el resultado hipotético cuando se
N es el número de medidas, i representa el número cuenta con infinitas medidas. También representa la pro-
babilidad de distribución (P) de los datos alrededor de un
de serie de una medida arbitraria y x es el parámetro
valor medio. Las desviaciones respecto de la media se
medido. A menudo se omite N e i = 1, y simple-
expresan en función de la desviación estándar (σ).
mente se escribe Σxi.
En la parte superior se muestra la integral o la suma de las
El número de medidas siempre es limitado. No obs- probabilidades: la probabilidad de observar valores entre
tante, si se pudiese aumentar este número hasta infi- x + σ y x − σ es 68 %, entre x + 2σ y x − 2σ es 95 %
nito, se obtendría una media mejor, definida como y finalmente entre x + 3σ y − 3σ es 99,7 %.
El histograma (o diagrama de bloques) consiste en
(13.2)
unas columnas que representan el número de veces
(Ni) que se observa el resultado xi(∆x) dentro de un
La mediana se define como el valor que, en un con-
cierto rango xi y xi + ∆x. Esto recibe el nombre se dis-
junto de datos, presenta tantos datos superiores
tribución muestral. El valor medio es:
como inferiores a él. Para una distribución simétrica,
la media y la mediana son idénticas. Posteriormente
se utilizan las desviaciones de un resultado único
respecto de la media (o la mediana), x − xi; por defi-
y (13.4)
nición, la desviación media de los resultados a partir
del valor medio es igual a cero:
N = ΣNi
(13.3)
161
Errores, Medias y Ajustes
Si a la hora de construir el histograma se escoge un
∆x o una amplitud de la clase muy grande, casi todos
los datos se encontraran dentro de una columna, lo (13.7)
cual implicaría una buena certeza estadística, pero
una mala resolución; si ∆x es demasiado pequeña la Por lo tanto la varianza es la media de los cuadrados
menos el cuadrado de las medias. La medida cuanti-
resolución incrementará, pero se tendrán escasos
tativa de las dimensiones de los errores aleatorios, es
datos en cada columna y por lo tanto será menos
decir, de la dispersión estadística de los datos alrede-
fiable (histograma disperso).
dor de la media, o en otras palabras, de la precisión
Cuantas más medidas se realicen, se tendrá una se representa a partir de la desviación estándar σ,
mejor impresión de la distribución de los datos alre- que es la raíz cuadrada de la varianza. Cuanto más
dedor de un cierto valor medio. Para un número infi- pequeña sea la desviación estándar, mejor es la pre-
nito de resultados con errores aleatorios la distribu- cisión, y más estrecha es la Gausiana.
ción de la muestra se representa por medio de una
Si a continuación se considera el conjunto real de
distribución normal o Gausiana en forma de campa-
medidas, la desviación estándar del conjunto será:
na, en la que la probabilidad de observar un cierto
valor de y = yi en x = xi es:
(13.8)
(13.5)
El motivo por el que se considera N−1 en lugar de N
en el denominador se explica en libros de textos
yi es el valor medido de la variable dependiente, y
especializados en análisis estadístico. No se puede
f(xi) es el valor de y calculado para la variable inde-
utilizar esta definición cuando se tiene una única
pendiente xi; σi es la desviación estándar de yi, que
medida; no se puede utilizar una sola medida para
se define posteriormente. El valor más probable, la
determinar la precisión de ésta. Por lo tanto, puede
moda, corresponde al pico de la distribución, es
que la fracción no sea un número realista.
decir, la parte superior de la curva suavizada. Para los
datos con errores aleatorios, la distribución es simé- En la actualidad todas las calculadoras de bolsillo
poseen instalada las funciones para calcular x y σ.
trica alrededor de la parte superior. La Fig.13.2
muestra la curva Gausiana junto con el histograma
En la Fig.13.2 se indican varios intervalos de con-
que se obtiene con un número limitado de medidas.
fianza. La probabilidad de que una medida aleatoria
se encuentre entrex + σ yx − σ vale 68%. Esto sig-
nifica que si se repite una medida se obtendrá un
13.3.3 DESVIACIÓN ESTÁNDAR
nuevo resultado dentro de ±σ de la media en el 68%
de los casos (intervalo de confianza 1σ), de ±2σ en
el 95% de los casos (intervalo de confianza 2σ), y de
13.3.3.1 PRECISIÓN DE LOS DATOS
de ±3σ en el 99,7% de los casos (intervalo de con-
Resulta obvio que si los errores aleatorios son peque- fianza 3σ).
ños, los valores de la desviación (xi −x) serán peque-
ños y la distribución de los resultados alrededor de la
13.3.3.2 PRECISIÓN DE LA MEDIA
media será más estrecha. La desviación media es una
medida de la dispersión de los datos alrededor de la
La discusión anterior se ha centrado en la precisión
media. A ésta se la conoce con el nombre de disper-
de los datos, que se caracteriza por la desviación
sión del conjunto de datos. La Ec.13.3 demuestra
estándar. Es igualmente de importante determinar la
que no se puede utilizar un simple promedio de
incertidumbre del resultado final de un número de
todas las desviaciones, ya que este se deriva de la
medidas. Por este motivo se ha de calcular la preci-
definición de media. El promedio de los valores
sión de la media o, más concretamente, la desvia-
absolutos de las desviaciones, esto es, independien-
ción estándar de la media.
temente de su signo, caracteriza mejor la dispersión:
A continuación se discute brevemente la propaga-
ción de los errores; es decir, la incertidumbre media
(13.6)
obtenida a partir de un determinado número de
resultados. Como conclusión, la varianza de la media
Sin embargo, por razones matemáticas no resulta
es la varianza del conjunto de datos multiplicado por
apropiado utilizar valores absolutos. Por este motivo,
el número de medidas:
si se pretende caracterizar la distribución se deberán
considerar los cuadrados de las desviaciones. El valor
(13.9)
que resulta recibe el nombre de varianza:
162
Errores, Medias y Ajustes
La desviación estándar de la media será:
(13.13)
(13.10)
Como es obvio, la precisión relativa será mejor cuan-
to mayor sea la tasa de detecciones y el tiempo de
Como ejemplo se calcula la media y las desviaciones
medida.
estándar de los datos que se muestran en la
Fig.13.1A y en la Tabla 13.1. Se supone que todos
El problema de los rangos de confianza de los datos
los datos poseen la misma incertidumbre / precisión.
observados con incertidumbres estadísticas es similar
a las incertidumbres instrumentales de las que se
habla en la sección previa. La probabilidad de que un
Tabla 13.1 Conjunto de datos correspondientes a la “valor verdadero” observado durante un periodo
infinito de tiempo se encuentre entre xi + σ y xi − σ
Fig.13.1A.
del valor medido representa el 68%: la desviación
xi −x xi −x
Nr. xi Nr. xi estándar representa el 68% del intervalo de confian-
−0,01 −0,05 za, 2σ representa el 95% del intervalo de confianza,
13,55 13,51
1 11
y 99,7% representa el 3σ del intervalo de confianza.
−0,11
13,45 13,63 +0,07
2 12
−0,04
13,57 +0,01 13,52
3 13
−0,01
13,68 +0,12 13,55
4 14
13.5 PROPAGACIÓN DE ERRORES
−0,11
13,63 +0,07 13,45
5 15
−0,09
13,47 13,62 +0,06
6 16
13.5.1 DESVIACIÓN ESTÁNDAR
13,69 +0,13 13,74 +0,18
7 17
−0,16
13,40 13,65 +0,09
8 18 A menudo resulta necesario conocer una cantidad A
−0,11
13,56 +0,00 13,45 que es función de una o más variables, cada una de
9 19
las cuales posee su propia incertidumbre. La incerti-
−0,04
13,52
10
dumbre de cada variable contribuye a la incertidum-
bre global. A continuación se presentan las expresio-
Media x = 13,56 nes matemáticas de σ2 para varios casos. Dichas
Desviación estándar σx = {Σ(xi − ±0,095
13,56)}1/2/18 = ecuaciones se basan en la relación general de la fun-
σ de la media = σx/191/2 = ±0,022 ción:
A = f (x, y, z)
13.4 INCERTIDUMBRES ESTADÍSTICAS En el caso que las incertidumbres sean estadísticas,
la desviación estándar de A dependerá de las varia-
Las incertidumbres estadísticas, definidas en el
bles independientes x, y, z de la siguiente manera:
Apt.13.2.3, surgen de las fluctuaciones aleatorias
del número de sucesos, por ejemplo, el número de
desintegraciones radioactivas por unidad de tiempo, (13.14)
y no como consecuencia de la limitada precisión del
equipo de medida. Para estas fluctuaciones estadís-
Si se estima que las incertidumbres son instrumenta-
ticas la teoría estadística proporciona la técnica
les, se utilizan ecuaciones similares para calcular la
matemática para describir la distribución de los
incertidumbre del resultado final. Para la relación
datos y la desviación estándar. Por consiguiente, la
general:
desviación estándar de un número de detecciones M
durante un periodo de tiempo t simplemente es:
A = f(x, y, z)
σ = M1/2 (13.11)
con las incertidumbres instrumentales ∆x, ∆y y ∆z, la
incertidumbre para A será:
La desviación estándar para la tasa de detecciones R,
esto es, el número de detecciones por segundo,
será: (13.15)
obteniendo ecuaciones equivalentes para ∆A y para
(13.12)
σA según las Ecs.13.16-13.19. En estos ejemplos a y
b son coeficientes constantes, x e y son variables
La incertidumbre relativa de la tasa de detecciones se
independientes; A es la variable dependiente.
expresa mediante:
163
Errores, Medias y Ajustes
1) A = ax + by; también A = ax, con las incertidum- obtener el ajuste más probable de una función res-
bres σx y σy; en ambos casos: pecto a una serie de datos, tanto gráfico como alge-
braico. El ajuste más utilizado es la línea recta, ya
σA2 = a2σx2 + b2σy2 (13.16) que normalmente se considera que los datos siguen
una relación lineal.
2) A = ± a xy; también A = ± a x/y
13.6.1 AJUSTE LINEAL
(13.17)
El principio fundamental del ajuste por mínimos cua-
drados consiste en minimizar la suma de los cuadra-
e± bx
3) A = a
dos de las desviaciones de la variable dependiente (y)
σA/A = ± bσx (se considera que la incertidumbre en x es despre-
(13.18)
ciable) de la línea recta definida con los coeficientes
4) A = a ln(± bx) a y b:
σA = a σx/x (13.19) y = a + bx (13.22)
La desviación de cualquier valor de y (yi) respecto de
la línea recta se expresa como
13.5.2 MEDIA PONDERADA
∆yi = yi − f(xi) = yi − a − bxi (13.23)
Hasta el momento se ha considerado que todos los
valores promediados poseían la misma precisión y Al minimizar la suma de las desviaciones resulta:
por tanto el mismo peso. Si se aplica a cada número
Σ∆yi = 0
su propia desviación estándar, la media se calculará (13.24)
según:
Si se hiciese lo mismo con los valores absolutos de
∆yi no se obtendría un procedimiento matemático
útil. Por consiguiente, es imprescindible buscar un
(13.20)
procedimiento que proporcione los coeficientes a y b
que caracterizan la línea recta, el cual cumpla que la
suma de los cuadrados de las desviaciones:
mientras que la desviación estándar de la media se
expresa como: Σ(∆yi)2 = Σ(yi − a − bxi)2 (13.25)
sea mínima. Las condiciones para el ajuste son:
obteniendo así:
y (13.26)
(13.21)
El peso de cada resultado es inversamente propor-
Los valores de a y b que se obtienen son:
cional al cuadrado de la desviación estándar, 1/σ2,
que recibe el nombre de factor de ponderación.
(13.27a)
Si las desviaciones estándar σi son iguales, la expre-
sión de σ de la media se reduce a la de la Ec.13.10: y
σx2 = 1 / Σ(1/σi)2 = 1 / [N(1/σi)2] = σi2 / N o sea
(13.27b)
σx = σi / N1/2
siendo
13.6 AJUSTE POR MÍNIMOS CUADRADOS
(13.27c)
Por lo general, cualquier medida se relaciona con
otras variables, por ejemplo y = f(x). Esta función
podría tener cualquier forma: lineal, cuadrática,
armónica, etc. El objetivo de este apartado es discu-
tir brevemente algunos métodos que se utilizan para
...