DATOS EXPERIMENTALES
Josue11014 de Junio de 2015
4.411 Palabras (18 Páginas)1.165 Visitas
Análisis de datos Experimentales por Mínimos Cuadrados
AJUSTE DE CURVAS
Uno de los objetivos en el análisis de resultados es el llegar a establecer una relación cuantitativa entre dos o más variables y mediante esta relación poder efectuar predicciones. Por lo general la relación consiste en una ecuación que expresa cómo la variable dependiente (cuyo valor se desea predecir) es afectada por una o más variables independientes.
En esta unidad se ilustra la forma de establecer la posible relación de una variable dependiente con otra variable considerada independiente. El primer paso es disponer de una colección de datos obtenidos experimentalmente. Si se simbolizan por X y Y las variables independiente y dependiente respectivamente, y sus valores particulares por X1, Y1, X2, Y2, etc., en una tabla se dispondrían así:
X X1 X2 X3 . . . . . . . . . XN
Y Y1 Y2 Y3 . . . . . . . . . YN
El siguiente paso es representar los puntos (X1, Y1 ), (X2, Y2) . . . . , (XN, YN) en un sistema de coordenadas rectangulares. El sistema de puntos resultantes se llama diagrama de dispersión.
Con el diagrama de dispersión es posible representar una curva que se aproxime a los datos, es decir, que siga la tendencia de los mismos. Tal curva se llama curva de aproximación.
En la figura 5.1 a) , por ejemplo, se ve que los datos experimentales se aproximan bien a una línea recta y se dice que entre las variables existe una relación lineal. En b), existe una relación no lineal.
Las curvas mostradas en la Fig.5.1 se denominan curvas de aproximación y describen la tendencia de los puntos en el diagrama de dispersión. El problema general de hallar la ecuación de la curva de aproximación que se ajuste mejor al conjunto de datos con los que se obtuvo el diagrama de dispersión se denomina determinación dela CURVA DEAJUSTE.
Una curva de aproximación como la de la Fig.5.1 (a) sugiere una ecuación lineal; (ecuación de la recta) Y = a + bX; mientras que la de la curva en la Fig.5.1 (b) sugiere una ecuación cuadrática (parabólica) de la forma Y = a + bX + cX2.
La dispersión de los puntos se debe a los errores que afectan en el proceso de medición tanto a la variable dependiente como a la independiente. En ocasiones puede despreciarse el error en la variable independiente al compararse con el error (o variación aleatoria) de la variable dependiente. Esto dependerá de la situación particular de las causas de error sobre cada variable al realizar el experimento.
ANÁLISIS DE REGRESIÓN
Uno de los propósitos principales de la curva de ajuste es estimar una de las variables a partir de la otra. El proceso de estimación se conoce como regresión. Si Y se va a estimar a partir de X por medio de alguna ecuación la llamamos ecuación de regresión de Y sobre X y a la curva correspondiente curva de regresión de Y sobre X.
A continuación se presentan algunos ejemplos de relaciones denominadas funciones o ecuaciones de predicción:
Yc = a + bX (Línea Recta)
Yc = a + bX + cX2 (Ecuación de segundo grado o cuadrática)
Yc = KXn o Yc = aXb (Ecuación potencial)
Yc = A DX o Yc = a bX (Ecuación exponencial)
En estos ejemplos, Yc representa el valor estimado de la variable dependiente a partir del valor X, de la variable independiente.
Existen varios métodos para determinar la ecuación de regresión. El “método de mínimos cuadrados” , que se describe más adelante, se considera el mejor; por fundamentarse en el tratamiento estadístico de los datos experimentales.
Como se mencionó anteriormente, los errores afectan tanto a la variable independiente como a la variable dependiente, sin embargo en muy diversos casos la variable independiente puede considerarse sin error (o de error despreciable) y considerar que la dispersión es debido únicamente a los errores en la variable dependiente. En este caso se considera que para un valor puntual de X (sin error) el valor experimental de Y se aparta del valor que predice la curva de regresión.
MÉTODO DE MÍNIMOS CUADRADOS
Generalmente, más de una curva de un tipo dado parece ajustarse a un conjunto de datos. Para evitar el juicio individual en la construcción de rectas, parábolas u otras curvas de aproximación, es necesario obtener una definición de la “mejor curva de ajuste”, mejor parábola de ajuste,” etc
Considérese la Fig.5.2 en la cual los puntos de un conjunto de datos (hipotéticamente experimentales) se expresan por (X1 , Y1), (X2, Y2) . . . . . (Xn, Yn)
Fig. 5.2 Diferencias entre los valores de la variable dependiente Y
y los de la curva de aproximación C.
Para un valor dado de x, por ejemplo X1 habrá una diferencia entre el valor de Y1 y el valor correspondiente de la curva C.
Esta diferencia se denota por D1 y se conoce como desviación, error, o residuo y puede ser positivo, negativo o cero. Análogamente, correspondiendo a los valores X2 , X3 . . . , XN obtenemos las desviaciones D2 , D3 , . . . , DN .
Una medida de la “bondad de ajuste” de la curva C al conjunto de datos la suministra la cantidad D12 + D22 + ….. + DN2. Si la suma es pequeña el ajuste es bueno, si es grande, el ajuste es malo.
Definición:
De todas las curvas de aproximación correspondientes a un conjunto de puntos dados, la curva que tenga la propiedad de que D12 + D22 + ….. + DN2 es mínimo, se conoce como la mejor curva de ajuste.
Una curva con esta propiedad se dice que ajusta los datos por mínimos cuadrados y se llama “Curva de regresión de mínimos cuadrados” o simplemente “Curva de mínimos cuadrados”.
Una recta con esta propiedad se llama recta de mínimos cuadrados, una parábola con esta propiedad se llama parábola de mínimos cuadrados, etc.
REGRESIÓN LINEAL.
Con el siguiente ejemplo se ilustra cómo puede tratarse un caso de regresión lineal. En la tabla siguiente se dan los resultados de 12 mediciones, las X son las cargas en miles de libras y las Y son las deflexiones correspondientes en milésimas de pulgada, en la calibración de un anillo tensor:
X
CARGA
1
2
3
4
5
6
7
8
9
10
11
12
Y
DEFLEXIÓN
16
35
45
64
86
96
106
124
134
156
164
182
Primero se construye el diagrama de dispersión; a partir de aquí, y según la tendencia de los puntos, se traza la curva de aproximación, que resulta en la forma que se ilustra en la Fig.5.3 (línea no continua – - -).
Fig. 5.3 Gráfico de Deflexión versus carga
Es razonable suponer que la relación (curva de regresión) es lineal.
Se aplicará el método de mínimos cuadrados para determinar la ecuación de regresión. Para una relación lineal en general Yc = a + bX ; Yc representa el valor teórico de Yi ó el valor estimado de Y que corresponde a un valor particular de X.
El criterio de mínimos cuadrados requiere la determinación de los valores de “a” y “b” tal que Z = Σ(Yi – Yc)2 sea un mínimo (es decir, que tienda a cero). En la ecuación de la relación lineal “a” y “b” se denominan coeficientes de regresión: “a” es la intercepción con el eje de las ordenadas Y y “b” es la pendiente de la línea que mejor se ajusta.
Como se busca la recta que mejor se ajuste a los puntos experimentales, el intercepto “a” y la pendiente “b” adquieren el carácter de variables; ya que estos parámetros son los que diferencian a una recta de otra.
Sea Z = Σ(Yi – Yc)2 y sustituyendo Yc = a + bX, Z = Σ(Yi – a – bX)2 , que debe ser un mínimo de acuerdo a la definición de mejor curva de ajuste (en este caso, mejor recta de ajuste).
Utilizando el cálculo diferencial con derivadas parciales actuando sobre sumatorias, se llega a establecer un sistema de dos ecuaciones, denominadas ecuaciones normales para la regresión lineal o ecuaciones normales para la recta de mínimos cuadrados.
Las ecuaciones son :
Donde n es el número de pares ordenados (X, Y) o número de puntos o número de observaciones, a y b son incógnitas que representan, como ya se mencionó, respectivamente, el intercepto y la pendiente de la recta de mínimos cuadrados.
Para resolver estas ecuaciones se requiere obtener ΣX, ΣY, ΣXY y ΣX2. Para el ejemplo del anillo tensor se tiene:
Xi Yi XY X2
1 16 16 1
2 35 70 4
3 45 135 9
4 64 256 16
5 86 430 25
6 96 576 36
7 106 742 49
8 124 992 64
9 134 1206 81
10 156 1560 100
11 164 1804 121
12 182 2184 144
Σ = 78 1208
...