Recolección de datos - Simulación
Bazzinga711Apuntes2 de Diciembre de 2017
836 Palabras (4 Páginas)414 Visitas
La recolección y análisis de Datos de entrada es considerada la fase más difícil del proyecto de simulación.
Los Datos pueden Ser recogidos de los registros históricos o en tiempo real. Para la recopilación de datos de entrada se pueden utilizar una amplia selección de dispositivos electrónicos para facilitar el trabajo. También es muy importante tener claro la medición del tiempo de los procesos y las unidades de medida a utilizar, ya que teniendo las herramientas adecuadas (cronómetro minuto decimal) es posible recopilar los datos en un formato inmediatamente utilizable. Son tácticas que favorecen al desarrollo de la recolección.
Es importante tener en consideración evitar cualquier sesgo en los datos para que no se produzcan resultados inexactos en el modelo. Por lo que se debe involucrar a los trabajadores explicándoles claramente los propósitos de la recolección de datos de manera que realicen su trabajo de forma cotidiana.
Otro factor que afecta en esta fase es que existen datos determinísticos que significan que los datos se producen de la misma manera, cada vez de forma predecible. Mientras que los datos probabilísticos no ocurren con ese mismo tipo de regularidad.
Además, también están los datos discretos y continuos, datos que toman sólo algunos valores (normalmente números enteros) y datos que pueden tomar cualquier valor dentro de un rango (números faccionarios), respectivamente.
El cómo utilizar los datos observados en un modelo de simulación, debe estar relacionado con alguna distribución de probabilidad teórica. Existe un gran número de distribuciones teóricas, las más comunes:
- Bernoulli; se utiliza para modelar una ocurrencia aleatoria con uno de dos resultados posibles. Se refieren con frecuencia como éxito o fracaso.
- Uniforme; que en el rango de valores posibles, cada valor individual es también probable que se observen. El ejemplo común de una distribución uniforme es el comportamiento de un único dado de seis lados
- Poisson; distribución de probabilidad discreta que expresa la probabilidad de un número dado de acontecimientos que ocurren en un intervalo fijo de tiempo y/o espacio si estos eventos ocurren con una tasa media conocida e independientemente del tiempo transcurrido desde el último evento.
- exponencial,
- Triangular; puede utilizarse en situaciones en que no se tiene un conocimiento completo del sistema pero se sospecha que los datos no están distribuidos uniformemente.
- Normal; es una distribución de probabilidad continua muy común. Las distribuciones normales son importantes en las estadísticas y se utilizan a menudo en las ciencias naturales y sociales para representar las variables aleatorias real-valoradas cuyas distribuciones no se saben. Es útil debido al teorema del límite central. En su forma más general, indica que los promedios de las muestras de observaciones de variables aleatorias extraídas independientemente de distribuciones independientes convergen en la distribución a la normal, es decir, se hacen normalmente distribuidas cuando el número de observaciones es suficientemente grande.
Las distribuciones menos comunes de son la Weibull, Gamma, Beta y Geométrica.
Luego con el fin de determinar la mejor distribución teórica para los datos observados, se utilizan los siguientes métodos de comparación:
- Enfoque grafico; consiste en una comparación cualitativa visual entre la distribución real de los datos y una distribución teórica desde los datos observados, a través de histogramas para finalmente tomar una decisión en cuanto a la similitud de estos conjuntos de datos.
- Chi-cuadrado; se utiliza para la bondad de ajuste de una distribución observada a una distribución teórica, la independencia de dos criterios de clasificación de datos cualitativos y en la estimación de intervalo de confianza para una desviación estándar de población de a distribución normal a partir de una desviación estándar de la muestra.
- Declaración de hipótesis nula e hipótesis alternativa
- Determinar nivel de confianza
- Determinar valor critico
- Comparar la estadística de prueba con el valor crítico
- Aceptar o rechazar la hipótesis nula. Si el resultado es menor que el valor critico la hipótesis no puede ser rechazada, pero al contrario se rechaza.
- Debe existir una cantidad suficiente de datos para aplicar la prueba.
- Kolmogorov-Smirnov; La prueba KS debe utilizarse únicamente cuando el número de puntos de datos es extremadamente limitado y la prueba de chi-cuadrado no puede aplicarse correctamente. Es una comparación entre la distribución teórica total de y la distribución acumulada observada. Si la diferencia absoluta máxima es menor que el valor crítico KS, entonces hipótesis nula no se rechaza. A la inversa, si se rechaza.
- Error cuadrático; es un medio de evaluar la idoneidad relativa de diferentes distribuciones teóricas para representar la distribución observada. Por lo tanto, la mejor distribución teórica se considera la cual tenga la menor suma de errores cuadráticos.
Para finalizar es importante mencionar la importancia de considerar cuántos datos es necesario recoger para estimar un modelo que entregue simulaciones correctas dependiendo del contexto. Además que se observen los datos correctos sin estar sesgados de ninguna manera, priorizando los datos representativos. En los casos que se vuelva matemáticamente difícil ajustar los datos observados, existen implementaciones de software como ARENA, o Expert FIT que facilitan el trabajo.
...