ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Datos Anómalos u Outliers


Enviado por   •  10 de Noviembre de 2020  •  Apuntes  •  2.070 Palabras (9 Páginas)  •  97 Visitas

Página 1 de 9

Página | [pic 1]

[pic 2][pic 3]


[pic 4][pic 5]

Contenido

Índice

1.- Resumen del vídeo de esta semana        2

2.- ¿Qué es un dato anómalo?        4

3.- Encuentra un ejemplo real de algoritmos que consideres con datos anómalos en cuanto a seguridad.        5

4.- Describir con tus palabras a qué se debe ese error.        6

5.- ¿Cómo lo solucionarías?        6

6.- Referencias.        6

Índice de Imágenes

Ilustración 1 Algoritmo de Google        2

Ilustración 2 Daño en la Capa de Ozono        3

Ilustración 3 La presa de Vajont        3

Ilustración 4 Ejemplo de Outlier        4

Ilustración 5 Explosión del Ariane 5        5

Ilustración 6 Evolución de los Rockets Ariane        6

1.- Resumen del vídeo de esta semana

Al comienzo de la clase pregrabada se retomó el tema de la tarea pasada, sobre los fallos de los algoritmos aplicados en la tecnología. De los ejemplos mencionados se destacaron 3, un automóvil autónomo que atropelló a una persona, caramas de vigilancia con fallos en el reconocimiento facial a causa de los cubre-bocas y el robot suicida del centro comercial.

Del mismo modo se habló sobre el algoritmo de Google, el como cuando tu introduces en el buscador las palabras, el buscador te arrojara resultados en relación a las palabras que tu utilices.[pic 6]

[pic 7]

Este tipo de errores o fallos en el algoritmo son denominados valores extremos u Outliers ya que son datos que se comportan distinto al resto a diferente a las otras variables , se deben de saber tratar y del mismo modo, la maquina tiene que saber identificarlos, de no identificarlos, ocurre los errores de los tres ejemplos de fallos anteriores, otro ejemplo que menciono el profesor fue el partido de fútbol, donde las cámaras la ya ser inteligentes, siguen la forma del balón, sim embargo ocurrió un fallo pues la cámara en lugar de detectar al balón, solo se enfocó en el árbitro, dejando de lado la percepción del propio partido, eso es considerado un dato anómalo, o un fallo en el algoritmo.

Posteriormente se planteó la duda sobre el donde provienen estos errores, generalmente provienen de la fuente, para una mejor comprensión se mencionó un ejemplo de una clase de secundaria, donde en un grupo de niños, la altura media es de 1.40m, pero hay un chico que mide 2.10m, esto a que el muchacho sufre de acromegalia, en consecuencia la media establecida ya no sería real, porque ese dato altera los resultados. Otro tipo de errores son los medios, esto es cuando se emplea una técnica poco favorables para valorar las variables sobre una población, otro ejemplo es un vendedor que no vende, es una máquina que vende poco, pero eso ya es considerado como una regresión, es un dato anómalo que afecta mucho. Otro error es el error del experimentador, cuando el programador no delimita correctamente la población, dando como resultado una población distinta, y otro error es el error de valoración que se origina la llevar a cabo una errónea valoración de los elementos y no se da una buena  interpretación de los resultados, es este caso se planteó el ejemplo de medir el peso de una población y en lugar de usar una balanza analítica, que son más precisas, se ocupa de balanza de peso, como las del imss, dicha balanza dará datos muy variables mientras que la analítica te dará el peso y los gramos reales que tu pesas, eso sería un error de realización.

Los Outliers son observaciones erróneas que tienen un comportamiento muy diferentes a los demás, de tal manera que se deben considerar por absurdo que suene esto, entre los ejemplos que se mencionan este el del agujero en la capa de ozono sobre la Antártida, donde tres investigadores, se desconcertaron por unos datos del examen antártico británico donde se mencionada que los niveles antárticos habían caído 10% debajo de los niveles que habían tenido en enero, aquí el problema es que el satélite nimbo 7 nunca había registrado niveles tan bajos, revisando la data del satélite notaron que de hecho si registraba estos datos y que lo había hecho desde siempre, pero como eran tan bajas, el algoritmo de la computadora los identificaba como Outliers y los desechaba de los resultados, de este modo, el daño en la capa de ozono que era causada por lo clorurocarburos paso desapercibido por nueve años, sin que se le diera una solución ya que dichos datos se iban desechando, como moraleja se queda que los outliers no deben ser desechados sin antes revisarlos, ya que pueden ser datos de mucha importancia.[pic 8]

[pic 9]

Otro ejemplo es el titanic de las presas, que fue construida por arquitectos, uno de ellos que sabía técnicas de estadística avanzada descubrió que la presa no iba a hacer lo suficientemente resistente y que iba a terminar por quebrarse, los demás arquitectos negaron todo eso y le dijeron que eran datos falsos, por ende los arquitectos lo terminaron despidiendo, la presa se terminó quebrando en la noche y destruyo el pueblito de Longarone matando 1900 muertos, cuando se revisó los planos de la presa y se dieron cuenta que la parte que no aguanto fue la ladera y el hormigón se vino abajo, del mismo modo, cuando se construyó la presa ocurrió un deslizamiento  que del mismo modo no fue reportado. [pic 10]

[pic 11]

Otro ejemplo es el de las App empleadas en la agricultura, danto informes sobre las necesidades de las plantas, como agua, humedad, temperatura y luz, algunas sobre fertilizantes, el problema aquí fue que la App se quedó a cargo de 30 hectáreas, pero su programación no era personalizada, si no que el cuidado era general. Se menciona otro ejemplo de como la publicidad de una tienda predijo a una adolecente que estaba embarazada, otro donde unos viejitos se quedaron sin seguro médico por que no se renovó el mismo, otro ejemplo sobre un algoritmo que estudiaba las intimidades de sus clientes a través de un software, el problema fue que les avisaban lo que estaban haciendo y terminaron quejándose, otro ejemplo donde toda una clase entera reprobó, otro donde un maestro utilizo un software-anti plagio en una clase donde todos los chicos eran de 10  , descubriendo que toda la clase había copiado, pasando a ser alumnos de 10 a ser alumnos reprobados , la forma de trabajar del software era el analices de 3 o más palabras que se repitieran en los documentos, el programa los marcaba en automático como copias, en sus expedientes se les marcaba como tramposos, pero los padres apelaron para que les retiraran eso del expediente pero no les quitaron la calificación reprobatoria del trabajo, sin contar que el colegio no les dará su recomendación para las universidades. Estos ejemplos son con el fin de identificar los datos anómalos para que así se pueda modificar el algoritmo que previamente fue introducido por el programador, retomando de nuevo la moraleja del ejemplo de la capa de ozono, no se deben desechar los datos anómalos ya que esos datos nos pueden ser bastante útiles y siempre deben ser tomados en cuenta.  

...

Descargar como (para miembros actualizados)  txt (12.2 Kb)   pdf (500.4 Kb)   docx (358.3 Kb)  
Leer 8 páginas más »
Disponible sólo en Clubensayos.com