ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

ROLES Y TAREAS DEL PROCESO DE CIENCIA DE DATOS EN EQUIPO


Enviado por   •  7 de Septiembre de 2021  •  Ensayos  •  1.999 Palabras (8 Páginas)  •  178 Visitas

Página 1 de 8

ROLES Y TAREAS DEL PROCESO DE CIENCIA DE DATOS EN EQUIPO

  • [pic 1]

marktab (MarkTab marktab.net) · GitHub

MarkTab marktab.netmarktab

Arquitecto de soluciones en la nube (científico de datos) @marktabnet de Twitter y LinkedIn

Roles y tareas del proceso de ciencia de datos en equipo | Microsoft Docs

El proceso de ciencia de datos en equipo (TDSP) es una plataforma desarrollada por Microsoft que proporciona una metodología estructurada para crear soluciones de análisis predictivo y aplicaciones inteligentes de un modo eficaz. En este artículo se describen los roles clave del personal y sus tareas asociadas para un equipo de ciencia de datos que estandariza este proceso.

Este artículo introductorio contiene vínculos a tutoriales sobre cómo configurar el entorno de TDSP. En los tutoriales se proporcionan instrucciones detalladas para usar Azure DevOps Projects, repositorios de Azure Repos y Azure Boards. El objetivo de la motivación es pasar del concepto al modelado y a la implementación.

Los tutoriales usan Azure DevOps porque así es cómo se implementa TDSP en Microsoft. Azure DevOps facilita la colaboración mediante la integración de la seguridad basada en roles, el seguimiento y la administración de elementos de trabajo, así como el hospedaje de código, el uso compartido y el control de código fuente. En los tutoriales también se utiliza Data Science Virtual Machine (DSVM) de Azure como escritorio de análisis, que tiene varias herramientas de ciencia de datos populares configuradas previamente e integradas con software de Microsoft y servicios de Azure.

Puede usar los tutoriales para implementar TDSP con otras herramientas y entornos de hospedaje de código, planeamiento de Agile y desarrollo, pero es posible que algunas características no estén disponibles.

Estructura de los grupos y equipos de ciencia de datos

Las funciones de ciencia de datos en las empresas a menudo se organizan en la siguiente jerarquía:

  • Grupo de ciencia de datos
  • Equipos de ciencia de datos dentro del grupo

En este tipo de estructura habrá responsables de grupo y de equipo. Normalmente, un proyecto de ciencia de datos lo realiza un equipo de ciencia de datos. Los equipos de ciencia de datos cuentan con responsables de proyecto (para tareas de administración y gobernanza del proyecto) y científicos de datos e ingenieros individuales que ejecutarán las partes de ciencia de datos e ingeniería de datos del proyecto. Los responsables de grupo, equipo o proyecto realizan la configuración y gobernanza del proyecto inicial.

Definición y tareas de los cuatro roles de TDSP

Suponiendo que la unidad de ciencia de datos conste de equipos dentro de un grupo, existen cuatro roles distintos para el personal de TDSP:

  1. Administrador de grupo: administra la unidad de ciencia de datos completa en una empresa. Una unidad de ciencia de datos podría tener varios equipos, cada uno de ellos trabajando en varios proyectos de ciencia de datos en segmentos verticales de negocio distintos. Un Administrador de grupo puede delegar sus tareas en un suplente, pero no cambian las tareas asociadas al rol.
  2. Responsable de equipo: administra un equipo de la unidad de ciencia de datos de una empresa. Un equipo está formada por varios científicos de datos. En una unidad de ciencia de datos reducida, el administrador de grupo y el responsable de equipo podrían ser la misma persona.
  3. Responsable de proyecto: administra las actividades diarias de los científicos de datos en un proyecto de ciencia de datos específico.
  4. Colaboradores individuales del proyecto: científicos de datos, analistas de negocios, ingenieros de datos, arquitectos y otros colaboradores que ejecutan un proyecto de ciencia de datos.

 Nota

En función de la estructura y el tamaño de una empresa, una sola persona puede desempeñar más de un rol o un grupo de personas podría ocupar un solo rol.

Tareas que deben realizar los cuatro roles

En el diagrama siguiente se muestran las tareas de nivel superior para cada rol del proceso de ciencia de datos en equipo. Este esquema y el siguiente, donde las tareas de cada rol de TDSP se describen más detalladamente, pueden ayudarle a elegir el tutorial que necesita en función de sus responsabilidades.

[pic 2]

Tareas del administrador de grupo

Las siguientes tareas las realiza el administrador de grupo (o un administrador del sistema TDSP designado) para adoptar TDSP:

  • Crea una organización de Azure DevOps y un proyecto de grupo dentro de la organización.
  • Crea un repositorio de plantillas de proyecto en el proyecto de grupo de Azure DevOps y lo inicializa desde el repositorio de plantillas de proyecto desarrollado por el equipo TDSP de Microsoft. El repositorio de plantillas de proyecto TDSP de Microsoft proporciona:
  • Una estructura de directorios estandarizada que incluye directorios de datos, código y documentos.
  • Un conjunto de plantillas de documentos estandarizadas como guía para un proceso de ciencia de datos eficaz.
  • Crea un repositorio de utilidades y lo inicializa desde el repositorio de utilidades desarrollado por el equipo de TDSP de Microsoft. El repositorio de utilidades de TDSP de Microsoft proporciona un conjunto de utilidades útiles para que el trabajo de un científico de datos resulte más eficaz. El repositorio de utilidades de Microsoft incluye utilidades para exploración interactiva de datos, análisis e informes y para informes y modelos de base de referencia.
  • Configura la directiva de control de seguridad para la cuenta de la organización.

Para obtener instrucciones detalladas, consulte Tareas del administrador de grupo en un equipo de ciencia de datos.

Tareas del responsable de equipo

Las siguientes tareas las realiza el responsable de equipo (o un administrador del proyecto designado) para adoptar TDSP:

  • Crea un proyecto de equipo en la organización de Azure DevOps del grupo.
  • Crea el repositorio de plantillas de proyecto en el proyecto y lo inicializa desde el repositorio de plantillas de proyecto de grupo configurado por el administrador del grupo o el delegado.
  • Crea el repositorio de utilidades del equipo, lo inicializa desde el repositorio de utilidades del grupo y agrega utilidades específicas del equipo al repositorio.
  • Opcionalmente, crea una instancia de Azure File Storage para almacenar recursos de datos útiles para el equipo. Otros miembros del equipo pueden montar este almacén de archivos compartidos en la nube en sus escritorios de análisis.
  • Opcionalmente, monta la instancia de Azure File Storage en la instancia de DSVM del equipo y le agrega recursos de datos de equipo.
  • Configura el control de seguridad mediante la adición de miembros del equipo y la configuración de sus permisos.

Para obtener instrucciones detalladas, consulte Tareas del responsable de equipo en un equipo de ciencia de datos.

...

Descargar como (para miembros actualizados)  txt (12.2 Kb)   pdf (191.3 Kb)   docx (206.7 Kb)  
Leer 7 páginas más »
Disponible sólo en Clubensayos.com