Ingeniero de fiabilidad del sitio

Icono
Icono del constructor
Icono
Icono del portapapeles
Icono
Icono del rompecabezas
Funciones relacionadas: Ingeniero SRE, Ingeniero DevOps (SRE), Ingeniero de Fiabilidad de Sistemas, Ingeniero de Operaciones (SRE), Ingeniero de Infraestructuras (SRE), Ingeniero de Operaciones de Sitio, Ingeniero de Producción (SRE), Ingeniero de Plataformas (SRE), Ingeniero de Disponibilidad de Sitio, Ingeniero de Fiabilidad.

Focos de atención

Títulos similares

Ingeniero SRE, Ingeniero DevOps (SRE), Ingeniero de Fiabilidad de Sistemas, Ingeniero de Operaciones (SRE), Ingeniero de Infraestructura (SRE), Ingeniero de Operaciones de Sitio, Ingeniero de Producción (SRE), Ingeniero de Plataforma (SRE), Ingeniero de Disponibilidad de Sitio, Ingeniero de Fiabilidad

Descripción del trabajo

Antes de que naciera DevOps, Google tenía un problema y no sabía cómo solucionarlo. La empresa tenía grandes sitios web, pero necesitaba mejorarlos y escalarlos aún más. ¿Su solución? Google contrató a un equipo de ingenieros de software para que lo resolvieran y de sus esfuerzos surgieron los cimientos de la Ingeniería de Fiabilidad del Sitio (SRE). En la actualidad, el gigante del software define la SRE como "lo que se consigue cuando se tratan las operaciones como si fueran un problema de software".

Las prácticas de SRE fueron tan beneficiosas que fueron adoptadas por otras grandes empresas y, con el tiempo, mejoradas y añadidas, dando lugar a un campo profesional que comparte muchos de los rasgos de las DevOps actuales, pero con algunas distinciones importantes. Aunque ambos existen en medio del desarrollo y las operaciones, SRE se centra más en la automatización. De hecho, Google describió una vez el propósito del ingeniero como "automatizar su camino fuera del trabajo".

Diferentes organizaciones hacen SRE de manera diferente y pueden llamarlo Ingeniería de Producción o Ingeniería de Infraestructura en su lugar. Sea cual sea su denominación, al final del día el trabajo de un ingeniero consiste en ser un jugador de equipo que trabaja continuamente para mejorar la fiabilidad del sitio web, utilizar los KPI (Indicadores Clave de Rendimiento) de gestión de incidentes, escribir código, crear servicios y automatizar los procesos manuales. Dado que los sitios web permanecen activos las 24 horas del día, los SRE suelen trabajar de guardia para responder siempre que se les necesite. 

Aspectos gratificantes de la carrera
  • Trabajar con una visión global de los proyectos
  • Servir de puente vital entre los equipos 
  • Mejorar los procesos y ayudar a aumentar los beneficios de la organización
  • Una generosa compensación económica
$117,295
La primicia
Responsabilidades del trabajo

Horario de trabajo

La SRE es una carrera bien remunerada, así que espere ganar esos salarios trabajando a tiempo completo. Como explica ParkMyCloud, la fiabilidad del sitio equivale esencialmente a la disponibilidad del negocio. En otras palabras, depende de los Ingenieros de Fiabilidad del Sitio minimizar el costoso tiempo de inactividad. Esto puede traducirse en trabajar fuera de horario o estar de guardia para responder rápidamente a los problemas. 


Tareas típicas

  • Crear o mejorar los programas informáticos relacionados con las operaciones y el apoyo
  • Optimización y automatización de procesos
  • Garantizar las prácticas de coherencia de la ingeniería de lanzamiento
  • Cómo abordar y minimizar la escalada de la asistencia técnica 
  • Capturar y documentar la información recién aprendida para su posterior consulta, por ejemplo, mediante la creación de cuadernos de ejecución. Evitar el "silo" o el acaparamiento de conocimientos compartibles.
  • Solución de problemas
  • Realización de revisiones de incidentes (también conocidas como postmortems, retrospectivas o análisis de la causa raíz) para determinar por qué se produjo un problema sin culpar a nadie 

Responsabilidades adicionales

  • Trabajar de guardia para la resolución de problemas y otras cuestiones de respuesta a incidentes
  • Garantizar el cumplimiento de los protocolos de la organización 
  • Creación de listas de elementos de acción para abordar los problemas y mitigar futuros problemas similares dentro del ciclo de vida del desarrollo de software
Habilidades necesarias en el trabajo

Habilidades blandas
 

  • Capacidad para facilitar la colaboración entre equipos
  • Resolución analítica de problemas
  • Atención al detalle
  • Servicio de atención al cliente 
  • Empatía
  • Flexibilidad
  • Centrado en los objetivos
  • Muy organizado; buena capacidad de gestión del tiempo
  • Investigativo e inquisitivo
  • Habilidades de liderazgo y gestión
  • Objetividad
  • Orientado al proceso
  • Mentalidad de garantía de calidad
  • Gran capacidad de comunicación

Habilidades técnicas

Los SREs deben tener varios conjuntos de habilidades relacionadas con lo siguiente:

  • Construir herramientas de automatización
  • Construir lenguajes de configuración
  • Compiladores
  • Bases de datos
  • Diseño de sistemas distribuidos
  • Conocimientos de dominio relacionados con la administración de sistemas, el desarrollo, la gestión de la configuración y las pruebas de integración
  • Gestión general del código fuente
  • Instaladores
  • Conexión a la red
  • Sistemas operativos
  • Gestores de paquetes
  • Seguridad
  • Ingeniería de software
Diferentes tipos de organizaciones
  • Agencias de diseño de sistemas informáticos
  • Sociedades/empresas
  • Agencias gubernamentales/militares
  • Sanidad 
  • Centros de enseñanza superior
  • Medios de comunicación y entretenimiento
Expectativas y sacrificios

Si una organización tiene uno o varios sitios tan importantes que necesitan un Ingeniero de Fiabilidad del Sitio, entonces las expectativas van a ser altas. Según Netguru, las cuatro razones principales para contratar a un SRE son minimizar el tiempo de inactividad, anticipar y mitigar los riesgos, lograr un desarrollo más rápido y ahorrar dinero a través de esos y otros procesos implementados. Está claro que los Ingenieros de Fiabilidad del Sitio tienen las manos llenas, y mientras intentan hacer malabarismos con la carga de trabajo, también deben adelantarse a los cambios en el mundo de las TI.

Las horas pueden ser largas cuando se producen problemas, por no hablar de las rotaciones en todos los puestos... lo que significa que incluso cuando estás fuera, sigues estando técnicamente dentro. Los tiempos de respuesta a los incidentes pueden ser cortos, y cada empleador es diferente cuando se trata de compensar el trabajo realizado fuera de horario. Algunos pueden conceder tiempo libre remunerado, otros pueden dar una paga extra y otros pueden ofrecer un sincero "muchas gracias" y nada más. 

Tendencias actuales

La SRE es todavía un concepto relativamente nuevo para muchas organizaciones en crecimiento. Por ello, una de las tendencias es que las empresas todavía están tratando de averiguar cómo gestionarla mejor. Un factor importante que impulsa el impulso de la Ingeniería de Fiabilidad del Sitio es la resolución de incidentes, lo que sugiere la noción de que las empresas simplemente se están cansando de apagar incendios y quieren manejarlos mejor.

Por supuesto, esto alivia el estrés de la dirección al poner el estrés en su lugar en los SREs. Esto, a su vez, puede requerir que los empleadores encuentren formas de mantener a esos trabajadores estresados sanos y saludables, para que la fuerza de trabajo pueda operar con la máxima eficiencia. Algunas empresas lo hacen mejor que otras, pero la tendencia es reconocer el valor de cuidar a los trabajadores ocupados que se ocupan de los negocios.

¿Qué tipo de cosas disfrutaba la gente de esta carrera cuando era joven...

El nombre "Site Reliability Engineer" nos da algunas pistas sobre el tipo de personas que trabajan en este campo. Les gusta trabajar en sitios web, un interés que la mayoría de los SREs desarrollaron en su juventud. Son responsables de garantizar que los sitios sean "fiables", es decir, que todo funcione como debe cuando debe. Por lo tanto, los propios trabajadores deben ser fiables, que es otra característica que se suele perfeccionar en los primeros años.

A estas personas les gusta ser puntuales y estar preparadas, y es probable que tengan buenos resultados académicos. De hecho, ser ingeniero de cualquier tipo suele requerir fuertes aptitudes académicas, sobre todo en matemáticas y ciencias, por supuesto. Sin embargo, una de las cosas interesantes de este campo es la cantidad de habilidades blandas que entran en juego.

Un SRE tiene que ser una persona con don de gentes, alguien que se sienta cómodo trabajando con equipos y que sea capaz de fomentar la colaboración entre esos equipos. En consecuencia, es posible que hayan ocupado puestos de liderazgo en la escuela, o tal vez simplemente hayan tenido que lidiar con un montón de hermanos. Los SRE son expertos en eficiencia, formados para encontrar formas de mejorar las cosas estudiando los problemas y determinando soluciones basadas en su investigación. Esto requiere una mentalidad creativa y a la vez analítica, como si ambos hemisferios del cerebro trabajaran en tándem. Es posible que muchos EREs sean ambidiestros o expertos en tocar instrumentos musicales. 

Educación y formación necesarias
  • Los Ingenieros de Fiabilidad del Sitio necesitan una licenciatura, preferiblemente en Informática o un área relacionada
  • No hay un camino establecido para convertirse en un SRE. Algunos trabajadores entran a través de unas prácticas; otros pueden hacer un bootcamp, y luego desarrollar sus habilidades mientras realizan otros trabajos de TI mientras practican otras habilidades por su cuenta
    • Una amplia experiencia laboral es un requisito clave de la mayoría de los empleadores (muchos empleados de SRE trabajan primero en DevOps, sysadmin, o como desarrolladores o ingenieros de software)
  • Clases para familiarizarse con Java, Python, Ruby o C++, así como con Linux, Kubernetes y MySQL.
  • Cursos para desarrollar habilidades blandas en inglés, escritura, oratoria, trabajo en equipo y liderazgo
  • Las certificaciones opcionales incluyen:
    • Certificación de Ingeniero de Fiabilidad de la Sociedad Americana de la Calidad
    • Certificación SRE Foundation del Instituto DevOps 
    • Certificación Linux+ de CompTIA
  • Aprende por tu cuenta haciendo cursos sobre:
    • edX - Introducción a DevOps y a la ingeniería de fiabilidad del sitio
    • Lynda (de LinkedIn) - Fundamentos de DevOps: Site Reliability Engineering
    • Udemy - Introducción a la ingeniería de la fiabilidad
    • Coursera - Ingeniería de Fiabilidad del Sitio: Medición y gestión de la fiabilidad
      • Nota, el mismo curso también se ofrece en Pluralsight
Cosas que hay que buscar en un programa
  • Gran parte de lo que necesitarás saber para ser un exitoso ingeniero de fiabilidad del sitio lo aprenderás fuera de tu programa universitario.
  • Lo ideal es buscar programas que ofrezcan cursos en las áreas mencionadas anteriormente
  • Lea las biografías de los profesores para ver cuáles son sus áreas de especialización y antecedentes
  • ¿Qué tipos de clubes y organizaciones estudiantiles existen? Muchas de las habilidades técnicas y sociales se aprenden de manera más efectiva a través de una amplia interacción con los compañeros.
  • Asegurarse de que la escuela está acreditada
  • Busca programas que publiquen las estadísticas de empleo tras la graduación y que tengan un historial sólido
  • Valora los pros y los contras de matricularte en un programa online. La participación en el campus es muy beneficiosa para desarrollar habilidades blandas, por lo que a veces un programa híbrido es beneficioso
Lista de programas

Los mejores programas de ciencias de la computación de U.S. News & World Report pueden ayudarte a empezar, pero no confíes solo en una clasificación. No querrás perderte buenas oportunidades, por lo que te recomendamos que tengas en cuenta listas como la de las 50 mejores universidades asequibles para Ciencias de la Computación e Ingeniería de Great Value College para 2020 o la de los 25 mejores programas de Ciencias de la Computación con el mejor retorno de la inversión de Best Value School.

La universidad puede resultar escandalosamente cara, pero ten en cuenta que muchos empleadores son muy prácticos. Pueden estar más interesados en tus habilidades técnicas duras que en la escuela en la que te has graduado. En otras palabras, el simple hecho de tener un título de una costosa universidad privada no va a garantizar un empleo en esta línea de trabajo. Céntrate en tomar las clases específicas necesarias para desarrollar tus habilidades y obtén toda la experiencia práctica posible. 

Cosas que hacer en el instituto y la universidad
  • Como ya se ha dicho, no hay un único camino para convertirse en un SRE, así que trace algunas opciones
  • Mira las ofertas de empleo de las empresas en las que te gustaría trabajar. Presta atención a la experiencia laboral y académica requerida, y luego haz una ingeniería inversa de la trayectoria profesional para llegar a ella
  • En la escuela secundaria, construye una base sólida cursando tantas asignaturas optativas de informática como sea posible
  • Practica todo lo que puedas. Realice cursos relacionados con los puntos de nuestra Educación y Formación anteriores
  • No te olvides de trabajar en tu redacción. La redacción técnica es importante, pero también tendrás que traducir temas complejos a términos sencillos.
  • Los SREs necesitan buenas habilidades de trabajo en equipo y de liderazgo. Estos son rasgos que a menudo se descuidan y que se espera que tengan más adelante, así que busque maneras de desarrollarlos desde el principio.
  • No hay nada mejor que tener un mentor con experiencia, así que pide consejo a los antiguos alumnos o al profesorado 
  • Enseñar a otros. La enseñanza facilita nuevas experiencias de aprendizaje para ambas partes
  • Leer y participar en debates en Quora, Reddit, Dev.to y otros sitios
  • Cuando tus habilidades sean lo suficientemente buenas, consigue algo de experiencia pagada en Upwork
  • Encuentra prácticas en Indeed, o pregunta a tu programa universitario si tienen oportunidades
  • Sea un líder en los clubes relacionados con las tecnologías de la información y cree una amplia red de colegas y asociados.
Hoja de ruta típica
Fiabilidad del sitio Hoja de ruta de Gladeo
Cómo conseguir tu primer trabajo
  • ¡Corra la voz! La mayoría de los puestos de trabajo se encuentran ahora a través de la red de contactos
  • Realiza el test de selección de TripleByte DevOps. Si lo superas, obtendrás una entrevista con los empleadores de su red.
  • Busca ofertas de empleo en Indeed, Monster, USAJobs, ZipRecruiter, LinkedIn y Glassdoor
  • Descubra lo que buscan los empleadores Usenix tiene un pdf descargable con una lista de consejos sobre la contratación de SREs
  • Algunos empleadores forman a sus SREs internamente, por lo que es posible que quieras empezar en un puesto de trabajo pero con un plan para ascender dentro de la empresa
  • Consigue unas prácticas. No siempre están bien pagadas, pero te servirán para poner el pie en la puerta y pueden conducir a trabajos a tiempo completo.
  • El jurado no está seguro de la utilidad de las ferias de empleo, pero las ferias específicas del sector pueden darle a conocer las oportunidades existentes y ofrecerle la oportunidad de charlar con los trabajadores.
  • Ten tu currículum en orden. Job Hero tiene algunas plantillas de curriculum vitae de Ingeniero de Fiabilidad del Sitio para robar ideas
  • Contrata a un redactor (o editor) profesional de currículos para que mejore tu documento y lo haga lo mejor posible. Pero recuerda, adapta cada currículum al puesto de trabajo específico al que te presentas
  • Estudia la enorme base de datos de recursos y preguntas para entrevistas de GitHub.
Cómo subir la escalera
  • Depende mucho del tamaño de la organización. Algunas empresas promocionan desde dentro; otras pueden querer candidatos externos. Las oportunidades de promoción deben discutirse con tu supervisor desde el principio.
  • Sé proactivo. Fórmate, haz cursos, sigue aprendiendo. Cuando haya una nueva tendencia tecnológica, averigua todo lo que puedas sobre ella y conviértete en un experto en la materia.
  • Demuestre lealtad a su empresa y conviértase en un activo de confianza e inestimable que merezca una mayor responsabilidad. Compórtate de manera que indiques que estás preparado para avanzar
  • Recuerda siempre las habilidades blandas. Incluso el empleado más capacitado técnicamente tendrá dificultades para ascender si no se lleva bien con los demás
  • Sé un jefe. Demuestre su competencia y su potencial de liderazgo. Un SRE debe ser capaz de dirigir a los demás de forma colaborativa pero decisiva (y cuando sea necesario, firme)
  • Demuestra que eres fiable. Sé puntual y, si estás de guardia, responde al incidente rápidamente, realiza el trabajo con diligencia y busca formas de mitigar futuros problemas similares 
Recursos recomendados

Páginas web

  • Bash-Scripting avanzado 
  • Impresionante Python 
  • Guía de programación en red de Beej 
  • Desafío de mando 
  • Ases cibernéticos 
  • Curso intensivo de DevOps 
  • DevOpsDays
  • Eli el Informático 
  • Git
  • Inmersión en Git 
  • Introducción a SQL: Consulta y gestión de datos
  • Katacoda
  • Ingeniería de sistemas operativos del MIT
  • Universidad MongoDB 
  • Escuela de Operaciones
  • Por encima del cable 
  • Aprendizaje con marionetas 
  • SQLZOO 
  • SREcon 
  • SRE Weekly
  • Sysadmin Casts 
  • El gran blog de materiales de formación en seguridad de la información
  • Las Cosas de los Frikis
  • El libro de Google SRE
  • La guía abierta de Amazon Web Services 
  • El manual de diseño de sistemas 
  • El banco de trabajo Unix 
  • Caja de herramientas Unix 

Libros

Plan B

La ingeniería de fiabilidad del sitio puede ser un campo profesional apasionante con una gran responsabilidad. Sin embargo, el camino para abrirse paso no siempre es fácil. Muchas personas empiezan en otras áreas y a veces acaban quedándose en ellas. Algunas opciones de trabajo del "Plan B" son::

  • Desarrollador de Back-End
  • Director de sistemas informáticos y de información
  • Programador informático
  • Especialista en soporte informático
  • Analista de sistemas informáticos
  • Administrador de la base de datos
  • DevOps
  • Desarrollador Front-End
  • Desarrollador Full-Stack
  • Analista de seguridad de la información

Newsfeed

Programas en Foothill

Cursos y herramientas en línea