Jobs at Alteo

View all jobs

Linux Sys Admin / SRE [#3335]

Montreal (Remote), QC

Alteo is looking for a Linux Sys Admin / SRE (Site Reliability Engineer) for a permanent position based in Montreal (or Remote).

You will work within a tight-knit 12 person team on our clients product. On-boarding will begin with an introduction to network operations. Thereafter, you will join and eventually lead service automation processes. A central and growing responsibility of this role will be planning and implementation of SRE processes. This will include building tools to improve network availability, service performance and resilience. You will take an “automate everything” approach, working with existing automation tools and developing new ones.


Responsibilities:

  • Help us maximize the value team members and clients derive from our technology
  • Improve our working practices; help us make more effective use of technology internally
  • Build software to help network operations and support teams
  • Document “tribal” knowledge
  • Conduct post-incident reviews
  • Automate systems deployments and streamline existing processes


Profile:

  • DEC/BAC in IT or equivalent
  • Excellent Linux administration skills, including experience with configuring and strengthening web servers (Nginx preferable)
  • Strong experience with CI/DevOps tools (e.g. CircleCI, Ansible)
  • Experience with data engineering and visualization
  • Ability to program in Python, bash, Go (an asset)
  • Ability to perform code review and quality assurance
  • Deep familiarity with HTTP, TCP, DNS
  • Good understanding of the Linux kernel, and KVM and/or Xen hypervisors
  • Strong collaboration, written and verbal skills.
  • Love reading and writing technical documentation
  • Fluent in English; French an asset


Nice to have:

  • Previous experience in an SRE role or a role with similar functions
  • Experience setting up and growing on-premise installations of the ELK stack
  • Knowledge of web caching technology
  • Experience with Docker and Kubernetes environments
  • Experience configuring webservers and proxies like Apache Traffic Server, Apache httpd, Nginx, and HAProxy
  • Experience with open source projects – the beauty and the pain of collaboration
  • A background in a technical subject or in-depth experience in a variety of software projects
@@@@@
Alteo est à la recherche d'un Administrateur de Systèmes Linux / SRE (Site Reliability Engineer) pour un poste permanent basé à Montréal (ou à distance).

Vous travaillerez au sein d'une équipe soudée de 12 personnes sur le produit de nos clients. L'intégration commencera par une introduction aux opérations réseau. Par la suite, vous rejoindrez et éventuellement dirigerez les processus d'automatisation des services. Une responsabilité centrale et croissante de ce rôle sera la planification et la mise en œuvre des processus SRE. Il s'agira notamment de créer des outils pour améliorer la disponibilité du réseau, la performance des services et la résilience. Vous adopterez une approche " tout automatiser ", en travaillant avec les outils d'automatisation existants et en en développant de nouveaux.


Responsabilités :
  • Nous aider à maximiser la valeur que les membres de l'équipe et les clients tirent de notre technologie.
  • Améliorer nos pratiques de travail ; nous aider à faire un usage plus efficace de la technologie en interne.
  • Construire des logiciels pour aider les équipes d'exploitation et de support du réseau
  • Documenter les connaissances "tribales
  • Effectuer des examens post-incident
  • automatiser les déploiements de systèmes et rationaliser les processus existants.

Profil :
  • DEC/BAC en informatique ou équivalent
  • Excellentes compétences en administration Linux, y compris une expérience dans la configuration et le renforcement de serveurs web (Nginx de préférence)
  • Forte expérience avec les outils CI/DevOps (par exemple CircleCI, Ansible)
  • Expérience de l'ingénierie et de la visualisation des données
  • Capacité à programmer en Python, bash, Go (un atout)
  • Capacité à effectuer une revue de code et une assurance qualité
  • Connaissance approfondie des protocoles HTTP, TCP et DNS.
  • Bonne compréhension du noyau Linux et des hyperviseurs KVM et/ou Xen.
  • Forte collaboration, compétences écrites et verbales.
  • Aimer lire et écrire de la documentation technique
  • Maîtrise de l'anglais ; le français est un atout

Atouts :
  • Expérience préalable dans un rôle SRE ou un rôle avec des fonctions similaires.
  • Expérience dans la mise en place et la croissance d'installations sur site de la pile ELK.
  • Connaissance de la technologie de mise en cache web
  • Expérience avec les environnements Docker et Kubernetes
  • Expérience de la configuration de serveurs web et de proxies comme Apache Traffic Server, Apache httpd, Nginx et HAProxy.
  • Expérience des projets open source - la beauté et la douleur de la collaboration.
  • Une formation dans un domaine technique ou une expérience approfondie dans une variété de projets logiciels.

More Openings

Windows System Administrator [#3333]
Junior C# Developer [#3354]
Senior C# Developer [#3353]

Share This Job

Powered by