Senior Site Reliability Engineer

Wij zijn op zoek naar een Senior Site Reliability Engineer met kennis en ervaring van Linux/Unix, cloud, IaC, monitoring, automatisering, containerisatie en scripten.

Functieomschrijving

We zijn op zoek naar een Senior Site Reliability Engineer om ons dynamische team te versterken en de betrouwbaarheid en schaalbaarheid van onze IaaS- en PaaS-stacks te waarborgen. Als Senior SRE speel je een cruciale rol bij het automatiseren van activiteiten, het handhaven van de systeemgezondheid en het optimaliseren van onze service om onze niet-functionele vereisten te bereiken en te overtreffen, waaronder RPO=0, RTO<4 uur en 99,7% beschikbaarheid van onze use case voor hoofdberichten. Je speelt een belangrijke rol bij het overbruggen van de kloof tussen ontwikkeling en bedrijfsvoering en brengt een software-engineeringbenadering van onderwerpen op het gebied van systeembeheer.

Belangrijkste verantwoordelijkheden:

Implementeer en beheer continuous delivery-systemen en -methodologieën op IaaS en PaaS.
Definieer en implementeer monitoring-, metrische en registratiesystemen op VM's, Kubernetes en in applicatie- en infrastructuurstacks.
Ontwerp, bouw en beheer tools om operationele processen te automatiseren.
Ontwikkel software om te integreren met interne back-endsystemen, gericht op het verminderen van systeemuitval en het verbeteren van de klantervaring.
Voer incidentresponsoefeningen uit en neem deel aan een rotatie op afroep.
Leid inspanningen om implementaties zonder downtime en snel herstel van incidenten te bereiken.
Werk samen met DevOps-teams om de waarneembaarheid en waarschuwingen van ons systeem te verbeteren.
Optimaliseer on-premises en cloudgebaseerde rekenresources voor kosten, prestaties en betrouwbaarheid.
Documenteer huidige en toekomstige configuratieprocessen en beleidsregels.
Mentor junior SRE's en helpen bij het opbouwen van een cultuur van betrouwbaarheid in de technologieteams.

Functie eisen

Bachelor- of masterdiploma in computerwetenschappen, informatietechnologie of een gerelateerd vakgebied
Certificeringen die relevant zijn voor SRE, zoals Google's Professional Cloud DevOps Engineer of Service Design AWS DevOps Engineering
Ervaring met automatisering/configuratiebeheer met behulp van Puppet, Chef, Ansible of een gelijkwaardig systeem
Sterke kennis van de ecosystemen van cloudproviders, inclusief API's en services (AWS, Azure, Google Cloud, enz.)
Vaardig met containerisatie- en orkestratietechnologieën (Docker, Kubernetes, Mesos)
Mogelijkheid om te coderen en te scripten in programmeertalen zoals Python, Go, Ruby, Java of Shell-scripting

Werk- en denkniveau

7 jaar aantoonbare ervaring ervaring in grootschalig systeembeheer en support, inclusief directe ervaring als Site Reliability Engineer
4 jaar sterke achtergrond in Linux/Unix Administration
4 jaar uitgebreide ervaring met het implementeren van monitoringtools zoals Prometheus, Grafana, ELK-stack, Nagios of vergelijkbaar
3 jaar expertise in het ontwerpen, analyseren en oplossen van problemen met grootschalige gedistribueerde systemen. Bekendheid met load balancing, firewalls, enz., en inzicht in netwerkprotocollen

Aanvullende kennis

Goede beheersing van de Nederlandse en Engelse taal
Ervaring met het werken op basis van de Agile/Scrum methodiek
Ervaring met Jira/Confluence

Overige functiewensen

Je bent in het bezit van functie-gerelateerde (SAFe-Agile) certificeringen of bent bereid deze op korte termijn te behalen

Competenties

Uitstekende probleemoplossende, communicatieve en teamwerkvaardigheden
Ervaring met infrastructure as code (IaC) met behulp van Terraform of vergelijkbare software
Hands-on ervaring met microservices en gedistribueerde applicatie-architectuur
Praktische kennis van databasesystemen, zowel SQL als NoSQL (bijv. MongoDB)
Bereidheid en vermogen om deel te nemen aan een 24/7/365 op afroep-rotatieschema

Eenvoudig, snel, groen en betrouwbaar zaken regelen tussen overheden, burgers en bedrijven. Met als doel een betere dienstverlening, kostenbesparing en administratieve lastenverlichting. Daar gaat de overheid voor. Logius vervult hierin een centrale en leidende rol met oog voor de samenhang in de infrastructuur van de e-overheid.

Logius is de dienst digitale overheid en onderdeel van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties. De diensten en standaarden van Logius zijn voor de gehele overheid ontwikkeld. Logius is verantwoordelijk voor het beheer, de doorontwikkeling en de overheidsbrede toepassingen van deze diensten en standaarden.

Senior Site Reliability Engineer

Wij zijn op zoek naar een Senior Site Reliability Engineer met kennis en ervaring van Linux/Unix, cloud, IaC, monitoring, automatisering, containerisatie en scripten.

Hoe kan ik je helpen?

Contact Marit

Over ons

Kennis

Vacatures & Projecten

Updates ontvangen?

Volg ons

Wij zijn op zoek naar een Senior Site Reliability Engineer met kennis en ervaring van Linux/Unix, cloud, IaC, monitoring, automatisering, containerisatie en scripten.

Andere vacatures

Applicatiebeheerder

Data Science medewerker

Hoe kan ik je helpen?

Contact Marit

Over ons

Kennis

Vacatures & Projecten

Updates ontvangen?

Volg ons