Site Reliability Engineer

Core Specialty

• $120K — $150K *

US-AnywhereRemote in Florida, US

Information Technology

5 - 7 years of experience

Today

Be an Early Applicant

By clicking Apply, I agree with Ladders' Terms of Use and Privacy Policy

Job Overview by Ladders

Qualifications

5+ years in Site Reliability Engineering, DevOps, or Cloud Engineering
Hands-on experience with incident management in production systems
Proficiency in Terraform and Infrastructure as Code practices
Deep understanding of cloud-native architecture (microservices, containers)
Experience with observability platforms like Datadog and Azure Monitor
Familiarity with compliance frameworks for regulated environments

Responsibilities

Design and implement fault-tolerant cloud architectures
Define and manage SLOs, SLIs, and error budgets
Build and maintain Infrastructure as Code using Terraform
Develop automated remediation and self-healing systems
Establish monitoring and logging frameworks across platforms
Drive cost optimization initiatives for resource utilization
Collaborate with teams to integrate reliability practices into CI/CD pipelines

Benefits

Medical, dental, vision, and life insurance
Short and long-term disability coverage
100% Company match of 6% contribution in 401(k) plan
Employee Assistance Plan
Health Savings Account and Flexible Spending Account
Wellness program and Health Reimbursement Account

Full Job Description

The Site Reliability Engineer (SRE) is responsible for ensuring the availability, scalability, performance, and resiliency of enterprise cloud platforms across Azure, and AWS environments.

This role combines software engineering, automation, and infrastructure expertise to operationalize reliability engineering practices, drive cloud-native resiliency patterns, and enable business-critical applications to meet defined SLAs, SLOs, and compliance requirements.

The SRE partners with engineering, security, and operations teams to implement observability, incident response frameworks, and reliability automation, aligning with enterprise architecture standards and regulatory expectations.
Key Accountabilities/Deliverables:

Design and implement highly available, fault-tolerant architectures using cloud-native services (microservices, containers, serverless)
Define and operationalize SLOs, SLIs, and error budgets for critical applications and platforms
Build and maintain Infrastructure as Code (IaC) (Terraform) to ensure repeatable and compliant deployments
Develop automated remediation and self-healing capabilities to reduce MTTR and improve system resilience
Establish enterprise-level monitoring, logging, and observability frameworks (Datadog, Azure Monitor, CloudWatch, OpenTelemetry, Azure Application Insights)
Drive cost optimization (FinOps) initiatives, including resource utilization tracking and rightsizing recommendations
Support DR/BCP strategy execution, including failover testing and regional isolation validation
Collaborate with application teams to embed reliability engineering practices into CI/CD pipelines

Technical Knowledge and Understanding:

Strong expertise in cloud platforms (Azure, AWS)
Deep understanding of cloud-native architecture patterns (microservices, containers (Azure Container Apps/AKS/EKS), serverless (Azure Functions/AWS Lambda))
Proficiency in Infrastructure as Code (Terraform, ARM/Bicep)
Experience with observability platforms (Datadog, Azure Monitor, Azure Application Insights)
Knowledge of CI/CD pipelines and GitOps practices
Expertise in system reliability concepts:
- SLI / SLO / SLA management
- Chaos engineering
- High availability & fault isolationFamiliarity with security, compliance, and regulatory controls (SOC, ISO, cloud security frameworks)

Experience:

5+ years experience in Site Reliability Engineering, DevOps, or Cloud Engineering
Proven experience supporting mission-critical production systems at scale
Hands-on experience with incident management and on-call operations
Experience implementing automated monitoring, alerting, and remediation frameworks
Exposure to regulated environments (insurance, financial services) preferred
Demonstrated ability to work across cross-functional architecture, engineering, and operations teams

At Core Specialty, you will receive a competitive salary and opportunities for professional development and advancement. We offer medical, dental, vision, and life insurances; short and long-term disability; a Company-match of 100% of a 6% contribution 401(k) plan; an Employee Assistance Plan; Health Savings Account, Flexible Spending Account, Health Reimbursement Account, and a wellness program

* Ladders Estimates

Similar Jobs

Platform Engineer
$90K — $120K *
Trulieve
Tallahassee, FL 32303 (Leon County)
Today
Senior Cloud Engineer - TS/SCI
$112K — $196K *
Appcast
Centreville, VA 20120 (Fairfax County)
Today
Lead GCP Cloud Engineer
$120K — $150K *
LIGHTFEATHER IO LLC
Washington, DC 20011 (District Of Columbia County)
Today
Platform Engineer
$86K — $136K *
Manulife Financial Corporation
Toronto, ON M3C 0E3
Today
Platform Engineer
$86K — $136K *
Manulife Financial Corporation
Waterloo, ON N2J 1A1
Today
Platform Engineer
$90K — $167K *
Manulife Financial Corporation
Boston, MA 02115 (Suffolk County)
Today

Get Ready For Your
Next Interview

More Jobs at Core Specialty

Site Reliability Engineer
$120K — $150K *
Remote
Today
Information Technology
Remote in Florida, US
Senior SIU Investigator
$80K — $85K *
Remote
3 days ago
Finance & Insurance
Remote in New York, US
Senior Underwriter - E&O
$110K — $140K *
Chicago, IL 60629 (Cook County)
3 weeks ago
Finance & Insurance
In-Person
Senior Underwriter - E&O
$110K — $140K *
Dallas, TX 75217 (Dallas County)
3 weeks ago
Finance & Insurance
In-Person
Deputy General Counsel - Corporate Governance
$130K — $180K *
Cincinnati, OH 45238 (Hamilton County)
4 weeks ago
Legal & Accounting
In-Person

More Information Technology Jobs

SDET (Software Development Engineer In Test)
Confidential Company
Washington, DC 20001 (District Of Columbia County)
2 weeks ago
Project Manager
$80K — $110K *
Versaterm
Mesa, AZ 85204 (Maricopa County)
Today
Network Development Engineer II
$136K — $184K *
Amazon
Seattle, WA 98115 (King County)
Today
Site Reliability, Principal - 16495
$185K — $278K *
Synopsys Inc
Sunnyvale, CA 94087 (Santa Clara County)
Reposted Today
Global IT Finance Manager
$95K — $105K *
LEK Consulting
Boston, MA 02115 (Suffolk County)
Today

Find similar Site Reliability Engineer jobs:

Nationwide Remote

Site Reliability Engineer

Job Overview by Ladders

Full Job Description

Get Ready For Your Next Interview

Find similar Site Reliability Engineer jobs:

Get Ready For Your
Next Interview