AI Platform EngineerCharlotte, Onsite, Any Visa, Full time, Contract Jobs in USA

Apply Now

AI Platform Engineer

Location: Charlotte, North Carolina (NC)

Contract Type: C2C

Posted: 2 weeks ago

Closed Date: 03/06/2026

Skills: Frameworks,QA

Visa Type: Any Visa

Role : AI Platform Engineer (Guardrails, Observability & Evaluation Infrastructure)

Location : Charlotte NC (100% onsite)

AI Platform Engineer to design and build the foundational components that power enterprise-scale GenAI

applications. This includes data guardrails, model safety tooling, observability pipelines, evaluation harnesses, and

standardized logging/monitoring frameworks. This role is critical for enabling safe, reliable, and compliant AI

development across multiple use cases, teams, and business units. Idea is to create the common platform services

that AI team will build upon. Key Responsibilities1. Guardrails, Safety & Governance

? Design and implement data guardrail frameworks (pre-processing, redaction, PII/PHI filtering, DLP

integration, prompt defenses).

? Build "Model Armor" components such as:

? Input validation & sanitization

? Prompt-injection defenses

? Harmful content detection & policy enforcement

? Output filtering, factchecking, grounding checks

? Integrate safety tooling (policy engines, classifiers, DLP APIs/safety models).

? Collaborate with Security, Compliance, and Data Privacy teams to ensure frameworks meet enterprise

governance requirements.

2. Observability Frameworks

? Build and maintain observability pipelines using tools like Arize AI (tracing, quality metrics, dataset

drift/hallucination tracking, embedding monitoring).

? Define and enforce platform-wide standards for:

? Tracing LLM calls

? Token usage and cost monitoring

? Latency and reliability metrics

? Prompt/model version tracking

? Provide reusable SDKs or middleware for engineering teams to adopt observability with minimal friction.

3. Logging, Monitoring & Telemetry

? Design standardized LLM-specific logging schemas, including:

? Inputs/outputs

? Model metadata

? Retrieval metadata

? Safety flags

? User context and attribution

? Build monitoring dashboards for performance, cost, anomalies, errors, and safety events.

? Implement alerting and SLOs/SLIs for LLM inference systems.

4. Evaluation Infrastructure

? Architect and maintain evaluation harnesses for GenAI systems, including:

? RAG evaluation (faithfulness, relevance, hallucination risk)

? Summarization/QA evaluation

? Human-in-the-loop review workflows

? Automated eval pipelines integrated into CI/CD

? Support frameworks such as RAGAS, G-Eval, rubric scoring, pairwise comparisons, and test case

generation.

? Build reusable tooling for teams to write, run, and track model evaluations.