Generative Models

H2O Eval Studio provides evaluation of generative machine learning models.

Evaluation diagram

Evaluating RAGs and LLMs

Evaluating RAGs and LLMs

RAG and LLM Hosts

RAG and LLM Hosts

Test Case, Suite, Lab and LLM Dataset

Test Case, Suite, Lab and LLM Dataset
- Test Case
- Test
- Test Suite
- Test Lab
- LLM Dataset

Evaluator Parametrization

Evaluator Parameters

Evaluators

Evaluators

BYOJ: Bring Your Own Judge

BYOJ: Bring Your Own Judge

BYOP: Bring Your Own Prompt

BYOP: Bring Your Own Prompt

Perturbations

Perturbations