Spaces:

ybchen928
/

oncall-guide-ai

Running

App Files Files Community

oncall-guide-ai / evaluation /metric5_6_llm_judge_evaluator.py

Commit History

Enhance Direct LLM Evaluator and Judge Evaluator:

40d39ed

YanBoChen commited on 28 days ago

Add multi-system evaluation support for clinical actionability and evidence quality metrics

16a2990

YanBoChen commited on 28 days ago

Before Run the 1st Evalation: Add Precision & MRR Chart Generator and a sample test query

a2aaea2

YanBoChen commited on 28 days ago