노드를 선택하세요
Node Prompt#prompts 또는 #prompt-node-router-agent:v1 같은 hash로 이동할 수 있습니다.
SamsungCard · GenOS Lab
운영 관제보다 실험/검증 흐름을 먼저 보이도록 구성한 4페이지 대시보드입니다. 실연동 API와 seed/example 데이터를 배지로 분리해, 현재 가능한 실행과 향후 GenOS Admin API 연동 후보를 혼동하지 않게 했습니다.
주요 기능을 페이지 카드로 분리했습니다. Prompt Studio는 랜딩에서 바로 진입할 수 있고, 실행/벤치마크와 Workflow Lab은 각각 독립 화면처럼 표시됩니다.
GenOS Code Serving 연결값과 모델을 선택하고 Prompt를 입력해 단일 실행, 순차 Benchmark, Concurrency Benchmark를 실행합니다.
기본은 48번 코드서빙입니다. 번호가 바뀌면 URL의 /48/만 변경하세요.
보통은 .env 또는 환경변수 값을 사용합니다. 특정 테스트에서만 직접 입력하세요.
체크된 모델만 화면에 보이는 위→아래 순서로 하나씩 순차 실행합니다. 기본 체크는 GPT/Gemini/DeepSeek/Llama/Mistral 균형형 5개입니다. Qwen은 provider route 진단/선택 실행 후보로 남깁니다.
| Model | Status | Latency / p95 | Content/Error | Quality / Concurrency |
|---|
실행 전
Benchmark 화면에서 완료된 실행 묶음을 새로고침 전까지 Recent Benchmark Runs에 누적하고, prompt/test case 원문 대신 prompt 이름·version과 test case 이름 기준으로 모델별 결과를 비교합니다.
단일 실행, Benchmark, Concurrency Benchmark가 완료될 때마다 1건씩 추가됩니다. 각 run에는 브라우저 메모리 메모를 남기거나 기록을 삭제할 수 있고, 개인 PC에서 돌린 결과를 JSON/CSV 파일로 추출할 수 있습니다. 기본 표에는 전체 prompt 본문이나 test input JSON 원문을 노출하지 않습니다. Compact JSON preview는 각 run의 보조 접힘 영역에서만 확인합니다.
13개 architecture node를 선택하고, 노드별 prompt version을 편집한 뒤 선택한 입력 데이터와 함께 Benchmark 화면으로 보냅니다. 실제 모델 실행은 Benchmark 화면의 버튼으로만 수행합니다.
#prompts 또는 #prompt-node-router-agent:v1 같은 hash로 이동할 수 있습니다.