SamsungCard · GenOS Lab

SamsungCard LLM Workflow Portfolio

운영 관제보다 실험/검증 흐름을 먼저 보이도록 구성한 4페이지 대시보드입니다. 실연동 API와 seed/example 데이터를 배지로 분리해, 현재 가능한 실행과 향후 GenOS Admin API 연동 후보를 혼동하지 않게 했습니다.

실연동: /api/run 실연동: /api/benchmark 실연동: /api/benchmark/concurrency 실연동: /api/auth/status 실연동: /api/models 실연동: /api/prompts 실연동: /api/test-cases 브라우저 메모리: Recent Benchmark Runs

Home

Hash page UX

주요 기능을 페이지 카드로 분리했습니다. Prompt Studio는 랜딩에서 바로 진입할 수 있고, 실행/벤치마크와 Workflow Lab은 각각 독립 화면처럼 표시됩니다.

연결 / 모델 실행

실연동

GenOS Code Serving URL

기본은 48번 코드서빙입니다. 번호가 바뀌면 URL의 /48/만 변경하세요.

GenOS Bearer Token확인 중

Provider API Key확인 중

인증/Provider 값 직접 입력

보통은 .env 또는 환경변수 값을 사용합니다. 특정 테스트에서만 직접 입력하세요.

GenOS Bearer Token Provider/OpenRouter API Key Provider Base URL

단일 실행 모델

프롬프트 / Benchmark

실연동

Prompt

Timeout seconds

Temperature

Max tokens

Benchmark 모델 선택

체크된 모델만 화면에 보이는 위→아래 순서로 하나씩 순차 실행합니다. 기본 체크는 GPT/Gemini/DeepSeek/Llama/Mistral 균형형 5개입니다. Qwen은 provider route 진단/선택 실행 후보로 남깁니다.

실행 결과

실연동 결과

Model	Status	Latency / p95	Content/Error	Quality / Concurrency

Raw JSON

실행 전

Recent Benchmark Runs

browser memory only

단일 실행, Benchmark, Concurrency Benchmark가 완료될 때마다 1건씩 추가됩니다. 각 run에는 브라우저 메모리 메모를 남기거나 기록을 삭제할 수 있고, 개인 PC에서 돌린 결과를 JSON/CSV 파일로 추출할 수 있습니다. 기본 표에는 전체 prompt 본문이나 test input JSON 원문을 노출하지 않습니다. Compact JSON preview는 각 run의 보조 접힘 영역에서만 확인합니다.

아직 Benchmark 실행 결과가 없습니다.

Prompt Studio

실연동: /api/prompts · /api/test-cases

13개 architecture node를 선택하고, 노드별 prompt version을 편집한 뒤 선택한 입력 데이터와 함께 Benchmark 화면으로 보냅니다. 실제 모델 실행은 Benchmark 화면의 버튼으로만 수행합니다.

노드를 선택하세요

Node Prompt

#prompts 또는 #prompt-node-router-agent:v1 같은 hash로 이동할 수 있습니다.

Prompt version

목록으로

Input Data

입력 데이터 선택