한국어 요청이 들어옵니다
긴 한국어 질문이나 누적된 대화 내용이 API 프록시에 도착합니다.
Korean request enters the proxy
A long Korean prompt or accumulated chat context arrives at the API proxy.
Research prototype
PolyHarness는 한국어가 많은 채팅 입력을 로컬 번역 모델에서 영어 프롬프트로 바꾼 뒤, 메인 LLM에 전달하는 방식을 검증한 실험용 프록시입니다.
Research prototype
PolyHarness is an experimental proxy that translates Korean-heavy chat input into English before the main LLM call, then optionally returns the answer in Korean.
사용자는 한국어로 대화하되, 메인 모델에는 영어 프롬프트를 보내면 입력 토큰을 줄일 수 있는지 확인했습니다.
The test asks whether users can keep a Korean-facing experience while the main model receives a shorter English prompt.
긴 한국어 질문이나 누적된 대화 내용이 API 프록시에 도착합니다.
A long Korean prompt or accumulated chat context arrives at the API proxy.
작은 로컬 모델이 메인 LLM에 보낼 내용을 영어 프롬프트로 변환합니다.
A smaller local model prepares the English prompt that will be sent to the main LLM.
메인 LLM은 영어 프롬프트에 답하고, 필요하면 최종 응답만 한국어로 다시 바꿉니다.
The main LLM answers the English prompt, and the final response can be translated back to Korean.
2026년 6월 8일, 같은 의미의 한국어/영어 프롬프트 20쌍을 Ollama에서 비교했습니다. 각 프롬프트는 1회, 3회, 6회 반복한 형태로 테스트했습니다.
On June 8, 2026, the Ollama benchmark ran 20 Korean/English prompt pairs at repeat levels 1, 3, and 6.
가장 빠른 확인은 mock 모드입니다. API 키와 Ollama가 없어도 프록시 흐름을 볼 수 있습니다.
The quickest check is mock mode. It verifies the proxy path without an API key or Ollama.
python3 -m venv .venv
.venv/bin/python -m pip install -r proxy/requirements.txt
POLYHARNESS_TRANSLATION_MODE=mock \
POLYHARNESS_REMOTE_LLM=mock \
.venv/bin/python -m uvicorn proxy.main:app --host 127.0.0.1 --port 8000
.venv/bin/python test_proxy.py