AnsimOn-AI

AnsimOn AI core repository.

Scope

Evidence text structuring
Validator (policy-level rules)
Evaluation / regression tests

Eval (regression) v0

고정 입력(평가셋 v0)을 기반으로 구조화 결과/태그/RequirementState/Event I/O 계약 회귀 감지
운영: CI는 smoke만 실행, 전체(full)는 로컬/수동 실행
로컬 실행(전체): python scripts/run_eval_v0.py
CI 실행(스모크): python scripts/run_eval_v0.py --suite smoke
출력: 케이스별 PASS|WARN|FAIL, reason_codes, usage_metrics(v0: duration_ms, input_chars, output_chars, cache_hit)

Pipeline Overview

입력(Evidence text) → v1.3 구조화(JSON) → anchor 적용/근거 재현(evidence_span/anchor)
Validator v0.1-α: 스키마/공통 필드 정합성 검증(의미 해석/법적 판단 없음)
Validator v0(tag-based): 관찰된 EvidenceTag를 pass|warn|fail로 등급화
RequirementState v0: “요건 평가 가능 상태(EVALUATABLE|UNSTABLE|INVALID)” 분류
[TRIAL] Signals v0: UI 신호 수준만 생성하는 파생 출력(derived output)

Validator v0.1-α Scope

v1.3 스키마의 구조적 정합성만 검증한다.
최상위 필수 키 존재 여부를 검증한다.
각 필드의 공통 필드(value, confidence, evidence_span, evidence_anchor) 존재 여부를 검증한다.
confidence 값의 형식(high | medium | low)을 검증한다.
evidence_span ↔ evidence_anchor의 null 정합성을 검증한다.
본 단계에서는 의미 해석, 법적 판단, 좌표 정확성 검증은 수행하지 않는다.

Validator v0 Scope (tag-based)

EvidenceTag(v0)를 입력으로 받아 ValidationStatus(pass|warn|fail)을 산출한다.
본 단계는 판단/추론이 아니라 관찰된 상태(tag)의 등급화만 수행한다.
정책(v0):
- STRUCT_INVALID → fail (FAIL은 구조가 깨졌을 때만 사용)
- ANCHOR_NOT_FOUND → warn (message code: W_ANCHOR_NOT_FOUND)
- ANCHOR_AMBIGUOUS → warn (message code: W_ANCHOR_AMBIGUOUS, 등급은 동일)
- CONFIDENCE_WITHOUT_ANCHOR → warn
- 그 외(구조 유효 + 경고 없음) → pass

RequirementState v0 Scope

EvidenceTag[](+ tag-validator 결과)를 기반으로 “요건 평가 가능 상태”만 분류한다.
출력: RequirementState(EVALUATABLE|UNSTABLE|INVALID)
정책(v0):
- INVALID ↔ ValidationStatus.fail
- UNSTABLE ↔ ValidationStatus.warn
- EVALUATABLE ↔ ValidationStatus.pass

RequirementState의 서비스 사용(파이프라인 매핑)

RequirementState는 “요건 평가 결과(반복성/위협성/거절의사/증거력·명확성·안전성 등)”가 아니라, 후속 단계(Event/Timeline/Document)를 진행해도 되는지에 대한 처리 가능 상태만 의미한다.
서비스 매핑(초안, v0):
- INVALID: Event 생성 금지 / Timeline 금지 / Document 금지 → 로그·디버깅·실패 유형 수집만
- UNSTABLE: Event 생성 허용(주의 태그 + reason_codes 필수, 고위험 필드 확정 금지) / Timeline 허용(주의 태그 필수) / Document 금지 → “보완 필요”
- EVALUATABLE: Event 허용 / Timeline 허용 / Document 허용 → 정상 파이프라인
UNSTABLE에서 생성된 모든 산출물에는 reason_codes(예: W_ANCHOR_NOT_FOUND)를 보존하여, “어떤 이유로 불안정한가”가 후속 단계에서 추적 가능해야 한다.

RequirementState vs 요건 태그(평가 결과물)

RequirementState: “평가/처리를 진행 가능한 상태인가?” (게이팅)
요건 태그/Signals: “평가해보니 어떤 속성인가?” (평가 결과)
예: [TRIAL] Signals v0의 signals[]는 평가 결과물이며 RequirementState 자체가 아니다.

[TRIAL] Signals v0

법적 판단/결론을 만들지 않고, UI가 요구하는 "신호 수준(level)"만 근거 재현 가능하게 생성하는 파생 출력(derived output) 이다.

입력(모드1): 원문 텍스트
입력(모드2): v1.3 구조화 결과 + EvidenceTag[]
출력 공통: mode, version, summary, signals[]
signals[]: name, level, reason_codes[], evidence[]
- evidence[]는 가능하면 evidence_span + evidence_anchor(start_char/end_char)를 포함
- evidence[]가 비어 있을 수 있으며(근거 매칭 실패/근거 풀 없음 등), 이 경우 reason_codes[]로 “근거 부족”을 명시
- reason_codes[] 네이밍(최소 규칙): T_(text), E_(위험/에러), W_(경고), P_(통과) 접두어 + 대문자/숫자/_ (^[TEWP]_[A-Z0-9_]+$)

`signals.name` ↔ UI 항목 매핑

signals.name	UI 항목(예시 라벨)	mode
`repetition`	반복	text
`threat`	위협	text
`refusal`	거절/거부	text
`evidence_strength`	증거 강도	evidence
`clarity`	명확성(근거 재현 가능성)	evidence
`safety`	안전(파이프라인 상태)	evidence

Non-goals

API server
Authentication / billing
Database access
Production-grade OCR / STT client integrations

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
.github		.github
.vscode		.vscode
data/evalsets/v0		data/evalsets/v0
scripts		scripts
src/ansimon_ai		src/ansimon_ai
tests		tests
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AnsimOn-AI

Scope

Eval (regression) v0

Pipeline Overview

Validator v0.1-α Scope

Validator v0 Scope (tag-based)

RequirementState v0 Scope

RequirementState의 서비스 사용(파이프라인 매핑)

RequirementState vs 요건 태그(평가 결과물)

[TRIAL] Signals v0

`signals.name` ↔ UI 항목 매핑

Non-goals

About

Uh oh!

Releases

Packages

Languages

Team-SEBAF/AnsimOn-AI

Folders and files

Latest commit

History

Repository files navigation

AnsimOn-AI

Scope

Eval (regression) v0

Pipeline Overview

Validator v0.1-α Scope

Validator v0 Scope (tag-based)

RequirementState v0 Scope

RequirementState의 서비스 사용(파이프라인 매핑)

RequirementState vs 요건 태그(평가 결과물)

[TRIAL] Signals v0

signals.name ↔ UI 항목 매핑

Non-goals

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

`signals.name` ↔ UI 항목 매핑

Packages