AI 경진대회
공공기관 AI 챌린지
공공데이터와 국산 LLM으로 행정·민원·정책 문제를 푸는 챌린지를 설계·운영합니다. 데이터 주권과 보안을 지키면서, 바로 이식 가능한 공공 AI를 만듭니다.
Overview
공공데이터 × 국산 LLM, 현장에 바로 쓰는 챌린지
공공데이터포털(data.go.kr)에 개방된 고가치 데이터와 국산 파운데이션 모델을 활용해, 단순 정확도 경쟁을 넘어 공공서비스에 곧바로 이식 가능한 RAG·챗봇·예측모델을 만드는 데이터·AI 경진대회입니다. 데이터 주권과 보안이 중요한 공공 영역 특성상, 해외 상용 모델 대신 국산 모델 활용을 권장·가점하는 추세를 반영합니다.
Sovereign AI
왜 국산 LLM인가
민감한 공공데이터는 해외 서버로 나가는 순간 데이터 주권과 보안이 흔들립니다. 정부도 '독자 AI 파운데이션 모델' 사업으로 국산 AI 육성에 나섰고, LG AI연구원과 Upstage는 그 핵심 정예팀으로 선정되어 2차까지 진출했습니다. 상상력집단은 이 국산 LLM을 챌린지의 기본 엔진으로 삼습니다.
LG AI연구원 · EXAONE
LG그룹 16개 계열사가 참여하는 AI 전담 연구기관이 자체 개발한 초거대 AI '엑사원(EXAONE)'. 데이터 수집부터 학습까지 전 과정을 독자 수행한 순수 국산 모델로, 한국어 정확도가 높고 오픈웨이트로 공개되어 온프레미스 구축에 적합합니다.
- From-Scratch 독자 개발
- 한국어 특화 토크나이저
- 오픈웨이트·온프레미스
Upstage · Solar
네이버 클로바를 이끌던 연구진이 설립한 AI 기업의 거대언어모델 'Solar'와 문서 처리 AI 'Document AI'. 한국어·전문 도메인 성능이 우수하고, 약 99% 정확도의 문서 인식으로 공공기관의 대량 문서 처리에 강점이 있습니다.
- 한국어·전문 도메인 강점
- Document AI·OCR
- 조달청 생성형 AI 1호 공급사
데이터 주권 · 국산 모델과 온프레미스 구성으로 민감 데이터의 해외 유출 위험을 원천 차단합니다. 한국어 성능 · 행정 문서·법령 등 한국어 도메인에서 높은 정확도를 보입니다. 정책 적합성 · 정부의 국산 AI 우선 기조와 공공 도입 레퍼런스에 부합합니다.
Open Data
공공데이터, 이렇게 활용합니다
data.go.kr에서 부처·지자체가 개방한 고가치 데이터셋을 챌린지 데이터로 제공합니다.
데이터 수집
Open API·파일 다운로드로 행정·재난·복지·교통 데이터 확보
전처리·정제
결측·이상치 처리와 표준화로 학습·검색용 데이터 구성
LLM 적재·학습
국산 LLM에 RAG 문서로 적재하거나 예측모델 학습데이터로 활용
서비스 구현
행정 챗봇·예측·자동화 서비스로 구현하고 시연
How We Run
기획부터 사후 활용까지, 7단계 운영
과제 정의
행정·민원·정책 현장의 페인포인트를 발굴하고, 활용할 공공데이터셋과 정량·정성 평가지표를 확정합니다.
참가자 모집·데이터 개방
공공데이터포털·전용 플랫폼에 데이터셋과 규칙을 공개하고 팀을 모집합니다.
사전 교육·멘토링
국산 LLM API 사용법, RAG 구축, 공공데이터 전처리 실습 워크숍을 제공합니다.
예선 (리더보드·기획서)
정량 점수 또는 솔루션 기획서로 본선 진출팀을 선발합니다.
본선·발표
본선 진출팀이 모델을 고도화하고 솔루션과 시연을 발표합니다.
심사·시상
정량 성능과 발표 평가를 종합해 기관장상·장관상 등을 수여합니다.
사후 활용 (PoC·이관)
우수작을 실제 행정 시스템 PoC로 연결하거나 공공서비스에 반영합니다.
Tracks
추천 주제·트랙
기관의 데이터와 목표에 맞춰 트랙을 함께 설계합니다.
민원 자동분류·응답 챗봇
지자체 민원 데이터와 국산 LLM RAG로 24시간 안내·자동 분류를 구현합니다.
공공문서 요약·검색 어시스턴트
법령·고시·내부규정을 RAG로 검색·요약하는 행정 지식봇을 만듭니다.
재난·안전 예측
강우·홍수·산불 등 공공데이터 기반 예측 모델을 개발합니다.
복지 사각지대 발굴
행정데이터로 고립·취약계층을 조기 발굴하고 자원을 매칭합니다.
행정 원스톱 자동연계
출생·육아·주거 등 흩어진 행정 절차를 자동으로 연계합니다.
보이스피싱·이상거래 탐지
음성·텍스트 분석으로 사기·이상 패턴을 실시간 탐지합니다.
정책 효과 분석·시뮬레이션
공공 통계로 정책의 영향과 시나리오를 분석합니다.
교통·도시 빅데이터
국토·교통 빅데이터로 수요 예측과 도시 문제를 해결합니다.
국산 LLM 행정 지식봇
부처 내부 지식을 EXAONE·Solar 기반 RAG로 구축합니다.
Judging
심사 기준 예시
- 문제 해결력·정확도30점
정량 성능 또는 솔루션의 타당성
- 공공데이터 활용 적절성·창의성20점
- 행정 현장 적용가능성·실용성20점
- 기술 완성도·구현(RAG/모델/시연)15점
- 국산 LLM·데이터 주권/보안 고려 (가점)10점
- 발표·전달력5점
※ 위 배점은 국내 공공데이터·AI 대회의 일반적 관행을 종합한 예시이며, 대회별로 조정됩니다.
Impact
기대 효과
현장 페인포인트 빠른 검증
부서별로 산재한 행정 문제를 외부 집단지성으로 신속하게 PoC 검증합니다.
체감형 공공서비스 혁신
우수작의 실서비스 이관으로 민원 처리시간 단축·구비서류 간소화 등 국민 체감 혁신으로 이어집니다.
고가치 데이터 선순환
공공데이터의 실수요를 검증해 데이터 품질·개방 확대의 선순환을 만듭니다.
국산 AI 역량 내재화
내부 직원의 AI 역량을 키우고 국산 AI 생태계에 기여합니다.

