공공기관 AI 챌린지

Overview

공공데이터 × 국산 LLM, 현장에 바로 쓰는 챌린지

공공데이터포털(data.go.kr)에 개방된 고가치 데이터와 국산 파운데이션 모델을 활용해, 단순 정확도 경쟁을 넘어 공공서비스에 곧바로 이식 가능한 RAG·챗봇·예측모델을 만드는 데이터·AI 경진대회입니다. 데이터 주권과 보안이 중요한 공공 영역 특성상, 해외 상용 모델 대신 국산 모델 활용을 권장·가점하는 추세를 반영합니다.

Sovereign AI

왜 국산 LLM인가

민감한 공공데이터는 해외 서버로 나가는 순간 데이터 주권과 보안이 흔들립니다. 정부도 '독자 AI 파운데이션 모델' 사업으로 국산 AI 육성에 나섰고, LG AI연구원과 Upstage는 그 핵심 정예팀으로 선정되어 2차까지 진출했습니다. 상상력집단은 이 국산 LLM을 챌린지의 기본 엔진으로 삼습니다.

LG AI연구원 · EXAONE

LG그룹 16개 계열사가 참여하는 AI 전담 연구기관이 자체 개발한 초거대 AI '엑사원(EXAONE)'. 데이터 수집부터 학습까지 전 과정을 독자 수행한 순수 국산 모델로, 한국어 정확도가 높고 오픈웨이트로 공개되어 온프레미스 구축에 적합합니다.

From-Scratch 독자 개발
한국어 특화 토크나이저
오픈웨이트·온프레미스

Upstage · Solar

네이버 클로바를 이끌던 연구진이 설립한 AI 기업의 거대언어모델 'Solar'와 문서 처리 AI 'Document AI'. 한국어·전문 도메인 성능이 우수하고, 약 99% 정확도의 문서 인식으로 공공기관의 대량 문서 처리에 강점이 있습니다.

한국어·전문 도메인 강점
Document AI·OCR
조달청 생성형 AI 1호 공급사

데이터 주권 · 국산 모델과 온프레미스 구성으로 민감 데이터의 해외 유출 위험을 원천 차단합니다. 한국어 성능 · 행정 문서·법령 등 한국어 도메인에서 높은 정확도를 보입니다. 정책 적합성 · 정부의 국산 AI 우선 기조와 공공 도입 레퍼런스에 부합합니다.

Open Data

공공데이터, 이렇게 활용합니다

data.go.kr에서 부처·지자체가 개방한 고가치 데이터셋을 챌린지 데이터로 제공합니다.

1

데이터 수집

Open API·파일 다운로드로 행정·재난·복지·교통 데이터 확보

2

전처리·정제

결측·이상치 처리와 표준화로 학습·검색용 데이터 구성

3

LLM 적재·학습

국산 LLM에 RAG 문서로 적재하거나 예측모델 학습데이터로 활용

4

서비스 구현

행정 챗봇·예측·자동화 서비스로 구현하고 시연

How We Run

기획부터 사후 활용까지, 7단계 운영

01

과제 정의

행정·민원·정책 현장의 페인포인트를 발굴하고, 활용할 공공데이터셋과 정량·정성 평가지표를 확정합니다.

02

참가자 모집·데이터 개방

공공데이터포털·전용 플랫폼에 데이터셋과 규칙을 공개하고 팀을 모집합니다.

03

사전 교육·멘토링

국산 LLM API 사용법, RAG 구축, 공공데이터 전처리 실습 워크숍을 제공합니다.

04

예선 (리더보드·기획서)

정량 점수 또는 솔루션 기획서로 본선 진출팀을 선발합니다.

05

본선·발표

본선 진출팀이 모델을 고도화하고 솔루션과 시연을 발표합니다.

06

심사·시상

정량 성능과 발표 평가를 종합해 기관장상·장관상 등을 수여합니다.

07

사후 활용 (PoC·이관)

우수작을 실제 행정 시스템 PoC로 연결하거나 공공서비스에 반영합니다.

Tracks

심사 기준 예시

문제 해결력·정확도30점
정량 성능 또는 솔루션의 타당성
공공데이터 활용 적절성·창의성20점
행정 현장 적용가능성·실용성20점
기술 완성도·구현(RAG/모델/시연)15점
국산 LLM·데이터 주권/보안 고려 (가점)10점
발표·전달력5점

※ 위 배점은 국내 공공데이터·AI 대회의 일반적 관행을 종합한 예시이며, 대회별로 조정됩니다.

Impact

기대 효과

현장 페인포인트 빠른 검증

부서별로 산재한 행정 문제를 외부 집단지성으로 신속하게 PoC 검증합니다.

체감형 공공서비스 혁신

우수작의 실서비스 이관으로 민원 처리시간 단축·구비서류 간소화 등 국민 체감 혁신으로 이어집니다.

고가치 데이터 선순환

공공데이터의 실수요를 검증해 데이터 품질·개방 확대의 선순환을 만듭니다.

국산 AI 역량 내재화

내부 직원의 AI 역량을 키우고 국산 AI 생태계에 기여합니다.