- 일시: 2025년 11월 10일(월) 오전 10시~12시
- 연사: 성철 Senior Research
Scientist (Pryon Inc.)
- 제목: Can your LLM Think Ahead
- ABSTRACT
최근 대형 언어모델(LLM)은 단순한 문장 생성에서 벗어나 수학, 코딩, 과학 등 복합적 추론이 필요한 문제까지 해결하며 인간의 사고 체계를 모방하기 시작했습니다. 그러나 이러한 자기회귀(autoregressive) 구조는 본질적으로 System 1적 직관적이고 즉각적인 사고에 치중되어 있으며, 계획적이고 단계적인 System 2적 사고(이성적·논리적 사고)를 완전히 구현하지는 못하고 있습니다.
본 세미나는 LLM이 ‘계획적으로 사고할 수 있는가?’라는
질문에 답하기 위해, 강화학습(RL)을 활용한 계획적 추론(planned reasoning) 및 도구 통합형 에이전트(agentic reasoning) 접근을 제시합니다. 특히, Group Relative Policy
Optimization(GRPO) 알고리즘을 이용해 모델이 스스로의 사고 경로를 평가·진화(self-evolution)하도록 학습시키며, MuSiQue 등 다중
단계(Multi-hop) 질의응답 벤치마크를 통해 System
2적 사고 능력을 계량적으로 검증합니다.
또한 Planner–Executor–Verifier–Generator로 구성된 멀티에이전트 프레임워크와 진화형 메모리 모듈(evolving
memory)을 통해 모델이 각 단계의 추론 과정을 기록, 검증, 갱신하며 장기적 문제 해결 능력을 향상시키는 방법을 소개합니다.
- BIOGRAPH
성철 박사는 현재 미국 인공지능 스타트업 프라이언(Pryon Inc.)에서 시니어 리서치 사이언티스트로
재직 중이며, 대규모 언어모델(LLM) 기반의 문서 검색
및 질의응답 시스템, 그리고 딥러닝 기반 자연어 이해 기술 연구를 주도하고 있다.
연세대학교에서 컴퓨터공학 학사, 미국 스토니브룩대학교에서 석사, 텍사스 A&M대학교에서 박사학위를 취득하였다. 박사 과정에서는 신경과학적 인지 모델링과 인공지능 학습 메커니즘을 연구했으며,
이후 IBM 왓슨 연구소에서 리서치 스태프 멤버로 근무하며 교육용 AI, 헬스케어, 클라우드 분석 시스템 등 다양한 AI 응용 분야를 개발했다.
주요 연구 분야는 정보 검색(Retrieval-Augmented
Generation), 질의응답(QA), 지식 추론(Reasoning)이며,
EMNLP, AIED 등 국제 학회에 논문을 발표하였다. 최근에는 문서 구조 이해와 검색
효율화를 위한 특허를 출원하는 등 산업과 학계를 잇는 연구를 활발히 수행하고 있다.
- 주관: 남창주 교수 연구실