본문 바로가기

Cot

(4)
추론 모델이 항상 자신의 생각을 말하는 것은 아닙니다. - CoT의 진실을 파헤치다 최근 등장한 고성능 인공지능(AI) 모델들은 단순한 질문 응답을 넘어, 스스로 ‘생각의 흐름(Chain-of-Thought, 이하 CoT)’ 을 설명하는 능력을 보여줍니다. 말 그대로 AI가 문제를 푸는 과정을 글로 써 내려가는 것이죠.이를 통해 AI가 어떻게 답을 도출했는지를 확인할 수 있고, 잘못된 판단이나 위험한 행동을 사전에 감지할 수 있을 것이라 기대되고 있습니다.하지만, 정말 그럴까요?Anthropic 연구팀은 최근 Claude 3.7 Sonnet과 DeepSeek R1 같은 대표적인 추론 AI 모델을 대상으로 “CoT 설명이 실제 사고 과정을 얼마나 잘 반영하는가”, 즉 ‘진실성(Faithfulness)’ 을 실험했습니다. 결과는 놀랍게도 상당수 AI가 실제로 사용한 정보를 CoT에서 숨기고..
AI는 어떻게 추론할까? - CoT (Chain of Thought) 기법의 혁명 1. CoT가 나온 배경 및 주요 아이디어AI와 자연어 처리(NLP) 분야에서 모델의 성능을 높이기 위해 모델 크기를 확장하는 것은 일반적인 전략이었습니다. 특히 수십억 개의 파라미터를 가진 대형 언어 모델들은 감성 분석이나 주제 분류와 같은 단순한 작업에서 우수한 성과를 보였습니다. 하지만 논리적 추론, 수학적 문제 해결, 상식적 추론과 같은 복잡한 다단계 문제에서는 모델 크기만으로는 한계가 드러났습니다.이러한 문제를 해결하기 위해 등장한 것이 Chain of Thought (CoT) 기법입니다. CoT는 모델이 사람처럼 사고의 흐름을 통해 문제를 풀 수 있도록 도와줍니다. 즉, 한 번에 전체 문제를 해결하려고 하지 않고, 문제를 여러 단계로 나눠서 해결하는 방법을 사용하는 것입니다. CoT는 모델이 ..
[프롬프트 엔지니어링] Chain-of-Thought (CoT) Prompting란 무엇인가? Chain-of-Thought (CoT) prompting은 언어 모델이 복잡한 추론 작업을 수행할 때 중간 단계의 추론 과정을 명시적으로 보여주는 기술입니다. 이는 모델이 단계를 밟아가며 문제를 해결하도록 유도하여 정확성을 높이는 방법입니다. 전문가의 관점에서 Chain-of-Thought prompting의 주요 요소와 장점을 다음과 같이 정리할 수 있습니다: 개념과 원리추론 과정의 시각화: CoT는 모델이 문제를 해결하는 데 필요한 중간 추론 단계를 명시적으로 작성하도록 유도합니다. 이는 사람의 사고 과정과 유사하며, 단계별로 문제를 해결하는 방식입니다.복잡한 문제 해결: 특히 복잡한 수학 문제, 논리 퍼즐, 다단계 추론이 필요한 질문 등에 유용합니다. 단계별 접근은 모델이 각 단계에서 필요한 정보..
[Prompt Engineering] ReAct이란 무엇인가?!! ReAct(Reason + Act)는 대규모 언어 모델(LLM)의 추론 및 행동 능력을 향상시키는 프롬프트 엔지니어링 기법입니다. 인간의 사고 방식에서 영감을 얻은 ReAct는 LLM에게 명확한 추론 과정과 함께 작업을 수행하도록 지시합니다. 이를 통해 모델은 보다 정확하고 신뢰할 수 있는 결과를 생성할 수 있으며, 특히 상식 추론과 관련된 복잡한 작업에 효과적입니다.ReAct 작동 방식구분내용 행동 지시 먼저 사용자는 LLM에게 수행할 작업을 명확하게 지시합니다. 이 지침은 간단하고 명료하며 LLM이 쉽게 이해할 수 있는 언어로 작성되어야 합니다. 추론 과정 생성 LLM은 지시에 따라 작업을 완료하기 위한 단계별 추론 과정을 생성합니다. 이 추론 과정은 중간 단계와 결론을 포함하여 명확하고 논리적이어야..