LLM 할루시네이션이란 무엇일까요? LLM(대규모 언어 모델) 할루시네이션은 모델이 실제로 사실이 아닌 정보를 생성하는 현상을 말합니다. 이는 LLM이 학습 데이터의 패턴을 과도하게 일반화하거나 학습 데이터에 없는 새로운 정보를 만들어내기 때문입니다. 할루시네이션의 특징 사실과 다른 정보 LLM은 학습 데이터에 존재하지 않는 정보를 만들어낼 수 있습니다. 논리적 오류 LLM은 논리적으로 일관성이 없는 문장이나 이야기를 만들어낼 수 있습니다. 편향 LLM은 학습 데이터의 편향을 반영하여 편향된 정보를 만들어낼 수 있습니다. 할루시네이션의 위험 잘못된 정보 LLM은 사실이 아닌 정보를 만들어낼 수 있어 사용자가 잘못된 정보를 믿게 만들 수 있습니다. 편향된 정보 LLM은 학습 데이터의 편향을 반영하여 편향된..
RAG는 Retrieval Augmented Generation의 약자로, 검색 증강 생성이라는 뜻입니다. 이는 **대규모 언어 모델(LLM)**의 성능을 향상시키기 위한 기술입니다. LLM은 방대한 양의 텍스트 데이터를 학습하여 텍스트 생성, 번역, 질의응답 등 다양한 작업을 수행할 수 있습니다. 하지만 LLM은 학습 데이터 외부의 정보에 접근하지 못하고, 생성된 텍스트의 정확성과 신뢰성이 부족할 수 있습니다. RAG는 LLM의 부족한 부분을 검색 기술로 보완합니다. RAG는 LLM에게 질문을 주면, 먼저 검색 엔진을 사용하여 관련 정보를 검색합니다. 그리고 검색된 정보를 바탕으로 LLM이 텍스트를 생성합니다. 이렇게 하면 LLM이 학습 데이터 외부의 정보도 활용할 수 있고, 생성된 텍스트의 정확성과 ..
LLMOps는 "Large Language Model Operations"의 약어로, 대규모 언어 모델의 운영과 관리를 의미합니다. 이는 대용량 언어 모델의 훈련, 배포, 업데이트 및 모니터링과 같은 작업을 포함합니다. LLMOps는 기업이나 조직이 언어 모델을 효율적으로 관리하고 운영할 수 있도록 돕는 전략과 방법론을 포함합니다. LLMOps의 목표는 언어 모델의 안정성, 성능, 확장성 및 보안을 보장하면서 모델의 운영 비용을 최소화하는 것입니다. 이를 위해 LLMOps는 다음과 같은 작업을 수행할 수 있습니다: 데이터 관리: 대규모 언어 모델을 훈련시키기 위해 필요한 데이터를 수집, 정제 및 관리하는 작업입니다. 데이터의 품질과 다양성은 모델의 성능에 직접적인 영향을 미치므로, 데이터 관리는 매우 중..
프롬프트 엔지니어링(Prompt Engineering)은 인공지능 모델의 사용에 있어 중요한 요소로, 입력에 대한 효과적인 가이드를 제공하는 과정으로 정의됩니다. 이는 사용자가 입력하는 정보를 조정하고 개선함으로써, 인공지능 모델이 원하는 결과를 산출하기 위한 방법론입니다. 이러한 프롬프트 엔지니어링은 특정 목적을 가지고 수행될 수 있으며, 그 중 몇 가지를 소개하면 다음과 같습니다: 첫째로, 명확한 지시 제공이 있습니다. 이는 모델이 원하는 유형의 답변을 얻기 위해 사용자가 입력에 명확하고 구체적인 지시를 포함하는 것을 의미합니다. 예를 들어, "번역해주세요: '안녕하세요'"라는 구체적인 지시를 통해 번역을 요청하는 프롬프트를 사용할 수 있습니다. 이렇게 명확한 지시를 제공함으로써, 모델은 사용자의 의..
MNIST 데이터셋을 신경망으로 학습시키며 딥러닝에 대한 맛을 보자. 인공지능에 관심이 있는 분이라면 MNIST를 처음 듣는 사람은 없을 것이다. 하지만 인공지능 분야에 첫걸음을 때는 사람을 위해 간략히 MNIST에 대해 설명하고 넘어가도록 하자. MNIST는 손으로 쓴 숫자들의 이미지를 모아놓은 데이터 셋으로 0~9까지의 수를 28 * 28픽셀 크기의 이미지로 구성해 놓은 것이다. MNIST 학습은 머신러닝을 공부하는 사람이라면 누구가 거쳐 가는 프로그래밍에 Hello World라고도 불리운다. 지금부터 텐서플로에 내장된 MNIST 데이터를 기반으로 학습하는 과정을 살펴보자. 1. 데이터 가져오기 가장 먼저 텐서플로를 임포트하고 텐서플로에 대장된 tensorflow.example.tutorials.mn..
현재 딥러닝 라이브러리와 프레임워크는 너무나 많이 존재한다. 그 중 유독 텐서플로를 사용하는 것이 급증한데에는 텐서보드의 역할도 크다고 한다. 딥러닝을 현업에서 활용하다 보면 학습하는데 걸리는 시간이 아주 상당하다. 따라서 모델을 효과적으로 실험하려면 학습 과정을 추적하는 일이 매우 중요해진다. 하지만 학습 과정을 추적하는데에도 별도의 추가 작업이 많이 필요한 실정이다. 이러한 개발자의 어려움을 덜어주고자 텐서플로는 텐서보드라는 도구를 기본적으로 제공하고 있다. 텐서보드는 학습하는 중간중간 손실값이나 정확도 또는 결과물로 나온 이미지나 사운드 파일들을 다양한 방식으로 시각화해 보여준다. 더 놀라운 점은 이러한 도구를 사용하는데 코드 몇줄만 추가하면 된다는 것이다. 1. 데이터를 읽고 필요한 변수를 pla..
1. 모델 저장하기에 앞서 파일에 있는 데이터를 가져오는 것부터 알아보자. import tensorflow as tf import numpy as np data = np.loadtxt('file path', delimiter=',',unpack=True,dtype='float32') x_data = np.transpose(data[0:2]) y_data = np.transpose(data[2:]) [참고] numpy 라이브러리의 loadtxt함수를 이용하여 간단히 데이터를 읽어 올 수 있다. loadtxt의 unpack 매개 변수와 transpose함수는 읽어드린 데이터의 행과 열을 뒤바꿔주는 옵션과 함수이다. 특히 딥러닝에서는 다양한 학습 알고리즘을 적용하거나 행렬 연산을 효율적으로 하기 위해 데이터의..
Microsoft Cognitive Toolkit (CNTK)는 마이크로 소프트에 오픈소스 딥러닝 툴킷이다. 올해에 가장 HOT한 IT분야는 누가 뭐라고 해도 AI 분야인 것 같다. 수없이 많이 쏟아 지는 지식 공유의 장인 세미나의 주제들만 보아도 쉽게 알 수 있고 여러 언론 매체에도 빠지지 않고 등장하는 주제 이다. 다양한 통로를 통해 AI에 한걸음 다가가 살펴 보자. AI가 적용된 다양하고 폭넓은 사례에 대해 알아가고 AI기술의 매력을 알아 갈수록 많은 문제를 해결해 줄 것 같은 마법과도 같다고 느낄 것이다. 이와 같이 많은 시선의 집중은 그만큼 관련 분야의 기술이 빠르게 변화하고 발전하고 있다는 것을 말한다. 특히 요즘 AI 기술에 발전 방향을 살펴 보면 '보다 쉽게 보다 효율적으로' 인 것 같..
시간이 갈 수록 머신 러닝의 인기가 하늘을 찌르고 있다. 많은 분야에 빠르게 녹아 들어가고 있는 머신 러닝 기술을 보면 더 이상 일시적인 유행이라 보기는 힘들다. 모여드는 관심 만큼 빠르게 발전할 것이며 기술은 견고해져 갈 것이다. 가까운 미래에는 아마 머신 러닝이 적용되지 않은 분야를 찾아보기 힘들 정도로 머신 러닝은 넓고 빠르게 퍼져 갈 것이다. 기술이 발전하면서 점점 그 기술을 쉽게 사용할 수 있는 툴들이 많이 태어난다.이렇게 나온 툴들 덕분에 쉽게 기술에 접할 수 있게 되면서 기술에 문턱이 낮아지게 되면 그 기술을 많은 사람이 찾게 된다. 그리고 이렇게 모여든 사람들이 힘을 모아 그 기술을 더욱 훌륭하게 발전시켜 나아가게 된다. 오랫동안 사랑 받아온 기술들은 이와 같은 패턴을 공통적으로 가지고 ..
[NAVER에 CLAIR(CLova AI research)에서 사용하고 있는 AI개발자 실험을 돕는 온라인 도구] AI 연구를 도와주는 많은 도구들이 탄생하고 있습니다. Tensorflow, Caffe, Pytorch등 다양한 Framework의 탄생으로 AI분야의 기술들은 하루 하루 엄청난 속도를 더해 발전해 나아 가고 있죠. 이러한 도구들 없이 머신 러닝을 연구한다는 것은 쉽게 상상 할 수 없는 일이 되어버렸습니다. 만약 위와 같은 도구들이 없었다면 머신러닝 분야는 이와 같이 발전할 수 있었을까요? 수많은 연구원들이 매번 복잡한 수식들을 직접 코드로 옮기다 지쳐 하나 둘 뒤돌아 섰을 것이고 사람들의 관심이 점점 식어 머신러닝 분야는 다시 빙하기를 겪었을지도 모릅니다. 이와 같이 편리한 Framewor..
- Total
- Today
- Yesterday
- HTTP
- tensorflow
- 텐서플로우
- 자바
- it
- 빅데이터
- Rest
- API
- http client
- llm
- 프로그램
- 교육
- SW
- ai
- 데이터플랫폼설계
- okhttp
- Java
- rest api
- HttpClient
- 인공지능
- 머신러닝
- java8
- 소프트웨어
- mlops
- 데이터파이프라인
- Spring
- 딥러닝
- 데이터플랫폼
- 소프트웨어교육
- AWS
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |