RAG는 Retrieval Augmented Generation의 약자로, 검색 증강 생성이라는 뜻입니다. 이는 **대규모 언어 모델(LLM)**의 성능을 향상시키기 위한 기술입니다. LLM은 방대한 양의 텍스트 데이터를 학습하여 텍스트 생성, 번역, 질의응답 등 다양한 작업을 수행할 수 있습니다. 하지만 LLM은 학습 데이터 외부의 정보에 접근하지 못하고, 생성된 텍스트의 정확성과 신뢰성이 부족할 수 있습니다. RAG는 LLM의 부족한 부분을 검색 기술로 보완합니다. RAG는 LLM에게 질문을 주면, 먼저 검색 엔진을 사용하여 관련 정보를 검색합니다. 그리고 검색된 정보를 바탕으로 LLM이 텍스트를 생성합니다. 이렇게 하면 LLM이 학습 데이터 외부의 정보도 활용할 수 있고, 생성된 텍스트의 정확성과 ..
플랫폼 엔지니어링은 안정적이고 확장 가능한 플랫폼을 구축하는데 중점을 둔 엔지니어링 분야입니다. 주로 대규모 시스템의 아키텍처 설계, 인프라스트럭처 관리 및 운영, 자동화, 문제 해결, 성능 최적화, 보안 및 규정 준수 등을 담당합니다. 플랫폼 엔지니어는 다음과 같은 주요 역할을 수행합니다: 아키텍처 설계: 대규모 시스템의 아키텍처를 설계하고 구축합니다. 이는 시스템의 안정성, 확장성 및 성능을 보장하기 위해 중요한 단계입니다. 인프라스트럭처 관리: 서버, 네트워크, 스토리지 등의 인프라스트럭처를 관리하고 운영합니다. 이는 시스템의 안정성과 가용성을 유지하기 위해 필수적입니다. 자동화: 자동화 도구와 프로세스를 구축하여 반복적이고 시간 소모적인 작업을 자동화합니다. 이는 작업의 효율성과 일관성을 향상시키..
Ansible과 Terraform은 모두 인프라스트럭처 자동화 도구입니다. 하지만 각각의 목적과 사용 방식에 차이가 있습니다. Ansible은 설정 관리 도구이며, 서버 구성, 소프트웨어 배포, 네트워크 구성 등과 같은 작업을 자동화하는 데 사용됩니다. Ansible은 에이전트 없이 SSH를 통해 서버에 연결하여 작업을 수행하며, YAML을 사용하여 작업을 정의합니다. Ansible은 선언적인 언어로 작성되어 있어, 원하는 상태를 설명하고 Ansible이 해당 상태로 변경하도록 지시할 수 있습니다. 반면에 Terraform은 인프라스트럭처 프로비저닝 도구입니다. 클라우드 서비스 공급자 (예: AWS, Azure, Google Cloud)와 같은 인프라스트럭처를 프로그래밍 방식으로 관리할 수 있습니다. T..
LLMOps는 "Large Language Model Operations"의 약어로, 대규모 언어 모델의 운영과 관리를 의미합니다. 이는 대용량 언어 모델의 훈련, 배포, 업데이트 및 모니터링과 같은 작업을 포함합니다. LLMOps는 기업이나 조직이 언어 모델을 효율적으로 관리하고 운영할 수 있도록 돕는 전략과 방법론을 포함합니다. LLMOps의 목표는 언어 모델의 안정성, 성능, 확장성 및 보안을 보장하면서 모델의 운영 비용을 최소화하는 것입니다. 이를 위해 LLMOps는 다음과 같은 작업을 수행할 수 있습니다: 데이터 관리: 대규모 언어 모델을 훈련시키기 위해 필요한 데이터를 수집, 정제 및 관리하는 작업입니다. 데이터의 품질과 다양성은 모델의 성능에 직접적인 영향을 미치므로, 데이터 관리는 매우 중..
구분 내용 -Djava.awt.headless 그래픽 사용자 인터페이스 (GUI)를 지원하는 환경에서 Java 애플리케이션을 실행할 때 사용됩니다. 이 설정은 화면이 없는 서버 환경에서 Java 애플리케이션을 실행할 때 유용합니다. java.awt.headless 시스템 속성을 true로 설정하면, Java 애플리케이션은 그래픽 환경이 없는 "헤드리스" 모드로 실행됩니다. 이 모드에서는 그래픽 화면이 없기 때문에 그래픽 관련 작업을 수행할 수 없습니다. 대신, 이 모드에서는 그래픽 작업을 대신할 수 있는 대체 수단을 사용하게 됩니다. 이러한 설정은 주로 웹 서버, 배치 프로세스 또는 백그라운드 작업과 같이 그래픽 환경이 필요하지 않은 Java 애플리케이션을 개발하고 실행할 때 유용합니다. 이렇게 설정을 ..
SRE 개념에 대해 알아보자! SRE는 Site Reliability Engineering의 약자로, Google에서 시작된 용어입니다. 이 용어는 "소프트웨어를 구축하고 운영하는 데 있어서의 신뢰성, 확장성, 그리고 효율성을 책임지는 엔지니어링 팀"을 특별히 지칭합니다. 이 팀은 소프트웨어의 안정적인 작동과 확장 가능성을 보장하며, 시스템의 효율성을 극대화하는 데 중점을 둡니다. SRE의 핵심 원칙은 세 가지 주요 요소로 구성되어 있습니다: 첫째로, **서비스 수준 목표(Service Level Objectives, SLO)**가 있습니다. SRE 팀은 시스템의 장애율, 성능, 그 외 다른 중요한 지표에 대한 목표를 설정합니다. 이 목표는 서비스 수준 합의(Service Level Agreement, ..
프롬프트 엔지니어링(Prompt Engineering)은 인공지능 모델의 사용에 있어 중요한 요소로, 입력에 대한 효과적인 가이드를 제공하는 과정으로 정의됩니다. 이는 사용자가 입력하는 정보를 조정하고 개선함으로써, 인공지능 모델이 원하는 결과를 산출하기 위한 방법론입니다. 이러한 프롬프트 엔지니어링은 특정 목적을 가지고 수행될 수 있으며, 그 중 몇 가지를 소개하면 다음과 같습니다: 첫째로, 명확한 지시 제공이 있습니다. 이는 모델이 원하는 유형의 답변을 얻기 위해 사용자가 입력에 명확하고 구체적인 지시를 포함하는 것을 의미합니다. 예를 들어, "번역해주세요: '안녕하세요'"라는 구체적인 지시를 통해 번역을 요청하는 프롬프트를 사용할 수 있습니다. 이렇게 명확한 지시를 제공함으로써, 모델은 사용자의 의..
Graal VM 이란? Graal VM은 Oracle이 개발한 고성능 가상 머신입니다. Graal VM은 다양한 언어를 지원하며, 특히 Java 언어에 최적화되어 있습니다. 이 가상 머신은 기존의 JVM(Java Virtual Machine)과는 다른 컴파일러를 사용하여 더 빠른 실행 속도와 낮은 메모리 사용량을 제공합니다. Graal VM은 JIT(Just-In-Time) 컴파일러와 AOT(Ahead-of-Time) 컴파일러를 모두 지원하여, 실행 시점에 최적화된 코드를 생성하거나 미리 컴파일하여 더 효율적인 실행을 가능하게 합니다. 또한, 다른 언어를 JVM 위에서 실행할 수 있는 기능을 제공하여, 다양한 언어 간의 상호 운용성을 향상시킬 수 있습니다. Graal VM은 다양한 분야에서 사용될 수 있..
RPS와 TPS는 부하 테스트에 사용되는 용어로서, 각각 'Requests Per Second'(초당 요청 수)와 'Transactions Per Second'(초당 거래 수)를 의미합니다. 이 두 용어는 시스템의 성능을 측정하는 데 사용되며, 그 차이점은 다음과 같습니다: 구분 내용 Requests Per Second(RPS) 이는 시스템이 초당 처리할 수 있는 요청의 수를 나타냅니다. 이는 부하 테스트에서 시스템의 처리 능력을 측정하는 데 사용되며, HTTP 요청과 같은 단순한 통신을 참조합니다. Transactions Per Second(TPS) 이는 시스템이 초당 처리할 수 있는 거래의 수를 나타냅니다. 거래는 단순한 요청보다 복잡하며, 일반적으로 여러 단계의 처리와 데이터의 변화를 포함합니다. ..
OpenTelemetry는 소프트웨어 응용 프로그램을 계기, 감시 및 관리하는 데 도움이 되도록 설계된 관찰 가능성 프레임워크입니다. 이는 분산 시스템에서 추적하고 모니터링을 원활하게하기 위한 API, 라이브러리, 에이전트, 계측 및 계측 표준 세트를 제공합니다. OpenTelemetry의 주요 구성 요소는 다음과 같습니다. 추적: OpenTelemetry는 다양한 프로그래밍 언어를 포함하여 분산 시스템 내에서 요청이 통과 할 때 추적할 수 있도록 돕는다. 이는 성능 병목 현상을 식별하고 문제를 해결하며 전반적인 시스템을 최적화하는 데 도움이됩니다. 메트릭: OpenTelemetry는 응용 프로그램에서 성능 메트릭을 수집하고 모니터링하는 기능을 지원합니다. 이는 핵심 성능 지표 및 메트릭을 캡처하여 소프..
- Total
- Today
- Yesterday
- Spring
- ai
- 데이터
- tensorflow
- springboot
- llm
- 데이터플랫폼
- 소프트웨어교육
- 딥러닝
- 빅데이터
- rest api
- 프롬프트엔지니어링
- 소프트웨어
- it
- AWS
- Java
- 데이터플랫폼설계
- API
- 인공지능
- okhttp
- 교육
- http client
- SW
- 머신러닝
- Rest
- java8
- 쿠버네티스
- 데이터파이프라인
- mlops
- 텐서플로우
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |