yunki Kim Blog

「Do What You Love」

Chapter 3. 당신은 LLM과 그 사용법을 오해하고 있다.

1. 할루시네이션(hallucination), AI가 문제인가? 사람이 문제인가? AI가 잘못된 정보를 마치 진실처럼 전달하는 현상을 할루시네이션이라 부른다. 많은 사람들이 할루시네이션에 대해 예민하게 반응하는데, 이는 LLM을 만물을 이해하는 박사처럼 이해하기 때문이다. 사실 LLM은 인간이 언어를 사용하는 방식에 대해 이해하고 학습한 A...

Chapter 2. 모든 것은 어텐션으로부터 시작되었다.

1. 챗 GPT, 바트 LaMDA, PaLM, LLaMA까지 초거대 AI의 공통점음? GPT, 라마 등 대부분의 LLM AI는 구글이 개발한 트랜스포머(transformer)라는 AI 기술을 개조해 만든 것이다. 그리고 트랜스포머는 어텐션(Attention)이라는 기술을 바탕으로 만들어진 AI이다. 때문에 현태의 초거대 AI는 태생적으로 어텐션...

Chapter 1. 프롬프트 엔지니어링은 질문을 잘하는 것이 아니다.

1. 프롬프트란 무엇인가? 프롬프트란 컴퓨터가 사람에게 보여주기 위해 화면에 띄워 두는 글자를 의미한다. 2. 프롬프트 엔지니어링에 대한 저자의 정의 통상적으로 프롬프트 엔지니어링이라 하면 질문을 잘하는 방법을 떠올리지만 이것은 오해이다. 질문을 하는 방법 외에도 다양한 기법이 존재하기 때문이다. “프롬프트는 컴퓨터가 사용자에게 ...

1장 프로덕트 매니지먼트란 무엇인가?

1.1 프로덕트 정의 프로덕트 관점에서 보면 부품은 ‘컴포넌트(component)’다. 컴포넌트는 프로덕트로 동작하지 않으며 프로덕트로 릴리스하지도 않는다. 다른 컴포넌트나 프로덕트에 의존성을 가지면서 협업을 통해 전체 프로덕트를 구성하고 동작하게 하는 데 목적이 있다. 컴포넌트 → 컴포넌트 세트(인스턴스) → 프로덕트 ...

분산 데이터베이스 시스템과 트랜잭션

1. 분산 데이터베이스 시스템 분산 데이터베이스 시스템에서는 각 노드가 메인 메모리나 디스크를 공유하지 않고 인터넷 같은 통신 매체를 통해 서로 통신한다. 분산 데이터베이스는 다음과 같은 특성을 가진다. 분산 데이터베이스는 지리적으로 떨어진 사이트를 갖기 때문에 단일 데이터 센터 내의 네트워크에 비해 다음과 같은 단점을 갖는다. ...

트랜잭션(Transaction)

posting: 2022-05-01, update: 2023-10-06 1. 트랜잭션 개념 트랜잭션은 다양한 데이터 항목에 접근하고 갱신하는 프로그램 수행의 단위이다. 트랜잭션은 여러 연산으로 구성되어 있지만 사용자에게는 하나의 나눌 수 없는 단위로 보여야 한다. 여기서 ”하나의 나눌 수 없는 단위“라는 말이 매우 중요하다. 이것으로부터 트랜잭션...

가비지 수집 기초

자바 가비지 수집의 요체는 시스템에 있는 모든 객체의 수명을 정확히 몰라도 런타임이 대신 객체를 추적하며 쓸모없는 객체를 알아서 제거하는 것이다. 모든 가비지 수집 구현체는 다음과 같은 원칙을 지켜야 한다. 알고리즘은 반드시 모든 가비지를 수집해야 한다. 살아 있는 객체는 절대로 수집해선 안된다. segmentation ...

열 지향 저장소(column-oriented storage)

데이터베이스는 통상적으로 한 레코드에 존재하는 모든 속성과 데이터를 하나의 레코드로 저장하고, 이 레코드들을 파일에 저장한다. 이러한 방식을 행 기반 저장소(row-oriented storage) 리고 한다. 이와 반대로 열 지향 저장소는 속성을 기준으로 그 속성에 해당하는 모든 연속된 값들을 함께 저장한다. 가장 간단한 열 지향 저장소는 속성 별로 ...

분산시스템

값이 싸고 크기가 작은 컴퓨터를 네트워크로 묶어 대형 컴퓨터 같은 능력을 가진 시스템을 만드는 것을 분산 시스템이라 한다. 분산 시스템 내의 컴퓨터는 각자 작업을 처리하고 그 내용이나 결과를 서로 공유한다. 분산 시스템 장점은 다음과 같다. 네트워크로 연결된 기기가 여러 자원을 공유할 수 있다. load balancing을 통해 여러 기기가 ...

공연 정보 수집 자동화하기

자동화한 부분 프로젝트를 하면서 공연 정보를 다음과 같이 보여주어야 했습니다. 그런데 공연 정보들을 모아주는 기능이 없다 보니, 팀원들이 인터넷에서 공연 정보를 찾고 등록하는 일을 모두 수동으로 진행해야 했습니다. 때문에 공연 정보를 업데이트하기 위해선 다음과 같은 절차를 따라야 했습니다. 자신이 맡은 공연 카테고리(연극, 전시 등)와 공연이 ...