토큰화의 정의: 생성형 AI, Web3

맥킨지 2024 리포트를 바탕으로 토큰화 기술의 전방위적 확산을 분석했습니다. LLM의 언어 토큰화 방식부터 금융 자산의 디지털화, 거래 정산 혁신까지 토큰화가 바꾸는 산업의 미래를 소개합니다.

디지털 큐브들로 분해되는 고대 조각상의 3D 일러스트. 하늘색 배경에 '토큰화의 정의 — 생성형 AI와 Web 3의 기반 by McKinsey & Company'라는 텍스트가 적혀 있다.

이 글은 McKinsey & Company의 2024년 리포트 “McKinsey Explainers, What is tokenization?” 내용을 번역, 요약, 의역 및 재구성한 글입니다.

토큰화(Tokenization)란?

토큰화의 목적

  1. 민감한 데이터를 보호하기 위함
  2. 대량의 데이터를 효율적으로 처리하기 위함

토큰화가 가능한 것들

생성형 AI, Web3, 핀테크(FinTech)의 공통점 = ‘토큰화’

1. 생성형 AI

2. Web3

3. 핀테크

토큰화를 통해 만들어진 토큰의 예시

거대 언어 모델에 토큰화가 어떻게 사용되는가?

생성형 AI 기초 지식 정리

생성형 AI에 토큰화가 적용되는 과정

  1. LLM에 텍스트가 입력됨
  2. LLM이 텍스트를 토큰으로 쪼갬
  3. 각 토큰들은 특정한 숫자 구분자(numerical identifier)를 부여받음
  4. 각 토큰들은 다시 LLM에 입력되어 처리됨
  5. LLM은 각 토큰들에 대한 관계를 학습하고, 패턴을 기반으로 답변을 형성

LLM에 적용되는 토큰화 기술

1. 단어 토큰화

2. 문자(character) 토큰화

3. 보조 단어(subword) 토큰화

4. 형태소(morphological) 토큰화

Web3 내 자산의 토큰화 과정

Web3 기초 지식 정리

1. 블록체인(blockchain)

2. 스마트 컨트랙트(smart contract)

3. 디지털 자산과 토큰

Web3 내 자산의 토큰화 과정

  1. 자산 소싱: 토큰화할 자산을 결정. 해당 자산이 증권으로 취급될지, 상품으로 취급될지, 그리고 어떤 규제 정책이 적용될지 파악
  2. 디지털 자산 발행 및 보관(custody): 물리적 대응물을 가지고 있다면 양 당사자에게 중립적인 보안 시설로 옮겨져야 함. 이후 토큰, 네트워크 및 규제 정책을 수립하여 블록체인 내 자산의 전자적 표시 방식을 만들어냄
  3. 배포 및 거래: 투자자는 디지털 자산을 저장할 디지털 지갑을 설정. 자산에 따라, 공식 거래소의 대안으로 더 느슨하게 규제되는 2차 거래 장소가 만들어질 수 있음
  4. 자산 관리 및 데이터 조정(data reconciliation): 규제, 세금, 회계 보고, 기업 행위(corporate action) 공지 등

금융업 내 토큰화의 장점과 효용

1. 빠른 거래 정산(transaction settlement)

2. 운영 비용 절감

3. 접근의 민주화

4. 스마트 계약에 의한 향상된 투명성

5. 저렴하고 빠른 인프라