본문 바로가기
소프트웨어 및 프로그래밍

기초) 문자열 인코딩

by 규봉봉이 2025. 6. 26.

문자 코드체계
숫자 데이터를 문자로 맵핑한 규칙
0을 포함한 양의 정수 = 문자
그렇기 때문에 당연히 문자에 사칙 연산이 적용될 수 있다
대표적인게 ASCII 코드

코드체계와 인코딩은 다른것
코드체계는 코드와 숫자를 맵핑한 것이고 (ASCII, unicode)
인코딩은 이러한 숫자를 비트배열화하는 작업 (UTF-8, UTF-16)

8-bit unicode 변환
utf-8은 대부분 웹에서 표준처럼 사용되는 인코딩 규칙
utf-8 변환규칙
첫 바이트 정보에 글자 당 길이 표시
0xxx xxxx 1바이트
110x xxxx 2바이트
1110 xxxx 3바이트
1111 0xxx 4바이트
두번째 바이트부터는 모두 10xx xxxx 형태