프로세스는 컴퓨터에서 실행되고 있는 프로그램을 말하며 CPU 스케줄링의 대상이 되는 작업이라는 용어와 거의 같은 의미로 쓰인다. 스레드는 프로세스 내 작업의 흐름을 지칭한다.
프로그램이 메모리에 올라가면 프로세스가 되는 인스턴스화가 일어나고, 이후 운영체제의 CPU 스케줄러에 따라 CPU가 프로세스를 실행한다.
※ 인스턴스화 는 데이터 필드의 저장 유형 및 값과 같은 정보를 읽거나 지정하는 프로세스
3.3.1 프로세스와 컴파일 과정
- 프로세스는 프로그램으로부터 인스턴스화된 것을 말함
- 프로그램은 Chrome, 이를 두 번 클릭하면 크롬 프로세스가 시작되는 것
- 프로그램은 컴파일러가 컴파일 과정을 거쳐 컴퓨터가 이해할 수 있는 기계어로 번역되어 실행될 수 있는 파일이 되는 것을 의미하며 '컴파일 과정'이란 다음과 같다.
- 전처리
- 소스 코드의 주석을 제거하고 #include 등 헤더 파일을 병합하여 매크로를 치환한다.
- 컴파일러
- 오류 처리, 코드 최적화 작업을 하며 어셈블러로 변환한다.
- 어셈블러
- 어셈블러는 목적코드로 변환된다. 확장자는 운영체제마다 다른데 리눅스에서는 .o
- 링커
- 프로그램 내에 있는 라이브러리 함수 또는 다른 파일들과 목적 코드를 결합하여 실행 파일을 만든다.
- 실행 파일의 확장자는 .exe 또는 .out이라는 확장자를 갖는다.
- 정적 라이브러리와 동적 라이브러리
- 라이브러리는 정적 라이브러리와 동적 라이브러리로 나뉜다.
- 정적 라이브러리는 프로그램 빌드 시 라이브러리가 제공하는 모든 코드를 실행 파일에 넣는 방식으로 시스템 환경 등 외부 의존도가 낮고 코드 중복 등 메모리 효율성이 떨어지는 단점이 있음
- 동적 라이브러리는 프로그램 실행 시 필요할 때만 DLL이라는 함수 정보를 통해 참조하는 방식이며, 메모리 효율성에서의 장점과 외부 의존도가 높아진다는 단점이 있다.
3.3.2 프로세스의 상태
- 생성 상태
- 생성상태는 프로세스가 생성된 상태를 의미
- fork() 또는 exec() 함수를 통해 생성
- PCB가 할당된다.
- fork()
- 부모 프로세스의 주소공간을 그대로 복사하며, 새로운 자식 프로세스를 생성하는 함수
- 주소 공간만 복사할 뿐이지 부모 프로세스의 비동기 작업 등을 상속하지 않는다.
- exec()
- 새롭게 프로세스를 생성하는 함수
- 대기 상태
- 대기 상태(ready)는 메모리 공간이 충분하면 메모리를 할당받고 아니면 아닌 상태로 대기하고 있으며 CPU 스케줄러로부터 CPU 소유권이 넘어오기를 기다리는 상태
- 대기 중단 상태
- 메모리 부족으로 일시 중단된 상태
- 실행 상태
- CPU 소유권과 메모리를 할당받고 인스트럭션을 수행 중인 상태를 의미
- CPU burst가 일어났다고 표현함
- 중단 상태
- 어떤 이벤트가 발생한 이후 기다리며 프로세스가 차단된 상태
- I/O 디바이스에 의한 인터럽트로 이런 현상이 많이 발생
- ex) 프린터 인쇄 시작후 잠깐 멈추는 현상
- 일시 중단 상태
- 일시 중단 상태는 대기 중단과 유사합니다.
- 중단된 상태에서 프로스세가 실행되려고 했지만 메모리 부족으로 일시 중단된 상태
- 종료 상태
- 메모리와 CPU 소유권을 모두 놓고 가는 상태
- 종료는 자연스럽게 종료되는 것도 있지만 부모 프로세스가 자식 프로세스를 갖에시키는 비자발적 종료로 종료되는 것도 있다.
- 자식 프로세스에 할당된 자원의 한계치를 넘어서거나 부모 프로세스가 종료되거나 사용자가 process, kill 등 여러 명령어로 프로세스를 종료할 때 발생
3.3.3 프로세스의 메모리 구조
- 위에서부터 스택, 힙, 데이터, 코드영역로 나누어진다.
- 스택은 위에서부터 힙은 아래 주소부터 할당된다.
스택
- 지역변수, 매개변수, 함수가 저장되고 컴파일 시에 크기가 결정되며 '동적'인 특징을 가짐
- 스택영역은 함수가 함수를 재귀적으로 호출하면서 동적으로 크기가 늘어나는데 이때 힙과 스택의 메모리 영역이 겹치면 안 되기 때문에 힙과 스택 사이의 공간을 비운다.
힙
- 동적 할당 할 때 사용되며 런타임 시 크기가 결정된다.
- 벡터 같은 동적 배열은 힙에 동적 할당된다.
- '동적'인 특징을 가짐
데이터영역
- 전역변수, 정적변수가 저장되고 정적인 특징을 갖는 프로그램이 종료되면 사라지는 변수가 들어있는 영역
- BSS 영역과 Data 영역으로 나뉘고, BSS 영역은 초기화가 되지 않은 변수가 0으로 초기화되어 저장되며 Data 영역은 0이 아닌 다른 값으로 할당된 변수들이 저장된다.
코드 영역
- 코드 영역은 프로그램에 내장되어 있는 소스 코드가 들어가는 영역이다.
- 수정 불가능한 기계어로 저장되어 있으며 정적인 특징을 가짐
3.3.4 PCB
- PCB는 운영체제에서 프로세스에 대한 메타데이터를 저장한 '데이터'를 말함
- 프로세스가 생성되면 운영체제는 해당 PCB를 생성한다.
- 프로그램이 실행되면 프로세스가 생성되고 프로세스 주소 값들에 스택, 힙 등의 구조를 기반으로 메모리가 할당됨
- 그리고 이 프로세스의 메타데이터들이 PCB에 저장되어 관리 된다.
- 중요한 정보를 포함하고 있기 때문에 일반 사용자가 접근하지 못하도록 커널 스택의 가장 앞부분에서 관리된다.
PCB의 구조
- 프로세스 스케줄링 상태
- 프로세스 ID
- 프로세스 권한: 컴퓨터 자원 또는 I/O 디바이스에 대한 권한 정보
- 프로그램 카운터: 프로세스에서 실행해야 할 다음 명령어의 주소에 대한 정보
- CPU 레지스터: 프로세스를 실행하기 위해 저장해야할 레지스터에 대한 정보
- CPU 스케줄링 정보: CPU 스케줄러에 의해 중단된 시간 등에 대한 정보
- 계정정보: 프로세스에 실행에 사용된 CPU 사용량, 실행한 유저의 정보
- I/O 상태정보: 프로세스에 할당된 I/O 디바이스 목록
컨텍스트 스위칭
- 앞서 설명한 PCB를 교환하는 과정
- 한 프로세스에 할당된 시간이 끝나거나 인터럽트에 의해 발생
- 컴퓨터는 많은 프로그램을 동시에 실행하는 것처럼 보이지만 어떠한 시점에서 실행되고 있는 프로세스는 단 한 개 이며, 많은 프로세스가 동시에 구동되는 것처럼 보이는 것은 다른 프로세스와의 컨텍스트 스위칭이 아주 빠른 속도로 실행되기 때문이다.
- 현대 컴퓨터는 멀티코어의 CPU를 가지기 때문에 한 시점에 한 개의 프로그램은 틀린 설명
- 그러나 컨텍스트 스위칭을 설명할 때는 싱글코어를 기준으로 설명한다.
캐시미스
- 컨텍스트 스위칭이 일어날 때 프로세스가 가지고 있는 메모리 주소가 그대로 있으면 잘못된 주소 변환이 생기므로 캐시클리어 과정을 겪게 되고 이 때문에 캐시미스가 발생
스레드에서의 컨텍스트 스위칭
- 이 컨텍스트 스위칭은 스레드에서 일어난다.
- 스택영역을 제외한 모든 메모리를 공유하기 때문에 스레드 컨텍스트 스위칭의 경우 비용이 더 적고 시간도 더 적게 걸린다.
'CS' 카테고리의 다른 글
CPU 스케줄링 알고리즘 (0) | 2022.09.07 |
---|---|
프로세스와 스레드(2) (0) | 2022.09.05 |
3.2 메모리 (0) | 2022.09.02 |
3.1 운영체제와 컴퓨터 (0) | 2022.08.31 |
2.5 HTTP (2) (0) | 2022.08.29 |