一区二区三区伦理视频,色色五月天一区二区

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

如果讓你來設(shè)計進程調(diào)度，你會怎么辦？

void main(void) {
    ...    
    move_to_user_mode();
    if (!fork()) {
        init();
    }
    for(;;) pause();
}

今天，本來應(yīng)該再往下講 fork。

但這個是創(chuàng)建新進程的過程，是一個很能體現(xiàn)操作系統(tǒng)設(shè)計的地方。

所以我們先別急著看代碼，我們今天就頭腦風(fēng)暴一下，就是如果讓你來設(shè)計整個進程調(diào)度，你會怎么搞? 別告訴我你先設(shè)計鎖、設(shè)計 volatile 啥的，這都不是進程調(diào)度本身需要關(guān)心的最根本問題。

進程調(diào)度本質(zhì)是什么?很簡單，假如有三段代碼被加載到內(nèi)存中。

進程調(diào)度就是讓 CPU 一會去程序 1 的位置處運行一段時間，一會去程序 2 的位置處運行一段時間。

嗯，就這么簡單，別反駁我，接著往下看。

整體流程設(shè)計

如何做到剛剛說的，一會去這運行，一會去那運行?

第一種辦法就是，程序 1 的代碼里，每隔幾行就寫一段代碼，主動放棄自己的執(zhí)行權(quán)，跳轉(zhuǎn)到程序 2 的地方運行。然后程序 2 也是如此。

但這種依靠程序自己的辦法肯定不靠譜。所以第二種辦法就是，由一個不受任何程序控制的，第三方的不可抗力，每隔一段時間就中斷一下 CPU 的運行，然后跳轉(zhuǎn)到一個特殊的程序那里，這個程序通過某種方式獲取到 CPU 下一個要運行的程序的地址，然后跳轉(zhuǎn)過去。這個每隔一段時間就中斷 CPU 的不可抗力，就是由定時器觸發(fā)的時鐘中斷。

不知道你是否還記得，這個定時器和時鐘中斷，早在第18回 | 大名鼎鼎的進程調(diào)度就是從這里開始的里講的 sched_init 函數(shù)里就搞定了。

而那個特殊的程序，就是具體的進程調(diào)度函數(shù)了。好了，整個流程就這樣處理完了，那么應(yīng)該設(shè)計什么樣的數(shù)據(jù)結(jié)構(gòu)，來支持這個流程呢?不妨假設(shè)這個結(jié)構(gòu)叫 tast_struct。

struct task_struct {
    ?
}

換句話說，你總得有一個結(jié)構(gòu)來記錄各個進程的信息，比如它上一次執(zhí)行到哪里了，要不 CPU 就算決定好了要跳轉(zhuǎn)到你這個進程上運行，具體跳到哪一行運行，總得有個地方存吧?

我們一個個問題拋開來看。

上下文環(huán)境

每個程序最終的本質(zhì)就是執(zhí)行指令。這個過程會涉及寄存器，內(nèi)存和外設(shè)端口。內(nèi)存還有可能設(shè)計成相互錯開的，互不干擾，比如進程 1 你就用 0~1K 的內(nèi)存空間，進程 2 就用 1K~2K 的內(nèi)存空間，咱誰也別影響誰。

雖然有點浪費空間，而且對程序員十分不友好，但起碼還是能實現(xiàn)的。

不過寄存器一共就那么點，肯定做不到互不干擾，可能一個進程就把寄存器全用上了，那其他進程咋整。

比如程序 1 剛剛往 eax 寫入一個值，準(zhǔn)備用，這時切換到進程 2 了，又往 eax 里寫入了一個值。那么之后再切回進程 1 的時候，就出錯了。所以最穩(wěn)妥的做法就是，每次切換進程時，都把當(dāng)前這些寄存器的值存到一個地方，以便之后切換回來的時候恢復(fù)。 Linux 0.11 就是這樣做的，每個進程的結(jié)構(gòu) task_struct 里面，有一個叫 tss 的結(jié)構(gòu)，存儲的就是 CPU 這些寄存器的信息。

struct task_struct {
    ...
    struct tss_struct tss;
}

struct tss_struct {
    long    back_link;  /* 16 high bits zero */
    long    esp0;
    long    ss0;        /* 16 high bits zero */
    long    esp1;
    long    ss1;        /* 16 high bits zero */
    long    esp2;
    long    ss2;        /* 16 high bits zero */
    long    cr3;
    long    eip;
    long    eflags;
    long    eax,ecx,edx,ebx;
    long    esp;
    long    ebp;
    long    esi;
    long    edi;
    long    es;     /* 16 high bits zero */
    long    cs;     /* 16 high bits zero */
    long    ss;     /* 16 high bits zero */
    long    ds;     /* 16 high bits zero */
    long    fs;     /* 16 high bits zero */
    long    gs;     /* 16 high bits zero */
    long    ldt;        /* 16 high bits zero */
    long    trace_bitmap;   /* bits: trace 0, bitmap 16-31 */
    struct i387_struct i387;
};

這里提個細(xì)節(jié)。

你發(fā)現(xiàn) tss 結(jié)構(gòu)里還有個 cr3 不?它表示 cr3 寄存器里存的值，而 cr3 寄存器是指向頁目錄表首地址的。

那么指向不同的頁目錄表，整個頁表結(jié)構(gòu)就是完全不同的一套，那么邏輯地址到線性地址的映射關(guān)系就有能力做到不同。也就是說，在我們剛剛假設(shè)的理想情況下，不同程序用不同的內(nèi)存地址可以做到內(nèi)存互不干擾。

但是有了這個 cr3 字段，就完全可以無需由各個進程自己保證不和其他進程使用的內(nèi)存沖突，因為只要建立不同的映射關(guān)系即可，由操作系統(tǒng)來建立不同的頁目錄表并替換 cr3 寄存器即可。

這也可以理解為，保存了內(nèi)存映射的上下文信息。

當(dāng)然 Linux 0.11 并不是通過替換 cr3 寄存器來實現(xiàn)內(nèi)存互不干擾的，它的實現(xiàn)更為簡單，這是后話了。

運行時間信息

如何判斷一個進程該讓出 CPU 了，切換到下一個進程呢? 總不能是每次時鐘中斷時都切換一次吧?一來這樣不靈活，二來這完全依賴時鐘中斷的頻率，有點危險。所以一個好的辦法就是，給進程一個屬性，叫剩余時間片，每次時鐘中斷來了之后都 -1，如果減到 0 了，就觸發(fā)切換進程的操作。在 Linux 0.11 里，這個屬性就是 counter。

struct task_struct {
    ...
    long counter;
    ...
    struct tss_struct tss;
}

而他的用法也非常簡單，就是每次中斷都判斷一下是否到 0 了。

void do_timer(long cpl) {
    ...
    // 當(dāng)前線程還有剩余時間片，直接返回
    if ((--current->counter)>0) return;
    // 若沒有剩余時間片，調(diào)度
    schedule();
}

如果還沒到 0，就直接返回，相當(dāng)于這次時鐘中斷什么也沒做，僅僅是給當(dāng)前進程的時間片屬性做了 -1 操作。

如果已經(jīng)到 0 了，就觸發(fā)進程調(diào)度，選擇下一個進程并使 CPU 跳轉(zhuǎn)到那里運行。

進程調(diào)度的邏輯就是在 schedule 函數(shù)里，怎么調(diào)，我們先不管。

優(yōu)先級

上面那個 counter 一開始的時候該是多少呢?而且隨著 counter 不斷遞減，減到 0 時，下一輪回中這個 counter 應(yīng)該賦予什么值呢? 其實這倆問題都是一個問題，就是 counter 的初始化問題，也需要有一個屬性來記錄這個值。往宏觀想一下，這個值越大，那么 counter 就越大，那么每次輪到這個進程時，它在 CPU 中運行的時間就越長，也就是這個進程比其他進程得到了更多 CPU 運行的時間。那我們可以把這個值稱為優(yōu)先級，是不是很形象。

struct task_struct {
    ...
    long counter;
    long priority;
    ...
    struct tss_struct tss;
}

每次一個進程初始化時，都把 counter 賦值為這個 priority，而且當(dāng) counter 減為 0 時，下一次分配時間片，也賦值為這個。

其實叫啥都行，反正就是這么用的，就叫優(yōu)先級吧。

進程狀態(tài)

其實我們有了上面那三個信息，就已經(jīng)可以完成進程的調(diào)度了。甚至如果你的操作系統(tǒng)讓所有進程都得到同樣的運行時間，連 counter 和 priority 都不用記錄，就操作系統(tǒng)自己定一個固定值一直遞減，減到 0 了就隨機切一個新進程。

這樣就僅僅維護好寄存器的上下文信息 tss 就好了。但我們總要不斷優(yōu)化以適應(yīng)不同場景的用戶需求的，那我們再優(yōu)化一個細(xì)節(jié)。很簡單的一個場景，一個進程中有一個讀取硬盤的操作，發(fā)起讀請求后，要等好久才能得到硬盤的中斷信號。那這個時間其實該進程再占用著 CPU 也沒用，此時就可以選擇主動放棄 CPU 執(zhí)行權(quán)，然后再把自己的狀態(tài)標(biāo)記為等待中。

意思是告訴進程調(diào)度的代碼，先別調(diào)度我，因為我還在等硬盤的中斷，現(xiàn)在輪到我了也沒用，把機會給別人吧。那這個狀態(tài)可以記錄一個屬性了，叫 state，記錄了此時進程的狀態(tài)。

struct task_struct {
    long state;
    long counter;
    long priority;
    ...
    struct tss_struct tss;
}

而這個進程的狀態(tài)在 Linux 0.11 里有這么五種。

#define TASK_RUNNING          0
#define TASK_INTERRUPTIBLE    1
#define TASK_UNINTERRUPTIBLE  2
#define TASK_ZOMBIE           3
#define TASK_STOPPED          4

好了，目前我們這幾個字段，就已經(jīng)可以完成簡單的進程調(diào)度任務(wù)了。

有表示狀態(tài)的 state，表示剩余時間片的counter，表示優(yōu)先級的 priority，和表示上下文信息的 tss。

其他字段我們需要用到的時候再說，今天只是頭腦風(fēng)暴一下進程調(diào)度設(shè)計的思路。我們看一下 Linux 0.11 中進程結(jié)構(gòu)的全部，心里先有個數(shù)，具體干嘛的先別管，就記住我們剛剛頭腦風(fēng)暴的那四個字段就行了。

struct task_struct {
/* these are hardcoded - don't touch */
    long state; /* -1 unrunnable, 0 runnable, >0 stopped */
    long counter;
    long priority;
    long signal;
    struct sigaction sigaction[32];
    long blocked;   /* bitmap of masked signals */
/* various fields */
    int exit_code;
    unsigned long start_code,end_code,end_data,brk,start_stack;
    long pid,father,pgrp,session,leader;
    unsigned short uid,euid,suid;
    unsigned short gid,egid,sgid;
    long alarm;
    long utime,stime,cutime,cstime,start_time;
    unsigned short used_math;
/* file system info */
    int tty;        /* -1 if no tty, so it must be signed */
    unsigned short umask;
    struct m_inode * pwd;
    struct m_inode * root;
    struct m_inode * executable;
    unsigned long close_on_exec;
    struct file * filp[NR_OPEN];
/* ldt for this task 0 - zero 1 - cs 2 - ds&ss */
    struct desc_struct ldt[3];
/* tss for this task */
    struct tss_struct tss;
};

看吧，其實也沒多少咯～

好了，今天我們完全由自己從零到有設(shè)計出了進程調(diào)度的大體流程，以及它需要的數(shù)據(jù)結(jié)構(gòu)。

我們知道了進程調(diào)度的開始，要從一次定時器滴答來觸發(fā)，通過時鐘中斷處理函數(shù)走到進程調(diào)度函數(shù)，然后去進程的結(jié)構(gòu) task_struct 中取出所需的數(shù)據(jù)，進行策略計算，并挑選出下一個可以得到 CPU 運行的進程，跳轉(zhuǎn)過去。那么下一講，我們從一次時鐘中斷出發(fā)，看看一次 Linux 0.11 的進程調(diào)度的全過程。有了這兩回做鋪墊，之后再看主流程中的 fork 代碼，將會非常清晰! 欲知后事如何，且聽下回分解。

本文轉(zhuǎn)載自微信公眾號「低并發(fā)編程」，可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系低并發(fā)編程公眾號。

當(dāng)前題目：如果讓你來設(shè)計進程調(diào)度，你會怎么辦？
新聞來源：http://www.dlmjj.cn/article/djoggpp.html