http://blog.csdn.net/zilong91/archive/2007/07/26/1708402.aspx
序言
Linux是Unix操作系統(tǒng)的一種變種,在Linux下編寫驅(qū)動(dòng)程序的原理和思想完全類似于其他的Unix系統(tǒng),但它dos或window環(huán)境下的驅(qū)動(dòng)程序有很大的區(qū)別。在Linux環(huán)境下設(shè)計(jì)驅(qū)動(dòng)程序,思想簡潔,操作方便,功能也很強(qiáng)大,但是支持函數(shù)少,只能依賴kernel中的函數(shù),有些常用的操作要自己來編寫,而且調(diào)試也不方便。本人這幾周來為實(shí)驗(yàn)室自行研制的一塊多媒體卡編制了驅(qū)動(dòng)程序,獲得了一些經(jīng)驗(yàn),愿Linux fans共享,有不當(dāng)之處,請予指正。
以下的一些文字主要來源于khg,johnsonm的Write linux device driver,Brennan's Guide to Inline Assembly,The Linux A-Z,還有清華BBS上的有關(guān)device driver的一些資料。 這些資料有的已經(jīng)過時(shí),有的還有一些錯(cuò)誤,我依據(jù)自己的試驗(yàn)結(jié)果進(jìn)行了修正。
一 Linux device driver 的概念
系統(tǒng)調(diào)用是操作系統(tǒng)內(nèi)核和應(yīng)用程序之間的接口,設(shè)備驅(qū)動(dòng)程序是操作系統(tǒng)內(nèi)核和機(jī)器硬件之間的接口。設(shè)備驅(qū)動(dòng)程序?yàn)閼?yīng)用程序屏蔽了硬件的細(xì)節(jié),這樣在應(yīng)用程序看來,硬件設(shè)備只是一個(gè)設(shè)備文件, 應(yīng)用程序可以象操作普通文件一樣對硬件設(shè)備進(jìn)行操作。設(shè)備驅(qū)動(dòng)程序是內(nèi)核的一部分,它完成以下的功能:
1 對設(shè)備初始化和釋放。
2 把數(shù)據(jù)從內(nèi)核傳送到硬件和從硬件讀取數(shù)據(jù)。
3 讀取應(yīng)用程序傳送給設(shè)備文件的數(shù)據(jù)和回送應(yīng)用程序請求的數(shù)據(jù)。
4 檢測和處理設(shè)備出現(xiàn)的錯(cuò)誤。
在Linux操作系統(tǒng)下有兩類主要的設(shè)備文件類型,一種是字符設(shè)備,另一種是塊設(shè)備。字符設(shè)備和塊設(shè)備的主要區(qū)別是:在對字符設(shè)備發(fā)出讀/寫請求時(shí),實(shí)際的硬件I/O一般就緊接著發(fā)生了,塊設(shè)備則不然,它利用一塊系統(tǒng)內(nèi)存作緩沖區(qū),當(dāng)用戶進(jìn)程對設(shè)備請求能滿足用戶的要求,就返回請求的數(shù)據(jù),如果不能,就調(diào)用請求函數(shù)來進(jìn)行實(shí)際的I/O操作。塊設(shè)備是主要針對磁盤等慢速設(shè)備設(shè)計(jì)的,以免耗費(fèi)過多的CPU時(shí)間來等待。
已經(jīng)提到,用戶進(jìn)程是通過設(shè)備文件來與實(shí)際的硬件打交道。每個(gè)設(shè)備文件都都有其文件屬性(c/b),表示是字符設(shè)備還蔤強(qiáng)檣璞?另外每個(gè)文件都有兩個(gè)設(shè)備號,第一個(gè)是主設(shè)備號,標(biāo)識驅(qū)動(dòng)程序,第二個(gè)是從設(shè)備號,標(biāo)識使用同一個(gè)設(shè)備驅(qū)動(dòng)程序的不同的硬件設(shè)備,比如有兩個(gè)軟盤,就可以用從設(shè)備號來區(qū)分他們。設(shè)備文件的的主設(shè)備號必須與設(shè)備驅(qū)動(dòng)程序在登記時(shí)申請的主設(shè)備號一致,否則用戶進(jìn)程將無法訪問到驅(qū)動(dòng)程序。
最后必須提到的是,在用戶進(jìn)程調(diào)用驅(qū)動(dòng)程序時(shí),系統(tǒng)進(jìn)入核心態(tài),這時(shí)不再是搶先式調(diào)度。也就是說,系統(tǒng)必須在你的驅(qū)動(dòng)程序的子函數(shù)返回后才能進(jìn)行其他的工作。如果你的驅(qū)動(dòng)程序陷入死循環(huán),不幸的是你只有重新啟動(dòng)機(jī)器了,然后就是漫長的fsck。//hehe
二 實(shí)例剖析
我們來寫一個(gè)最簡單的字符設(shè)備驅(qū)動(dòng)程序。雖然它什么也不做,但是通過它可以了解Linux的設(shè)備驅(qū)動(dòng)程序的工作原理。把下面的C代碼輸入機(jī)器,你就會(huì)獲得一個(gè)真正的設(shè)備驅(qū)動(dòng)程序。不過我的kernel是2。0。34,在低版本的kernel上可能會(huì)出現(xiàn)問題,我還沒測試過。//xixi
#define __NO_VERSION__
#include <linux/modules.h>
#include <linux/version.h>
char kernel_version [] = UTS_RELEASE;
這一段定義了一些版本信息,雖然用處不是很大,但也必不可少。Johnsonm說所有的驅(qū)動(dòng)程序的開頭都要包含,但我看倒是未必。由于用戶進(jìn)程是通過設(shè)備文件同硬件打交道,對設(shè)備文件的操作方式不外乎就是一些系統(tǒng)調(diào)用,如 open,read,write,close。。。。, 注意,不是fopen, fread。,但是如何把系統(tǒng)調(diào)用和驅(qū)動(dòng)程序關(guān)聯(lián)起來呢?這需要了解一個(gè)非常關(guān)鍵的數(shù)據(jù)結(jié)構(gòu):
struct file_operations {
int (*seek) (struct inode * ,struct file *, off_t ,int);
int (*read) (struct inode * ,struct file *, char ,int);
int (*write) (struct inode * ,struct file *, off_t ,int);
int (*readdir) (struct inode * ,struct file *, struct dirent * ,int);
int (*select) (struct inode * ,struct file *, int ,select_table *);
int (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long
int (*mmap) (struct inode * ,struct file *, struct vm_area_struct *);
int (*open) (struct inode * ,struct file *);
int (*release) (struct inode * ,struct file *);
int (*fsync) (struct inode * ,struct file *);
int (*fasync) (struct inode * ,struct file *,int);
int (*check_media_change) (struct inode * ,struct file *);
int (*revalidate) (dev_t dev);
}
這個(gè)結(jié)構(gòu)的每一個(gè)成員的名字都對應(yīng)著一個(gè)系統(tǒng)調(diào)用。用戶進(jìn)程利用系統(tǒng)調(diào)用在對設(shè)備文件進(jìn)行諸如read/write操作時(shí),系統(tǒng)調(diào)用通過設(shè)備文件的主設(shè)備號找到相應(yīng)的設(shè)備驅(qū)動(dòng)程序,然后讀取這個(gè)數(shù)據(jù)結(jié)構(gòu)相應(yīng)的函數(shù)指針,接著把控制權(quán)交給該函數(shù)。這是linux的設(shè)備驅(qū)動(dòng)程序工作的基本原理。既然是這樣,則編寫設(shè)備驅(qū)動(dòng)程序的主要工作就是編寫子函數(shù),并填充file_operations的各個(gè)域。相當(dāng)簡單,不是嗎?
下面就開始寫子程序。
#include <linux/types.h>
#include <linux/fs.h>
#include <linux/mm.h>
#include <linux/errno.h>
#include <asm/segment.h>
unsigned int test_major = 0;
static int read_test(struct inode *node,struct file *file,
char *buf,int count)
{
int left;
if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT )
return -EFAULT;
for(left = count ; left > 0 ; left--)
{
__put_user(1,buf,1);
buf++;
}
return count;
}
這個(gè)函數(shù)是為read調(diào)用準(zhǔn)備的。當(dāng)調(diào)用read時(shí),read_test()被調(diào)用,它把用戶的緩沖區(qū)全部寫1。buf 是read調(diào)用的一個(gè)參數(shù)。它是用戶進(jìn)程空間的一個(gè)地址。但是在read_test被調(diào)用時(shí),系統(tǒng)進(jìn)入核心態(tài)。所以不能使用buf這個(gè)地址,必須用__put_user(),這是kernel提供的一個(gè)函數(shù),用于向用戶傳送數(shù)據(jù)。另外還有很多類似功能的函數(shù)。請參考。在向用戶空間拷貝數(shù)據(jù)之前,必須驗(yàn)證buf是否可用。這就用到函數(shù)verify_area。
static int write_tibet(struct inode *inode,struct file *file,
const char *buf,int count)
{
return count;
}
static int open_tibet(struct inode *inode,struct file *file )
{
MOD_INC_USE_COUNT;
return 0;
} static void release_tibet(struct inode *inode,struct file *file )
{
MOD_DEC_USE_COUNT;
}
這幾個(gè)函數(shù)都是空操作。實(shí)際調(diào)用發(fā)生時(shí)什么也不做,他們僅僅為下面的結(jié)構(gòu)提供函數(shù)指針。
struct file_operations test_fops = {
NULL,
read_test,
write_test,
NULL, /* test_readdir */
NULL,
NULL, /* test_ioctl */
NULL, /* test_mmap */
open_test,
release_test, NULL, /* test_fsync */
NULL, /* test_fasync */
/* nothing more, fill with NULLs */
};
設(shè)備驅(qū)動(dòng)程序的主體可以說是寫好了?,F(xiàn)在要把驅(qū)動(dòng)程序嵌入內(nèi)核。驅(qū)動(dòng)程序可以按照兩種方式編譯。一種是編譯進(jìn)kernel,另一種是編譯成模塊(modules),如果編譯進(jìn)內(nèi)核的話,會(huì)增加內(nèi)核的大小,還要改動(dòng)內(nèi)核的源文件,而且不能動(dòng)態(tài)的卸載,不利于調(diào)試,所以推薦使用模塊方式。
int init_module(void)
{
int result;
result = register_chrdev(0, "test", &test_fops);
if (result < 0) {
printk(KERN_INFO "test: can't get major number ");
return result;
}
if (test_major == 0) test_major = result; /* dynamic */
return 0;
}
在用insmod命令將編譯好的模塊調(diào)入內(nèi)存時(shí),init_module 函數(shù)被調(diào)用。在這里,init_module只做了一件事,就是向系統(tǒng)的字符設(shè)備表登記了一個(gè)字符設(shè)備。register_chrdev需要三個(gè)參數(shù),參數(shù)一是希望獲得的設(shè)備號,如果是零的話,系統(tǒng)將選擇一個(gè)沒有被占用的設(shè)備號返回。參數(shù)二是設(shè)備文件名,參數(shù)三用來登記驅(qū)動(dòng)程序?qū)嶋H執(zhí)行操作的函數(shù)的指針。如果登記成功,返回設(shè)備的主設(shè)備號,不成功,返回一個(gè)負(fù)值。
void cleanup_module(void)
{
unregister_chrdev(test_major, "test");
}
在用rmmod卸載模塊時(shí),cleanup_module函數(shù)被調(diào)用,它釋放字符設(shè)備test在系統(tǒng)字符設(shè)備表中占有的表項(xiàng)。
一個(gè)極其簡單的字符設(shè)備可以說寫好了,文件名就叫test。c吧。下面編譯
$ gcc -O2 -DMODULE -D__KERNEL__ -c test。c
得到文件test。o就是一個(gè)設(shè)備驅(qū)動(dòng)程序。如果設(shè)備驅(qū)動(dòng)程序有多個(gè)文件,把每個(gè)文件按上面的命令行編譯,然后:
ld -r file1。o file2。o -o modulename。
驅(qū)動(dòng)程序已經(jīng)編譯好了,現(xiàn)在把它安裝到系統(tǒng)中去。
$ insmod -f test
如果安裝成功,在/proc/devices文件中就可以看到設(shè)備test,并可以看到它的主設(shè)備號,要卸載的話,運(yùn)行
$ rmmod test
下一步要?jiǎng)?chuàng)建設(shè)備文件。
mknod /dev/test c major minor
c 是指字符設(shè)備,major是主設(shè)備號,就是在/proc/devices里看到的。用shell命令
$ cat /proc/devices | awk "\$2=="test" {print \$1}"
就可以獲得主設(shè)備號,可以把上面的命令行加入你的shell script中去。minor是從設(shè)備號,設(shè)置成0就可以了。我們現(xiàn)在可以通過設(shè)備文件來訪問我們的驅(qū)動(dòng)程序。寫一個(gè)小小的測試程序。
#include
#include
#include
#include
main()
{
int testdev;
int i;
char buf[10];
testdev = open("/dev/test",O_RDWR);
if ( testdev == -1 )
{
printf("Cann't open file ");
exit(0);
}
read(testdev,buf,10);
for (i = 0; i < 10;i++)
printf("%d ",buf[i]);
close(testdev);
}
編譯運(yùn)行,看看是不是打印出全1 ?
以上只是一個(gè)簡單的演示。真正實(shí)用的驅(qū)動(dòng)程序要復(fù)雜的多,要處理如中斷,DMA,I/O port等問題。這些才是真正的難點(diǎn)。請看下節(jié),實(shí)際情況的處理。
三 設(shè)備驅(qū)動(dòng)程序中的一些具體問題
1 I/O Port
和硬件打交道離不開I/O Port,老的ISA設(shè)備經(jīng)常是占用實(shí)際的I/O端口,在linux下,操作系統(tǒng)沒有對I/O口屏蔽,也就是說,任何驅(qū)動(dòng)程序都可以對任意的I/O口操作,這樣就很容易引起混亂。每個(gè)驅(qū)動(dòng)程序應(yīng)該自己避免誤用端口。有兩個(gè)重要的kernel函數(shù)可以保證驅(qū)動(dòng)程序做到這一點(diǎn)。
1)check_region(int io_port, int off_set)
這個(gè)函數(shù)察看系統(tǒng)的I/O表,看是否有別的驅(qū)動(dòng)程序占用某一段I/O口。
參數(shù)1:io端口的基地址,
參數(shù)2:io端口占用的范圍。
返回值:0 沒有占用, 非0,已經(jīng)被占用。
2)request_region(int io_port, int off_set,char *devname)
如果這段I/O端口沒有被占用,在我們的驅(qū)動(dòng)程序中就可以使用它。在使用之前,必須向系統(tǒng)登記,以防止被其他程序占用。登記后,在/proc/ioports文件中可以看到你登記的io口。
參數(shù)1:io端口的基地址。
參數(shù)2:io端口占用的范圍。
參數(shù)3:使用這段io地址的設(shè)備名。
在對I/O口登記后,就可以放心地用inb(), outb()之類的函來訪問了。在一些pci設(shè)備中,I/O端口被映射到一段內(nèi)存中去,要訪問這些端口就相當(dāng)于訪問一段內(nèi)存。經(jīng)常性的,我們要獲得一塊內(nèi)存的物理地址。在dos環(huán)境下,(之所以不說是dos操作系統(tǒng)是因?yàn)槲艺J(rèn)為DOS根本就不是一個(gè)操作系統(tǒng),它實(shí)在是太簡單,太不安全了)只要用段:偏移就可以了。在window95中,95ddk提供了一個(gè)vmm 調(diào)用 _MapLinearToPhys,用以把線性地址轉(zhuǎn)化為物理地址。但在Linux中是怎樣做的呢?
2 內(nèi)存操作
在設(shè)備驅(qū)動(dòng)程序中動(dòng)態(tài)開辟內(nèi)存,不是用malloc,而是kmalloc,或者用get_free_pages直接申請頁。釋放內(nèi)存用的是kfree,或free_pages。 請注意,kmalloc等函數(shù)返回的是物理地址!而malloc等返回的是線性地址!關(guān)于kmalloc返回的是物理地址這一點(diǎn)本人有點(diǎn)不太明白:既然從線性地址到物理地址的轉(zhuǎn)換是由386cpu硬件完成的,那樣匯編指令的操作數(shù)應(yīng)該是線性地址,驅(qū)動(dòng)程序同樣也不能直接使用物理地址而是線性地址。但是事實(shí)上kmalloc返回的確實(shí)是物理地址,而且也可以直接通過它訪問實(shí)際的RAM,我想這樣可以由兩種解釋,一種是在核心態(tài)禁止分頁,但是這好像不太現(xiàn)實(shí);另一種是linux的頁目錄和頁表項(xiàng)設(shè)計(jì)得正好使得物理地址等同于線性地址。我的想法不知對不對,還請高手指教。
言歸正傳,要注意kmalloc最大只能開辟128k-16,16個(gè)字節(jié)是被頁描述符結(jié)構(gòu)占用了。kmalloc用法參見khg。
內(nèi)存映射的I/O口,寄存器或者是硬件設(shè)備的RAM(如顯存)一般占用F0000000以上的地址空間。在驅(qū)動(dòng)程序中不能直接訪問,要通過kernel函數(shù)vremap獲得重新映射以后的地址。另外,很多硬件需要一塊比較大的連續(xù)內(nèi)存用作DMA傳送。這塊內(nèi)存需要一直駐留在內(nèi)存,不能被交換到文件中去。但是kmalloc最多只能開辟128k的內(nèi)存。這可以通過犧牲一些系統(tǒng)內(nèi)存的方法來解決。具體做法是:比如說你的機(jī)器由32M的內(nèi)存,在lilo。conf的啟動(dòng)參數(shù)中加上mem=30M,這樣linux就認(rèn)為你的機(jī)器只有30M的內(nèi)存,剩下的2M內(nèi)存在vremap之后就可以為DMA所用了。
請記住,用vremap映射后的內(nèi)存,不用時(shí)應(yīng)用unremap釋放,否則會(huì)浪費(fèi)頁表。
3 中斷處理
同處理I/O端口一樣,要使用一個(gè)中斷,必須先向系統(tǒng)登記。
int request_irq(unsigned int irq ,
void(*handle)(int,void *,struct pt_regs *),
unsigned int long flags,
const char *device);
irq: 是要申請的中斷。
handle:中斷處理函數(shù)指針。
flags:SA_INTERRUPT 請求一個(gè)快速中斷,0 正常中斷。
device:設(shè)備名。
如果登記成功,返回0,這時(shí)在/proc/interrupts文件中可以看你請求的中斷。
4一些常見的問題
對硬件操作,有時(shí)時(shí)序很重要。但是如果用C語言寫一些低級的硬件操作的話,gcc往往會(huì)對你的程序進(jìn)行優(yōu)化,這樣時(shí)序就錯(cuò)掉了。如果用匯編寫呢,gcc同樣會(huì)對匯編代碼進(jìn)行優(yōu)化,除非你用volatile關(guān)鍵字修飾。最保險(xiǎn)的辦法是禁止優(yōu)化。這當(dāng)然只能對一部分你自己編寫的代碼。如果對所有的代碼
都不優(yōu)化,你會(huì)發(fā)現(xiàn)驅(qū)動(dòng)程序根本無法裝載。這是因?yàn)樵诰幾g驅(qū)動(dòng)程序時(shí)要用到gcc的一些擴(kuò)展特性,而這些擴(kuò)展特性必須在加了優(yōu)化選項(xiàng)之后才能體現(xiàn)出來。
關(guān)于kernel的調(diào)試工具,我現(xiàn)在還沒有發(fā)現(xiàn)有合適的。有誰知道請告訴我,不勝感激。我一直都在printk打印調(diào)試信息,倒也還湊合。關(guān)于設(shè)備驅(qū)動(dòng)程序還有很多內(nèi)容,如等待/喚醒機(jī)制,塊設(shè)備的編寫等。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
