回想學習Linux操作系統已經有近壹年的時間了,前前後後,零零碎碎的壹路學習過來,也該試著寫的東西了。也算是給自己能留下壹點記憶和回憶吧!由於完全是自學的,以下內容若有不當之處,還請大家多指教。
Linux是Unix操作系統的壹種變種,在Linux下編寫驅動程序的原理和思想完全類似於其他的Unix系統,但它dos或window環境下的驅動程序有很大的區別。在Linux環境下設計驅動程序,思想簡潔,操作方便,功能也很強大,但是支持函數少,只能依賴kernel中的函數,有些常用的操作要自己來編寫,而且調試也不方便。
以下的壹些文字主要來源於khg,johnsonm的Write linux device driver,Brennan's Guide to Inline Assembly,The Linux a-z,還有清華bbs上的有關device driver的壹些資料。
壹、Linux device driver 的概念
系統調用是操作系統內核和應用程序之間的接口,設備驅動程序是操作系統內核和機器硬件之間的接口。設備驅動程序為應用程序屏蔽了硬件的細節,這樣在應用程序看來,硬件設備只是壹個設備文件,應用程序可以象操作普通文件壹樣對硬件設備進行操作。設備驅動程序是內核的壹部分,它完成以下的功能:
1、對設備初始化和釋放。
2、把數據從內核傳送到硬件和從硬件讀取數據。
3、讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據。
4、檢測和處理設備出現的錯誤。
在Linux操作系統下有三類主要的設備文件類型,壹是字符設備,二是塊設備,三是網絡設備。字符設備和塊設備的主要區別是:在對字符設備發出讀/寫請求時,實際的硬件I/O壹般就緊接著發生了,塊設備則不然,它利用壹塊系統內存作緩沖區,當用戶進程對設備請求能滿足用戶的要求,就返回請求的數據,如果不能,就調用請求函數來進行實際的I/O操作。塊設備是主要針對磁盤等慢速設備設計的,以免耗費過多的CPU時間來等待。
已經提到,用戶進程是通過設備文件來與實際的硬件打交道。每個設備文件都都有其文件屬性(c/b),表示是字符設備還是塊設備?另外每個文件都有兩個設備號,第壹個是主設備號,標識驅動程序,第二個是從設備號,標識使用同壹個設備驅動程序的不同的硬件設備,比如有兩個軟盤,就可以用從設備號來區分他們。設備文件的的主設備號必須與設備驅動程序在登記時申請的主設備號壹致,否則用戶進程將無法訪問到驅動程序。
最後必須提到的是,在用戶進程調用驅動程序時,系統進入核心態,這時不再是搶先式調度。也就是說,系統必須在妳的驅動程序的子函數返回後才能進行其他的工作。如果妳的驅動程序陷入死循環,不幸的是妳只有重新啟動機器了,然後就是漫長的fsck。
讀/寫時,它首先察看緩沖區的內容,如果緩沖區的數據未被處理,則先處理其中的內容。
如何編寫Linux操作系統下的設備驅動程序
二、實例剖析
我們來寫壹個最簡單的字符設備驅動程序。雖然它什麽也不做,但是通過它可以了解Linux的設備驅動程序的工作原理。把下面的C代碼輸入機器,妳就會獲得壹個真正的設備驅動程序。
#define __NO_VERSION__
#include <linux/modules.h>
#include <linux/version.h>
char kernel_version [] = UTS_RELEASE;
這壹段定義了壹些版本信息,雖然用處不是很大,但也必不可少。Johnsonm說所有的驅動程序的開頭都要包含<linux/config.h>,壹般來講最好使用。
由於用戶進程是通過設備文件同硬件打交道,對設備文件的操作方式不外乎就是壹些系統調用,如 open,read,write,close…, 註意,不是fopen, fread,但是如何把系統調用和驅動程序關聯起來呢?這需要了解壹個非常關鍵的數據結構:
struct file_operations
{
int (*seek) (struct inode * ,struct file *, off_t ,int);
int (*read) (struct inode * ,struct file *, char ,int);
int (*write) (struct inode * ,struct file *, off_t ,int);
int (*readdir) (struct inode * ,struct file *, struct dirent * ,int);
int (*select) (struct inode * ,struct file *, int ,select_table *);
int (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long);
int (*mmap) (struct inode * ,struct file *, struct vm_area_struct *);
int (*open) (struct inode * ,struct file *);
int (*release) (struct inode * ,struct file *);
int (*fsync) (struct inode * ,struct file *);
int (*fasync) (struct inode * ,struct file *,int);
int (*check_media_change) (struct inode * ,struct file *);
int (*revalidate) (dev_t dev);
}
這個結構的每壹個成員的名字都對應著壹個系統調用。用戶進程利用系統調用在對設備文件進行諸如read/write操作時,系統調用通過設備文件的主設備號找到相應的設備驅動程序,然後讀取這個數據結構相應的函數指針,接著把控制權交給該函數。這是linux的設備驅動程序工作的基本原理。既然是這樣,則編寫設備驅動程序的主要工作就是編寫子函數,並填充file_operations的各個域。
下面就開始寫子程序。
#include <linux/types.h>
#include <linux/fs.h>
#include <linux/mm.h>
#include<linux/config.h>
#include <linux/errno.h>
#include <asm/segment.h>
unsigned int test_major = 0;
static int read_test(struct inode *node,struct file *file,char *buf,int count)
{
int left;
if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT )
return -EFAULT;
for(left = count ; left > 0 ; left--)
{
__put_user(1,buf,1);
buf++;
}
return count;
}
這個函數是為read調用準備的。當調用read時,read_test()被調用,它把用戶的緩沖區全部寫1。buf 是read調用的壹個參數。它是用戶進程空間的壹個地址。但是在read_test被調用時,系統進入核心態。所以不能使用buf這個地址,必須用__put_user(),這是kernel提供的壹個函數,用於向用戶傳送數據。另外還有很多類似功能的函數。請參考robert著的《Linux內核設計與實現》(第二版)。然而,在向用戶空間拷貝數據之前,必須驗證buf是否可用。這就用到函數verify_area。
static int write_tibet(struct inode *inode,struct file *file,const char *buf,int count)
{
return count;
}
static int open_tibet(struct inode *inode,struct file *file )
{
MOD_INC_USE_COUNT;
return 0;
}
static void release_tibet(struct inode *inode,struct file *file )
{
MOD_DEC_USE_COUNT;
}
這幾個函數都是空操作。實際調用發生時什麽也不做,他們僅僅為下面的結構提供函數指針。
struct file_operations test_fops = {
NULL,
read_test,
write_test,
NULL, /* test_readdir */
NULL,
NULL, /* test_ioctl */
NULL, /* test_mmap */
open_test,
release_test,
NULL, /* test_fsync */
NULL, /* test_fasync */
/* nothing more, fill with NULLs */
};
這樣,設備驅動程序的主體可以說是寫好了。現在要把驅動程序嵌入內核。驅動程序可以按照兩種方式編譯。壹種是編譯進kernel,另壹種是編譯成模塊(modules),如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能動態的卸載,不利於調試,所以推薦使用模塊方式。
int init_module(void)
{
int result;
result = register_chrdev(0, "test", &test_fops);
if (result < 0) {
printk(KERN_INFO "test: can't get major number\n");
return result;
}
if (test_major == 0) test_major = result; /* dynamic */
return 0;
}
在用insmod命令將編譯好的模塊調入內存時,init_module 函數被調用。在這裏,init_module只做了壹件事,就是向系統的字符設備表登記了壹個字符設備。register_chrdev需要三個參數,參數壹是希望獲得的設備號,如果是零的話,系統將選擇壹個沒有被占用的設備號返回。參數二是設備文件名,參數三用來登記驅動程序實際執行操作的函數的指針。
如果登記成功,返回設備的主設備號,不成功,返回壹個負值。
void cleanup_module(void)
{
unregister_chrdev(test_major,"test");
}
在用rmmod卸載模塊時,cleanup_module函數被調用,它釋放字符設備test在系統字符設備表中占有的表項。
壹個極其簡單的字符設備可以說寫好了,文件名就叫test.c吧。
下面編譯 :
$ gcc -O2 -DMODULE -D__KERNEL__ -c test.c
得到文件test.o就是壹個設備驅動程序。
如果設備驅動程序有多個文件,把每個文件按上面的命令行編譯,然後
ld -r file1.o file2.o -o modulename。
驅動程序已經編譯好了,現在把它安裝到系統中去。
$ insmod –f test.o
如果安裝成功,在/proc/devices文件中就可以看到設備test,並可以看到它的主設備號。要卸載的話,運行 :
$ rmmod test
下壹步要創建設備文件。
mknod /dev/test c major minor
c 是指字符設備,major是主設備號,就是在/proc/devices裏看到的。
用shell命令
$ cat /proc/devices
就可以獲得主設備號,可以把上面的命令行加入妳的shell script中去。
minor是從設備號,設置成0就可以了。
我們現在可以通過設備文件來訪問我們的驅動程序。寫壹個小小的測試程序。
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
main()
{
int testdev;
int i;
char buf[10];
testdev = open("/dev/test",O_RDWR);
if ( testdev == -1 )
{
printf("Cann't open file \n");
exit(0);
}
read(testdev,buf,10);
for (i = 0; i < 10;i++)
printf("%d\n",buf[i]);
close(testdev);
}
編譯運行,看看是不是打印出全1 ?
以上只是壹個簡單的演示。真正實用的驅動程序要復雜的多,要處理如中斷,dma,I/O port等問題。這些才是真正的難點。請看下節,實際情況的處理。
如何編寫Linux操作系統下的設備驅動程序
三、設備驅動程序中的壹些具體問題
1。 I/O Port。
和硬件打交道離不開I/O Port,老的isa設備經常是占用實際的I/O端口,在linux下,操作系統沒有對I/O口屏蔽,也就是說,任何驅動程序都可對任意的I/O口操作,這樣就很容易引起混亂。每個驅動程序應該自己避免誤用端口。
有兩個重要的kernel函數可以保證驅動程序做到這壹點。
1)check_region(int io_port, int off_set)
這個函數察看系統的I/O表,看是否有別的驅動程序占用某壹段I/O口。
參數1:I/O端口的基地址,
參數2:I/O端口占用的範圍。
返回值:0 沒有占用, 非0,已經被占用。
2)request_region(int io_port, int off_set,char *devname)
如果這段I/O端口沒有被占用,在我們的驅動程序中就可以使用它。在使用之前,必須向系統登記,以防止被其他程序占用。登記後,在/proc/ioports文件中可以看到妳登記的I/O口。
參數1:io端口的基地址。
參數2:io端口占用的範圍。
參數3:使用這段io地址的設備名。
在對I/O口登記後,就可以放心地用inb(), outb()之類的函來訪問了。
在壹些pci設備中,I/O端口被映射到壹段內存中去,要訪問這些端口就相當於訪問壹段內存。經常性的,我們要獲得壹塊內存的物理地址。
2。內存操作
在設備驅動程序中動態開辟內存,不是用malloc,而是kmalloc,或者用get_free_pages直接申請頁。釋放內存用的是kfree,或free_pages。 請註意,kmalloc等函數返回的是物理地址!
註意,kmalloc最大只能開辟128k-16,16個字節是被頁描述符結構占用了。
內存映射的I/O口,寄存器或者是硬件設備的ram(如顯存)壹般占用F0000000以上的地址空間。在驅動程序中不能直接訪問,要通過kernel函數vremap獲得重新映射以後的地址。
另外,很多硬件需要壹塊比較大的連續內存用作dma傳送。這塊程序需要壹直駐留在內存,不能被交換到文件中去。但是kmalloc最多只能開辟128k的內存。
這可以通過犧牲壹些系統內存的方法來解決。
3。中斷處理
同處理I/O端口壹樣,要使用壹個中斷,必須先向系統登記。
int request_irq(unsigned int irq ,void(*handle)(int,void *,struct pt_regs *),
unsigned int long flags, const char *device);
irq: 是要申請的中斷。
handle:中斷處理函數指針。
flags:SA_INTERRUPT 請求壹個快速中斷,0 正常中斷。
device:設備名。
如果登記成功,返回0,這時在/proc/interrupts文件中可以看妳請求的中斷。
4。壹些常見的問題。
對硬件操作,有時時序很重要(關於時序的具體問題就要參考具體的設備芯片手冊啦!比如網卡芯片RTL8139)。但是如果用C語言寫壹些低級的硬件操作的話,gcc往往會對妳的程序進行優化,這樣時序會發生錯誤。如果用匯編寫呢,gcc同樣會對匯編代碼進行優化,除非用volatile關鍵字修飾。最保險的辦法是禁止優化。這當然只能對壹部分妳自己編寫的代碼。如果對所有的代碼都不優化,妳會發現驅動程序根本無法裝載。這是因為在編譯驅動程序時要用到gcc的壹些擴展特性,而這些擴展特性必須在加了優化選項之後才能體現出來。
寫在後面:學習Linux確實不是壹件容易的事情,因為要付出很多精力,也必須具備很好的C語言基礎;但是,學習Linux也是壹件非常有趣的事情,它裏面包含了許多高手的智慧和“幽默”,這些都需要自己親自動手才能體會到,O(∩_∩)O~哈哈!