Nouveau源代码分析:NVIDIA设备初始化之nouveau_drm_probe

Posted yutingliuyl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Nouveau源代码分析:NVIDIA设备初始化之nouveau_drm_probe相关的知识,希望对你有一定的参考价值。

Nouveau源代码分析(三)

向DRM注冊了Nouveau驱动之后,内核中的PCI模块就会扫描全部没有相应驱动的设备,然后和nouveau_drm_pci_table对比.

对于匹配的设备,PCI模块就调用相应的probe函数,也就是nouveau_drm_probe.

// /drivers/gpu/drm/nouveau/nouveau_drm.c
281 static int nouveau_drm_probe(struct pci_dev *pdev,
282                              const struct pci_device_id *pent)
283 {
284         struct nouveau_device *device;
285         struct apertures_struct *aper;
286         bool boot = false;
287         int ret;
288 
289         /* remove conflicting drivers (vesafb, efifb etc) */
290         aper = alloc_apertures(3);
291         if (!aper)
292                 return -ENOMEM;
293 
294         aper->ranges[0].base = pci_resource_start(pdev, 1);
295         aper->ranges[0].size = pci_resource_len(pdev, 1);
296         aper->count = 1;
297 
298         if (pci_resource_len(pdev, 2)) {
299                 aper->ranges[aper->count].base = pci_resource_start(pdev, 2);
300                 aper->ranges[aper->count].size = pci_resource_len(pdev, 2);
301                 aper->count++;
302         }
303 
304         if (pci_resource_len(pdev, 3)) {
305                 aper->ranges[aper->count].base = pci_resource_start(pdev, 3);
306                 aper->ranges[aper->count].size = pci_resource_len(pdev, 3);
307                 aper->count++;
308         }
309 
310 #ifdef CONFIG_X86
311         boot = pdev->resource[PCI_ROM_RESOURCE].flags & IORESOURCE_ROM_SHADOW;
312 #endif
313         if (nouveau_modeset != 2)
314                 remove_conflicting_framebuffers(aper, "nouveaufb", boot);
315         kfree(aper);
316 
317         ret = nouveau_device_create(pdev, NOUVEAU_BUS_PCI,
318                                     nouveau_pci_name(pdev), pci_name(pdev),
319                                     nouveau_config, nouveau_debug, &device);
320         if (ret)
321                 return ret;
322 
323         pci_set_master(pdev);
324 
325         ret = drm_get_pci_dev(pdev, pent, &driver);
326         if (ret) {
327                 nouveau_object_ref(NULL, (struct nouveau_object **)&device);
328                 return ret;
329         }
330 
331         return 0;
332 }

第290~315行,分配了一个aper,把资源位置写进去,调用了remove_conflicting_framebuffer,接着释放这个aper.

一行凝视和函数名已经说的非常明确,就是移除冲突的framebuffer.


第317行,创建一个NV设备的结构体,这个函数我们要细致看

// /drivers/gpu/drm/nouveau/core/include/engine/device.h
 13 #define nouveau_device_create(p,t,n,s,c,d,u)                                    14         nouveau_device_create_((void *)(p), (t), (n), (s), (c), (d),            15                                sizeof(**u), (void **)u)
 16 
 17 int  nouveau_device_create_(void *, enum nv_bus_type type, u64 name,
 18                             const char *sname, const char *cfg, const char *dbg,
 19                             int, void **);
想起了什么? 对,就是上一节讲的内容,我们还是先来看结构体.

// /drivers/gpu/drm/nouveau/core/include/core/device.h
 65 struct nouveau_device {
 66         struct nouveau_engine base;
 67         struct list_head head;
 68 
 69         struct pci_dev *pdev;
 70         struct platform_device *platformdev;
 71         u64 handle;
 72 
 73         struct nvkm_event event;
 74 
 75         const char *cfgopt;
 76         const char *dbgopt;
 77         const char *name;
 78         const char *cname;
 79         u64 disable_mask;
 80 
 81         enum {
 82                 NV_04    = 0x04,
 83                 NV_10    = 0x10,
 84                 NV_11    = 0x11,
 85                 NV_20    = 0x20,
 86                 NV_30    = 0x30,
 87                 NV_40    = 0x40,
 88                 NV_50    = 0x50,
 89                 NV_C0    = 0xc0,
 90                 NV_E0    = 0xe0,
 91                 GM100    = 0x110,
 92         } card_type;
 93         u32 chipset;
 94         u32 crystal;
 95 
 96         struct nouveau_oclass *oclass[NVDEV_SUBDEV_NR];
 97         struct nouveau_object *subdev[NVDEV_SUBDEV_NR];
 98 
 99         struct {
100                 struct notifier_block nb;
101         } acpi;
102 };
第66行,能够看作是C++的基类,这个结构体等会再说吧.

第67行,链接全部NV设备的链表.

第69行,相应的PCI设备.

第70行,相应的platform设备 (两者选一,要么是PCI设备,要么是platform设备,主要讨论前者).

第71行,算是一个标识符,在创建这个结构体的时候就比較它,有同样的就觉得已经被创建,返回-EEXIST.

第73行,一个事件,是和电源有关的,由AC Adapter在ACPI中发出,CLOCK中接受.

第75行,config设置.

第76行,debug设置.

第77行,PCI名称.

第78行,NV名称,比方GK110,GK20A.

第79行,表示禁用的subdev.

第92行,设备类别 [Family].

第93行,更精确的设备类别 [Chipset].

第94行,晶振频率.

第96行,每个subdev的oclass,oclass的含义參考上一节.

第97行,subdev列表.

第101行,是传给acpi用于触发上面那个event的一个东西.


然后来看nouveau_engine

// /drivers/gpu/drm/nouveau/core/include/core/engine.h
 10 struct nouveau_engine {
 11         struct nouveau_subdev base;
 12         struct nouveau_oclass *cclass;
 13         struct nouveau_oclass *sclass;
 14 
 15         struct list_head contexts;
 16         spinlock_t lock;
 17 
 18         void (*tile_prog)(struct nouveau_engine *, int region);
 19         int  (*tlb_flush)(struct nouveau_engine *);
 20 };
第11行,又是base结构体,等会再说.

第12行,貌似是context oclass,构造context object的时候用的.

第13行,通过u32 oclass得到nouveau_oclass *oclass的一个东西.

第15行,context object链表.

第16行,自旋锁.

第18~19行,瓦片? 意义不明,仅仅在NV01~NV40 实用. [我准备讨论NVC0,由于我的显卡family就是NVC0,方便实验]


// /drivers/gpu/drm/nouveau/core/include/core/subdev.h
  9 struct nouveau_subdev {
 10         struct nouveau_object base;
 11         struct mutex mutex;
 12         const char *name;
 13         void __iomem *mmio;
 14         u32 debug;
 15         u32 unit;
 16 
 17         void (*intr)(struct nouveau_subdev *);
 18 };
第10行,还是base结构体.

第11行,锁.

第12行,名称,主要输出调试信息的时候用.

第13行,MMIO地址.

第14行,调试级别,用于推断是否输出调试信息.

第15行,subdev析构的使用用的,推測是禁用这个subdev.

第17行,中断处理函数指针.


最终到了object结构体------nouveau_object了.

// /drivers/gpu/drm/nouveau/core/include/core/object.h
 17 struct nouveau_object {
 18         struct nouveau_oclass *oclass;
 19         struct nouveau_object *parent;
 20         struct nouveau_object *engine;
 21         atomic_t refcount;
 22         atomic_t usecount;
 23 #if CONFIG_NOUVEAU_DEBUG >= NV_DBG_PARANOIA
 24 #define NOUVEAU_OBJECT_MAGIC 0x75ef0bad
 25         struct list_head list;
 26         u32 _magic;
 27 #endif
 28 };
第18行,oclass,作用和上一篇一样,里面包含read,write寄存器,init,fini构造析构等函数的指针.

第19行,parent,就是父结构体.

第20行,相应的engine.

第21行和第22行,两个计数器.

第23到第27行,调试用的魔数.


然后到了xxx_create_函数:

// /drivers/gpu/drm/nouveau/core/engine/device/base.c
662 int
663 nouveau_device_create_(void *dev, enum nv_bus_type type, u64 name,
664                        const char *sname, const char *cfg, const char *dbg,
665                        int length, void **pobject)
666 {
667         struct nouveau_device *device;
668         int ret = -EEXIST;
669 
670         mutex_lock(&nv_devices_mutex);
671         list_for_each_entry(device, &nv_devices, head) {
672                 if (device->handle == name)
673                         goto done;
674         }
675 
676         ret = nouveau_engine_create_(NULL, NULL, &nouveau_device_oclass, true,
677                                      "DEVICE", "device", length, pobject);
678         device = *pobject;
679         if (ret)
680                 goto done;
681 
682         switch (type) {
683         case NOUVEAU_BUS_PCI:
684                 device->pdev = dev;
685                 break;
686         case NOUVEAU_BUS_PLATFORM:
687                 device->platformdev = dev;
688                 break;
689         }
690         device->handle = name;
691         device->cfgopt = cfg;
692         device->dbgopt = dbg;
693         device->name = sname;
694 
695         nv_subdev(device)->debug = nouveau_dbgopt(device->dbgopt, "DEVICE");
696         nv_engine(device)->sclass = nouveau_device_sclass;
697         list_add(&device->head, &nv_devices);
698 
699         ret = nvkm_event_init(&nouveau_device_event_func, 1, 1,
700                               &device->event);
701 done:
702         mutex_unlock(&nv_devices_mutex);
703         return ret;
704 }

首先获取锁,然后遍历nv_devices链表,假设handle一样,那么说明这个设备已经被创建了,返回.

676行,初始化base结构体nouveau_engine. [照例等会再看.]

但这边有一个oclass,这个必需要看:

// /drivers/gpu/drm/nouveau/core/engine/device/base.c
652 static struct nouveau_oclass
653 nouveau_device_oclass = {
654         .handle = NV_ENGINE(DEVICE, 0x00),
655         .ofuncs = &(struct nouveau_ofuncs) {
656                 .dtor = nouveau_device_dtor,
657                 .init = nouveau_device_init,
658                 .fini = nouveau_device_fini,
659         },
660 };
由出现了一个handle,这个要注意区分:

1. nouveau_device的handle是用于标识设备,防止一个设备被注冊多次

2. nouveau_oclass的handle,这个比較复杂,最低两位能够表示subdev的type,然后还能表示class的type [就是engine,subdev,object之类的]

3. 另一个没接触到的nouveau_handle的handle,这个用于nouveau_namedb中搜索特定handle.

剩下的三个函数指针,运行到的时候再说吧.


然后初始化device的pdev,handle,cfgopt,dbgopt,name,这些字段上面都介绍过了,不再多说.

nv_subdev,nv_engine是什么呢? 事实上就是把指针强制转换为nouveau_subdev *,nouveau_engine *,当某个控制调试程度的宏大于某个值时,会添加检查语句.

由于各种base全都是结构体的第一个字段,所以能够强制转换而不出问题.

第695行,初始化(nouveau_subdev *)device的debug字段.

第696行,这个注意一下. nouveau_engine的sclass字段前面介绍过,就是控制u32 oclass到nouveau_oclass *oclass的转换,所以我们来看看:

// /drivers/gpu/drm/nouveau/core/engine/device/base.c
501 static struct nouveau_oclass
502 nouveau_device_sclass[] = {
503         { 0x0080, &nouveau_devobj_ofuncs },
504         {}
505 };
记住这个数据,0x0080,以后会用到的.

第699行,初始化device->event,然后解锁,返回.


好了,我们来看nouveau_engine_create_.

// /drivers/gpu/drm/nouveau/core/core/engine.c
 29 int
 30 nouveau_engine_create_(struct nouveau_object *parent,
 31                        struct nouveau_object *engobj,
 32                        struct nouveau_oclass *oclass, bool enable,
 33                        const char *iname, const char *fname,
 34                        int length, void **pobject)
 35 {
 36         struct nouveau_engine *engine;
 37         int ret;
 38 
 39         ret = nouveau_subdev_create_(parent, engobj, oclass, NV_ENGINE_CLASS,
 40                                      iname, fname, length, pobject);
 41         engine = *pobject;
 42         if (ret)
 43                 return ret;
 44 
 45         if (parent) {
 46                 struct nouveau_device *device = nv_device(parent);
 47                 int engidx = nv_engidx(nv_object(engine));
 48 
 49                 if (device->disable_mask & (1ULL << engidx)) {
 50                         if (!nouveau_boolopt(device->cfgopt, iname, false)) {
 51                                 nv_debug(engine, "engine disabled by hw/fw\n");
 52                                 return -ENODEV;
 53                         }
 54 
 55                         nv_warn(engine, "ignoring hw/fw engine disable\n");
 56                 }
 57 
 58                 if (!nouveau_boolopt(device->cfgopt, iname, enable)) {
 59                         if (!enable)
 60                                 nv_warn(engine, "disabled, %s=1 to enable\n", iname);
 61                         return -ENODEV;
 62                 }
 63         }
 64 
 65         INIT_LIST_HEAD(&engine->contexts);
 66         spin_lock_init(&engine->lock);
 67         return 0;
 68 }
第39行,首先创建subdev.

第45行,推断parent,紧接着把他转换成nouveau_device,注意这个不是直接的强制转换.

// /drivers/gpu/drm/nouveau/core/include/core/device.h
106 static inline struct nouveau_device *
107 nv_device(void *obj)
108 {
109         struct nouveau_object *object = nv_object(obj);
110         struct nouveau_object *device = object;
111 
112         if (device->engine)
113                 device = device->engine;
114         if (device->parent)
115                 device = device->parent;
116 
117 #if CONFIG_NOUVEAU_DEBUG >= NV_DBG_PARANOIA
118         if (unlikely(!nv_iclass(device, NV_SUBDEV_CLASS) ||
119                      (nv_hclass(device) & 0xff) != NVDEV_ENGINE_DEVICE)) {
120                 nv_assert("BAD CAST -> NvDevice, 0x%08x 0x%08x",
121                           nv_hclass(object), nv_hclass(device));
122         }
123 #endif
124 
125         return (void *)device;
126 }
第113行,先把device赋值为device->engine,然后第115行再赋值为device->parent并返回.

当然对于这个样例,device->engine和device->parent都为0,所以直接返回device.


回到刚才那个函数,第47行获取engidx,事实上就是subidx,再展开就是oclass::handle的最低两位.能够參考以下这个enum:

// /drivers/gpu/drm/nouveau/core/include/core/device.h
  8 enum nv_subdev_type {
  9         NVDEV_ENGINE_DEVICE,
 10         NVDEV_SUBDEV_VBios,
 11 
 12         /* All subdevs from DEVINIT to DEVINIT_LAST will be created before
 13          * *any* of them are initialised.  This subdev category is used
 14          * for any subdevs that the VBIOS init table parsing may call out
 15          * to during POST.
 16          */
 17         NVDEV_SUBDEV_DEVINIT,
 18         NVDEV_SUBDEV_GPIO,
 19         NVDEV_SUBDEV_I2C,
 20         NVDEV_SUBDEV_DEVINIT_LAST = NVDEV_SUBDEV_I2C,
 21 
 22         /* This grouping of subdevs are initialised right after they‘ve
 23          * been created, and are allowed to assume any subdevs in the
 24          * list above them exist and have been initialised.
 25          */
 26         NVDEV_SUBDEV_MXM,
 27         NVDEV_SUBDEV_MC,
 28         NVDEV_SUBDEV_BUS,
 29         NVDEV_SUBDEV_TIMER,
 30         NVDEV_SUBDEV_FB,
 31         NVDEV_SUBDEV_LTCG,
 32         NVDEV_SUBDEV_IBUS,
 33         NVDEV_SUBDEV_INSTMEM,
 34         NVDEV_SUBDEV_VM,
 35         NVDEV_SUBDEV_BAR,
 36         NVDEV_SUBDEV_PWR,
 37         NVDEV_SUBDEV_VOLT,
 38         NVDEV_SUBDEV_THERM,
 39         NVDEV_SUBDEV_CLOCK,
 40 
 41         NVDEV_ENGINE_FIRST,
 42         NVDEV_ENGINE_DMAOBJ = NVDEV_ENGINE_FIRST,
 43         NVDEV_ENGINE_FIFO,
 44         NVDEV_ENGINE_SW,
 45         NVDEV_ENGINE_GR,
 46         NVDEV_ENGINE_MPEG,
 47         NVDEV_ENGINE_ME,
 48         NVDEV_ENGINE_VP,
 49         NVDEV_ENGINE_CRYPT,
 50         NVDEV_ENGINE_BSP,
 51         NVDEV_ENGINE_PPP,
 52         NVDEV_ENGINE_COPY0,
 53         NVDEV_ENGINE_COPY1,
 54         NVDEV_ENGINE_COPY2,
 55         NVDEV_ENGINE_VIC,
 56         NVDEV_ENGINE_VENC,
 57         NVDEV_ENGINE_DISP,
 58         NVDEV_ENGINE_PERFMON,
 59 
 60         NVDEV_SUBDEV_NR,
 61 };
对于nouveau_device,就是NVDEV_ENGINE_DEVICE.

接着第49行检查这个engine有没有被禁用,再依据cfgopt的值决定做法.

第58行,检查cfgopt和enable是否相应,出错就返回.

第65,66行,初始化链表和自旋锁,返回.


紧接着,来看nouveau_subdev_create_:

// /drivers/gpu/drm/nouveau/core/core/subdev.c
 86 int
 87 nouveau_subdev_create_(struct nouveau_object *parent,
 88                        struct nouveau_object *engine,
 89                        struct nouveau_oclass *oclass, u32 pclass,
 90                        const char *subname, const char *sysname,
 91                        int size, void **pobject)
 92 {
 93         struct nouveau_subdev *subdev;
 94         int ret;
 95 
 96         ret = nouveau_object_create_(parent, engine, oclass, pclass |
 97                                      NV_SUBDEV_CLASS, size, pobject);
 98         subdev = *pobject;
 99         if (ret)
100                 return ret;
101 
102         __mutex_init(&subdev->mutex, subname, &oclass->lock_class_key);
103         subdev->name = subname;
104 
105         if (parent) {
106                 struct nouveau_device *device = nv_device(parent);
107                 subdev->debug = nouveau_dbgopt(device->dbgopt, subname);
108                 subdev->mmio  = nv_subdev(device)->mmio;
109         }
110 
111         return 0;
112 }
先创建nouveau_object (PS:最终快到头了!) .

接着初始化mutex,name字段

假设parent不为0,那么就把subdev的debug和mmio字段初始化为相应的这两个字段.

就这个样例来说,parent就是0,所以不会运行进去的.


最后nouveau_object_create_ :

// /drivers/gpu/drm/nouveau/core/core/object.c
 33 int
 34 nouveau_object_create_(struct nouveau_object *parent,
 35                        struct nouveau_object *engine,
 36                        struct nouveau_oclass *oclass, u32 pclass,
 37                        int size, void **pobject)
 38 {
 39         struct nouveau_object *object;
 40 
 41         object = *pobject = kzalloc(size, GFP_KERNEL);
 42         if (!object)
 43                 return -ENOMEM;
 44 
 45         nouveau_object_ref(parent, &object->parent);
 46         nouveau_object_ref(engine, &object->engine);
 47         object->oclass = oclass;
 48         object->oclass->handle |= pclass;
 49         atomic_set(&object->refcount, 1);
 50         atomic_set(&object->usecount, 0);
 51 
 52 #ifdef NOUVEAU_OBJECT_MAGIC
 53         object->_magic = NOUVEAU_OBJECT_MAGIC;
 54         spin_lock(&_objlist_lock);
 55         list_add(&object->list, &_objlist);
 56         spin_unlock(&_objlist_lock);
 57 #endif
 58         return 0;
 59 }
用kzmalloc分配一个大小为size (这个数是一路传下来的,大小就是sizeof(nouveau_device)) 且已经清零的内存,

由于parent,engine,object->parent,object->engine都为0,所以第45.46行代码事实上啥也没做.

初始化oclass字段,然后把oclass->handle或上plass标识符. [这个数究竟是多少能够向上翻,意义也非常easy理解.]

初始化refcount和usecount.

接下来的魔数忽略掉,调试查错用的.

然后58行,返回!


于是我们就这么回到了nouveau_drm_probe.

第323行,启用Bus-Mastering.

第325行,向DRM注冊PCI设备.

然后就是错误处理,假设失败还要把device处理一下,比方从链表中删除,释放空间等.


至于cfgopt,dbgopt,到头来各自是nouveau_config和nouveau_debug,是Nouveau的模块參数,有兴趣能够自己实验.

初始化远远没有结束,还有nouveau_drm_load,比这次这个函数不知道长多少倍.....

以上是关于Nouveau源代码分析:NVIDIA设备初始化之nouveau_drm_probe的主要内容,如果未能解决你的问题,请参考以下文章

如何禁用nouveau ubuntu

Centos7安装NVIDIA GPU驱动步骤

ubuntu 禁用自带的nouveau显卡驱动,安装NVIDIA显卡驱动

Linux安装Nvidia驱动和CUDA的正确方法(详细)

linux 安装cuda 怎么禁用nouveau

nouveau :failed to create kernel chanel,-22