Kaggle 新手入门必看,手把手教学

Posted 青年有志

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kaggle 新手入门必看,手把手教学相关的知识,希望对你有一定的参考价值。

Add Data 的路径:/kaggle/input
git clone 的路径:/kaggle/working

一、Kaggle 账号注册

1.进入官网 Kaggle 点击 Register 进行账号注册

2.随便点一个方式注册,本人用的邮箱

3.点进去填写对应信息进行注册,点击 next 即可

二、Kaggle 创建项目

1.如果你看到是这个界面

2.如果你看到的是这个界面

Kaggle 新建 kernel 有两种方式,这个主要是编辑的环境:

  • Notebook:类似Jupyter notebook
  • Script:类似Pycharm这种编辑环境

编程语言目前只支持 python 和 R 两种

三、新建 Notebook

1.点击 create => New Notebook 新建 Notebook 如下:

注:命令行可以执行 Linux 命令

四、切换工作路径

当新建 Notebook 后路径均为:/kaggle/working

文件目录结果如下:

  • input:一般用于存放训练数据的文件夹
  • config:存放配置文件
  • lib
  • working :工作路径,主要是我们创建的代码文件的工作目录
    • .ipynb_checkpoints
    • notebook_source.ipynb

以下列出常用的路径以及文件查看方式:

import os
print(os.listdir("../")) # ['lib', 'input', 'working'] 
print(os.getcwd())  # 当前文件所在的路径 /kaggle/working
print(os.listdir(os.getcwd()))  # 在 /kaggle/working 文件夹下有两个隐藏文件['.ipynb_checkpoints', '__notebook_source__.ipynb']
print(os.listdir("../../")) # 
print(os.listdir("../input"))   # 查看自己导入的文件
print(os.listdir("../../kaggle"))

一、将本地项目上传到 Kaggle 并运行

举例说明:

方式 1:(我没有成功,谢邀)

1.本地有一个 KaggleTest 项目,先将项目进行压缩

2.包含了一个 main.py 和 test.py

  • 其中 test.py 文件代码如下:
def first_test() :
    print("Hello, world")
    print("Kaggle, very good!")

3.点击自定义上传
4.点击后显示如下,上传刚刚的压缩包,它会自动解压

5.如图就能看到加载好的项目啦,当然没有的话可以点击 Add Data,点击或搜索 Your Datasets 会显示你所有导入的项目

  • 1.上传的数据文件都放在了 input 文件夹下
  • 2.所有的上传的项目文件只读,无法更改

上传项目后如何正确运行项目

  • 最开始新建会出现 Kaggle 自带的代码,运行后可以读取所有文件的路径
# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

1、当前的工作目录是在 kaggle/working 目录下,可以用如下代码查看:

import os 
print(os.getcwd())
print(os.listdir(os.getcwd()))
# 结果
"""
/kaggle/working
['__notebook_source__.ipynb', '.virtual_documents']
"""

2、改变当前的工作目录

  • 此时我们把当前的工作目录改到了 input 目录下也就是我们上传的项目对应的目录,这样就可以直接使用我们在项目中的 .py 文件啦
""" change working directory """
import os

if os.path.basename(os.getcwd()) == 'working':
    os.chdir('../input/vitcode') //
    
print('current working directory is '.format(os.getcwd()))

print(os.getcwd())
print(os.listdir(os.getcwd()))

方式 2 (一个一个传最为靠谱,别瞎折腾了)

  • 将该文件复制到一个 notebook 的 cell 中,然后在该 cell 的顶部添加一行代码:
%%writefile filename.py
  • 然后运行这个 cell,这个 cell 中的内容就会被写入到 output 的 filename.py 文件。后面就像往常一样了,直接import 使用即可。

  • 如果想要更改其中内容的话,打开一个空的 cell,输入 %load filename.py 然后运行即可载入该文件的内容,改完后用上面的方法重新写入即可。

%load mixmodel.py
  • 此方法需要将文件一个一个下载过去比较繁琐

记得最后进行项目保存

方式 3

方式 1 与 2 的结合

  • 首先经过方式 1 上传本地项目,对应的目录在 /kaggle/input 处。由于工作目录为 / kaggle/working,需要将项目移动到工作目录下。

  • 导入自定义函数.py文件:点击New Notebook后会创建导入my_functions.py的notebook,于是我们可以使用自定义的函数库,这里主要路径不要写错,我们能够导入进来的.py文件一定是放在working里的文件,所以需要将input里面的文件复制到output的working路径里面。这样就能调用我们的自定义函数了。

  • 这个代码只能转移.py文件

# import module we'll need to import our custom module
from shutil import copyfile
 
# copy our file into the working directory (make sure it has .py suffix)
copyfile(src = "../input/create-function/my_functions.py", dst = "../working/my_functions.py")
  • 这个代码可以转移整个项目
import shutil
shutil.copytree(r'../input/vitcode/vision_transformer', r'./visio_transformer')


notebook这种形式不允许 parser = argparse.ArgumentParser() 这种自动参数的形式

2021最新jmeter接口测试入门到精通实战讲解,手把手教学

目录

一、线程组

1、添加线程组

2、线程组设置

二、HTTP请求默认值

1、添加HTTP请求默认值

三、HTTP请求

1、添加HTTP请求

2、HTTP请求内容填写

3、参数填写:

 四、HTTP信息头管理器

1、添加HTTP信息头管理器

2、内容填写

 五、查看结果树

1、添加查看结果树

2、查看结果树的位置

六、断言

1、添加断言

 2、断言填写

七:运行

八、清除

九、jmeter的参数化

方法1、通过csv做参数化

方法2、通过计数器做参数化


一、线程组

1、添加线程组

测试计划右键--添加--线程(用户)--线程组

2、线程组设置

线程数:可以理解为许你用户数量,比如要模拟10个用户,这里就设置为10

Ramp-Up时间:这个时间是这10个用户多久执行完要测试的操作,比如要模拟10个用户5s执行完登录的操作,这里就设置为5,1s登录两个用户。

循环次数:这个是指这10个用户要执行多少次,比如设置为2,就是这10个用户要重复登录两次。

 

 循环次数勾选为永远:就是这10个用户一直重复执行登录的操作

调度器:勾选调度器可以更加灵活的控制线程组执行的时间

持续时间:线程组执行时间,在该时间内,线程组会一直重复执行。

二、HTTP请求默认值

1、添加HTTP请求默认值

作用:可以填写请求协议、服务器地址等,放在线程组下面整个线程组的http请求会自动调用这些内容。

线程组右键--添加--配置原件--HTTP请求默认值

分别填写上协议、服务器地址、编码、端口号,后续的请求就不用填写这三项了。而且,如果想从测试环境切换到正式环境,直接再http请求默认值里面更换服务器地址就可以了。

三、HTTP请求

1、添加HTTP请求

线程组右键--添加--取样器--HTTP请求

2、HTTP请求内容填写

名称:给这个接口起个名称,不然过两天就不知道这个接口是干什么的了。

注释:给这个接口加个相应的注释。

协议:填写http或者https(在http请求默认值中填写后,这里就不用再次填写了)

服务器名称或IP:填写服务器地址(在http请求默认值中填写后,这里就不用再次填写了)

端口号:填写端口号(在http请求默认值中填写后,这里就不用再次填写了)

HTTP请求:根据接口实际的请求方式选择

路径:填写接口的地址

3、参数填写:

参数填写有三种情况

第一种:请求头中Content-Type: application/json,这一种要以json的格式传递参数,如下

第二种:请求头中Content-Type: application/x-www-form-urlencoded,这一种以表单的格式传递参数,如下

 

 四、HTTP信息头管理器

1、添加HTTP信息头管理器

选择接口右键--添加--配置元件--HTTP信息头管理器

2、内容填写

 五、查看结果树

1、添加查看结果树

线程组右键--添加--监听器--查看结果树

2、查看结果树的位置

查看结果树如果放在线程组下,运行之后就显示整个线程组的所有接口的运行结果,如下

查看结果树放在单接口下,运行后只显示该接口的运行结果,如下

六、断言

作用:判断接口返回的结果是正确的

1、添加断言

选择接口右键--添加--断言--响应断言

 2、断言填写

七:运行

jmeter的运行直接点击顶部的绿色三角形

八、清除

想清除之前的运行记录,可以点击顶部的扫把

 

九、jmeter的参数化

在接口测试的时候,有些接口会用到大量的数据,比如注册的时候需要100个账号,这个时候就要用到参数化,参数化有两种方法。

方法1、通过csv做参数化

第一步:在桌面新建一个表格,表格内容填写如下

第二步:在jmeter中添加CSV配置元件

优点:可以测试接口的异常情况,比如注册接口再做参数化的时候可以把账号、密码分别设置为空,账号设置为30位数等等。

线程组右键--添加--配置元件--CSV  Data  Set  Config

设置CSV配置元件

 在http请求中引用,引用方法${变量名称}

因为CSV文件中写了10条数据,所以在线程组这里把线程数设置为10,再点击运行。

方法2、通过计数器做参数化

1、添加计数器

线程组右键--配置元件--计数器

2、计数器设置

 

万事之先,圆方门户。虽覆能复,不失气度。

以上是关于Kaggle 新手入门必看,手把手教学的主要内容,如果未能解决你的问题,请参考以下文章

10分钟,手把手教学正确还原京东倒计时,初学者必看,简单易懂!

7个 Python小项目,手把手教学——5分钟教会Python新手

单元测试界的高富帅,Pytest框架,手把手教学,从入门到精通

前端书籍推荐

手把手入门+结构体排序教学

2021最新jmeter接口测试入门到精通实战讲解,手把手教学