- 第二节:数据预处理
Posted 海轰Pro
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了- 第二节:数据预处理相关的知识,希望对你有一定的参考价值。
目录
前言
Hello!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研。
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
唯有努力💪
知其然 知其所以然!
本文仅记录自己感兴趣的内容
2.2. 数据预处理
2.2.1. 读取数据集
创建一个人工数据集,并存储在CSV(逗号分隔值)文件 路径: ../data/house_tiny.csv
import os
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
f.write('NumRooms,Alley,Price\\n') # 列名
f.write('NA,Pave,127500\\n') # 每行表示一个数据样本
f.write('2,NA,106000\\n')
f.write('4,NA,178100\\n')
f.write('NA,NA,140000\\n')
../data/house_tiny.csv
表示在上一层目录新建一个data文件夹,再在其中创建一个csv文件,存放数据
os.makedirs()
方法用于递归创建目录
参考:https://blog.csdn.net/viven_hui/article/details/101274815
读取csv文件中的数据
import pandas as pd
data = pd.read_csv(data_file)
print(data)
2.2.2. 处理缺失值
使用fillna
处理缺失值
fillna的使用
:https://blog.csdn.net/lady_chen/article/details/114294852
get_dummies
的使用
进行one-hot编码
2.2.3. 转换为张量格式
结语
学习资料:http://zh.d2l.ai/
文章仅作为个人学习笔记记录,记录从0到1的一个过程
希望对您有一点点帮助,如有错误欢迎小伙伴指正
以上是关于- 第二节:数据预处理的主要内容,如果未能解决你的问题,请参考以下文章
- 第二节:注意力汇聚:Nadaraya-Watson 核回归
Web前端开发笔记——第二章 HTML语言 第二节 基本标签
Web前端开发笔记——第三章 CSS语言 第二节 CSS选择器