因为处理地理数据时所需的GeoPandas库,是基于Pandas构建的,因此需要首先了解Python数据分析主要使用两个库【Numpy(Pandas库的基础)】和【Pandas】。
两个库均可使用pip安装。
pip install numpy pandas
1.数据维度:
学习numpy、pandas库首先需要了解数据维度。
数据维度就是在数据之间形成特定关系,表达多种数据含义的一个很基础的概念。
-
一维数据:
一维数据由对等关系的有序或无序数据构成,采用线性方式组织。
3.14 , 4.15 , 5.16 , 6.17 , 7.18 , 8.19
-
二维数据:
二维数据由多个一维数据构成,是一维数据的组合形式。
表格是典型的二维数据(例如下面所示的大学排名表格)。
-
多维数据:
多维数据由一维或二维数据在新维度上扩展形成。
例如,多个年度的大学排名,就是由上面的二维数据在时间维度上进行扩展形成的。
-
高维数据:
高维数据仅利用最基本的二元关系展示数据间的复杂结构。
# 以键值对的形式将数据组织起来
{
"firstName":"Lei",
"lastName" :"Li",
"address" :{
"city" :"上海市",
"streetAddress" :"四平路1239号",
},
"prof" :["uban planning","computer"]
}
2.数据维度的Python表示:
-
一维数据:列表和集合类型;
[ ]
{3.11,3.12,3.13,3.14}
-
二维数据、多维数据:列表嵌套形式;
[[3.11,3.12,3.13,3.14],
[3.15,3.16,3.17,3.18]]
-
高维数据:字典类型或数据表示格式(JSON、XML、YAML等格式);
# 字典类型
dict = {
"firstName":"Lei",
"lastName" :"Li",
}
本篇文章来源于微信公众号: 码农设计师