火币HTX
火币是全球三大交易所之一,虚拟货币交易平台安全可靠,注册领取新人礼包!
1.无处不在的数据可视化
提到数据可视化,大家可能脑海里就会出现里各种图表、绚丽大屏、或者科幻电影里酷炫仪表。其实,日常生活里面,到处都有数据可视化的影子。
手表就是数据可视化的例子,最少只需要3个视觉元素(时针、分针和秒针),就可以表达43200个状态。另外,水银温度计和地铁线路图,也是生活中数据可视化的运用!
2.为什么需要数据可视化?
视觉是人类获取外界信息最高速,最主要也是最重要渠道。 超过50%的人脑功能用于视觉感知,而大脑接收到的信息 90% 来自视觉,人类利用视觉获取和处理的信息量,远远超出其他途径。
视觉的信息带宽是最大的,其次是触觉和听觉。
人类大脑处理图像的速度比文本快 6 万倍。所谓的“可视化”,就是利用人类视觉化的思考能力,对数据进行可视表达以增强认知的技术。
3.Python数据可视化学习
说到python的常见应用,很多人会想到python的数据分析,作为数据分析中的表现层面,数据可视化都是其中必不可少的部分。但本文并非只推荐无任何数据分析需求仅需要做漂亮可视化图表的人学习python数据可视化。本文介绍的只是一些常见的python第三方库,毕竟作为一个工具来说,这些第三方库使用起来并不是非常方便,也有一定的学习成本,普通的可视化推荐使用excel、wps,有条件的可以使用各种BI工具如:tableau,powerBI等。
那什么情况下需要用到python数据可视化库呢?
如果是在某些特定场景中,需要用到python做数据分析,输出各种图表用于辅助分析或者数据报告展示,那这些库则显得必不可少,接下来将介绍一些如何学习的方法和第三方库的介绍:
比如选择一款合适的库,先了解各种库的特点,选择合适的库,然后学习绘图原理,掌握的知识点
选择官网是最省钱和系统的学习的最佳路径,至于效率方面见仁见智。选择书籍或视频的方式也未尝不可。
- 了解几大常用的可视化库,比如特性、使用场景、效果图等;
- 选择一款适合自己的第三方库,比如要做国内地图类的项目,选择pyecharts;
- 学习该库的绘图原理,各种函数调用和参数修改,就是所谓的”调参”;
- 不断练习、练习、练习;
推荐学习使用的开发工具:JupyterNotebook。在数据分析和可视化的应用中,jupyter无疑是首选,相比其他如pycharm等工具,可以将每一步的可视化图表输出在同一页面中,方便比较分析。
4.可视化库介绍
1、Matplotlib
官方文档地址:
https://matplotlib.org/2.0.2/index.html
Gallery画廊地址:
https://matplotlib.org/2.0.2/gallery.html
基础讲解:使用matplotlib绘图的原理,主要就是理解figure(画布)、axes(坐标系)、axis(坐标轴)三者之间的关系。
步骤:创建figure图形对象-> 获取对应位置的axes坐标系对象->调用axes对象,进行对应位置的图形绘制->显示图形。下图是帮助我们理解figure和axes的关系。
官方文档地址:
https://seaborn.pydata.org/tutorial.html
Gallery画廊地址:
https://seaborn.pydata.org/examples/index.html
基础讲解:原理比较简单,主要是通过sns对象调用各种类型表格的函数,这里举一个例子:
- import numpy as np
- import seaborn as sns
- from scipy import stats, integrate
- %matplotlib inline #导入库
- sns.set(color_codes=True)
- np.random.seed(sum(map(ord, “distributions”)))#构造数据,每次产生的随机数相同
- x = np.random.gamma(6, size=200)
- #输出图像的主要函数,distplot是直方图,根据需求选择不同的图表函数即可sns.distplot(x, kde=False, fit=stats.gamma)
官方文档地址:
https://pyecharts.org/
Gallery画廊地址:
http://gallery.pyecharts.org/#/README
这是国人开发的一个Echarts与Python结合的轮子,可以结合JavaScript等前端技术定制我们要的主题风格,功能非常强大,也是数据可视化非常常用的一个工具,也是比较推荐新手学习的。
基础讲解: 选择图表类型-> 声明图形类并添加数据,比如添加x轴和y轴的数据->选择全局变量set_global_opts,设置参数->显示及保存图表;
- from pyecharts.charts import Bar
- from pyecharts import options as opts
- # V1 版本开始支持链式调用bar = ( Bar() .add_xaxis([“衬衫”, “毛衣”, “领带”, “裤子”, “风衣”, “高跟鞋”, “袜子”])
- .add_yaxis(“商家A”, [114, 55, 27, 101, 125, 27, 105])
- .add_yaxis(“商家B”, [57, 134, 137, 129, 145, 60, 49])
- .set_global_opts(title_opts=opts.TitleOpts(title=”某商场销售情况”))
- )bar.render()# 不习惯链式调用的开发者依旧可以单独调用方法bar = Bar()bar.add_xaxis([“衬衫”, “毛衣”, “领带”, “裤子”, “风衣”, “高跟鞋”, “袜子”])
- bar.add_yaxis(“商家A”, [114, 55, 27, 101, 125, 27, 105])
- bar.add_yaxis(“商家B”, [57, 134, 137, 129, 145, 60, 49])
- bar.set_global_opts(title_opts=opts.TitleOpts(title=”某商场销售情况”))
- bar.render()
4、ggplot
官方文档地址:
http://ggplot.yhathq.com/
5、Bokeh
官方文档地址:
https://docs.bokeh.org/en/latest/
Gallery画廊地址:
https://docs.bokeh.org/en/latest/docs/gallery.html
6、Pygal
官方文档地址:
http://www.pygal.org/en/stable/
7、Plotly
官方文档地址:
https://plotly.com/
8、Geoplotlib
Github地址:
https://github.com/andrea-cuttone/geoplotlib
网站名称:玩转网
本文链接:
版权声明:知识共享署名-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)协议进行许可
本站资源仅供个人学习交流,转载时请以超链接形式标明文章原始出处,(如有侵权联系删除)