所在的位置: html >> html发展 >> 入门始于JupyterNotebooks

入门始于JupyterNotebooks

JupyterNotebooks是数据科学/机器学习社区内一款非常流行的工具。AnalyticsVidhya的PranavDar近日发表了一篇上手使用JupyterNotebooks的指南,从安装到基本功能进行了简洁清晰的介绍。

引言

应该使用哪个IDE/环境/工具?这是人们在做数据科学项目时最常问的问题之一。可以想到,我们不乏可用的选择——从RStudio或PyCharm等语言特定的IDE到SublimeText或Atom等编辑器——选择太多可能会让初学者难以下手。

如果说有什么每个数据科学家都应该使用或必须了解的工具,那非JupyterNotebooks莫属了(之前也被称为iPython笔记本)。JupyterNotebooks很强大,功能多,可共享,并且提供了在同一环境中执行数据可视化的功能。

JupyterNotebooks允许数据科学家创建和共享他们的文档,从代码到全面的报告都可以。它们能帮助数据科学家简化工作流程,实现更高的生产力和更便捷的协作。由于这些以及你将在下面看到的原因,JupyterNotebooks成了数据科学家最常用的工具之一。

在本文中,我们将介绍JupyterNotebooks并深入了解它的功能和优势。

读完本文之后,你就知道你应该为你的机器学习项目使用JupyterNotebooks的原因了。你也会知道为什么人们会认为JupyterNotebooks比该领域内的其它标准工具更好。

准备好学习了吗?现在开始吧!

目录

JupyterNotebooks是什么?如何安装JupyterNotebooks?开始上手!使用神奇的功能不只限于Python——在JupyterNotebooks中使用R、Julia和JavaScriptJupyterNotebooks中的交互式仪表盘——何乐不为?键盘快捷键——节省时间且更有生产力!有用的JupyterNotebooks扩展保存和共享你的笔记本JupyterLab——JupyterNotebooks的进化最佳实践和技巧

JupyterNotebooks是什么?

JupyterNotebooks是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。

其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。

当你还处于原型开发阶段时,JupyterNotebooks的作用更是引人注目。这是因为你的代码是按独立单元的形式编写的,而且这些单元是独立执行的。这让用户可以测试一个项目中的特定代码块,而无需从项目开始处执行代码。很多其它IDE环境(比如RStudio)也有其它几种方式能做到这一点,但我个人觉得Jupyter的单个单元结构是最好的。

正如你将在本文中看到的那样,这些笔记本非常灵活,能为数据科学家提供强大的交互能力和工具。它们甚至允许你运行Python之外的其它语言,比如R、SQL等。因为它们比单纯的IDE平台更具交互性,所以它们被广泛用于以更具教学性的方式展示代码。

如何安装JupyterNotebooks?

你可能已经猜到了,你首先需要在你的机器上安装Python。Python2.7或Python3.3(或更新版本)都可以。

1.Anaconda

对新用户而言,一般的共识是你应该使用Anaconda发行版来安装Python和JupyterNotebooks。

Anaconda会同时安装这两个工具,并且还包含相当多数据科学和机器学习社区常用的软件包。你可以在这里下载最新版的Anaconda:


转载请注明:http://www.aierlanlan.com/tzrz/5151.html