excel做数据分析必知的编程语言
2020-09-09
点击量:次 Microsoft Excel可能是商业社区中最受欢迎的单个软件。Excel已有30多年的历史,至今仍在全球各个国家/地区每天都在使用Excel来存储,处理和分析数据。它的用途非常广泛,因此成为Excel向导可以极大地提高你的收入。
但是Excel虽然很棒,但也有其局限性。如果你每天都在处理数据,那么这些限制是很重要的。我们与AAA教育大数据分析讲师张国栋进行了交谈,他为我们提供了九个学习编程的理由,说明即使你已经是Excel大师并且不打算尝试从事数据工作,你仍然可以花点时间学习用于数据分析的编程语言科学。
在以下几点中,AAA教育大数据老师将Excel与R(一种用于数据分析的流行编程语言)中的数据分析进行了比较。但是,大多数这些优点对于Python(另一种用于处理数据的流行编码语言)也是如此。我们在这两种方法中均提供免费的入门课程,并且两者都是对Excel的重大提升。
1、更强大的数据导入和处理
与Excel不同, R本质上可以读取任何类型的数据。 它本身无法读取的数据格式仍然可以使用:还有专门设计用于读取XML,JSON,SPSS,Excel,SAS和STATA数据文件的R包,你还可以从网站抓取数据并执行SQL查询。
在R中,数据操作(如子集,合并和重新编码等任务)也要容易得多。任何花费大量时间试图合并和清理Excel中的大型数据集进行分析的人都可以证明这是一个困难且耗时的过程。但是R以及一些受欢迎的软件包(如dplyr,tidyr和plyr)使此过程更加简单和快捷。
2、更轻松的自动化
Excel具有GUI(一个用户界面,你可以单击按钮而不是编写代码)的事实无疑使它更易于访问,但是当你尝试自动执行一个流程或多次运行相同的分析时,这可能是一个很大的障碍。
使用编程语言可以使速度更快。例如,如果你需要每周对一组新的销售数据进行相同的分析,则在Excel中执行此操作将需要每周手动打开一个不同的文件,并重新输入分析所需的公式和其他元素。但是你可以使用R之类的语言自动执行相同的分析,编写一个简单的脚本来导入新数据并每周运行相同的分析,并以你想要的任何格式输出结果。
3、更轻松地处理大量数据
在Excel中,项目以工作表或标签的形式组织,如果你曾经处理过包含大量工作表或每张工作表中都有大量数据条目的Excel文件,那么你会知道它会变得非常慢。在Excel中使用足够的数据有时甚至会导致崩溃。如R编程语言,但是,可以处理大量数据的多少更迅速,并且在同样的方式,Excel可以,所以你不必担心失去你的工作担心,他们不能真正崩溃。
4、更可重复
当你可以向他人解释你所做的事情,并且他人可以轻松地复制你的工作以进行确认(或者你可以自己复制以进行再次检查)时,数据分析最有用。但这在Excel中很难实现。无法清晰地记录或说明你在分析中采取的步骤,而重新进行分析将需要重新打开原始Excel文件并手动重新执行你执行的所有步骤(如果你还记得的话)。
在R之类的编程语言中,重现结果要容易得多。重新运行分析就像按“ Enter”一样简单,并且可以在代码中添加注释,以解释过程中每个步骤的发生,因此任何人都可以仔细检查你的工作。
5、更容易发现和修复错误
当你在Excel中出错时,找出问题所在可能很困难,因为你可能必须滚动浏览数千个数据单元以找到答案,或者尝试手动重新追踪你的步骤。
但是,当你使用R之类的编码语言出错时,通常会收到一条错误消息,说明计算机认为出了什么问题。当然,你还应该有注释来解释代码的每一行,这样可以更轻松地返回并重新检查每个步骤以查找错误。通常,程序员还使用系统进行版本控制,因此,如果遇到以前从未遇到过的错误,则可以将当前代码与其先前的迭代进行比较,以了解发生了什么问题。
这并不意味着你将始终能够立即纠正错误。但是,数据分析中的错误是不可避免的, 在R中查找和修复这些错误比在Excel中更容易。
6、开源可访问性
Excel很棒,但是它是Microsoft拥有的,这意味着从错误,更新和功能支持方面,你最终会感到这家总部位于华盛顿的公司的异想天开。与Excel不同, R不是黑匣子。你可以检查R代码中执行的任何功能或计算。你甚至可以通过更改代码来修改和改进关键功能。
Python也是开源的,对于这两种语言,这也意味着任何开发人员(包括你)都可以创建包来扩展该语言并添加功能或提高易用性。两种语言都有由第三方开发人员创建的流行和广泛使用的软件包和库,它们使数据分析和可视化变得更加容易。
诚然,Excel确实具有一些第三方加载项,但是由于它是专有软件,因此功能不那么强大,并且添加所需的功能并非易事。
7、先进的统计和机器学习功能
R和Python均具有比Excel更高级的统计功能(R尤其如此,因为R在设计时就考虑了高级统计分析)。这两种语言也允许创建机器学习模型(通常与机器的整合学习包和框架,如caret,scikit-learn和TensorFlow)。
8、先进的数据可视化功能
有更好的,更先进的国家的最先进和图形处理能力与显然,Excel可以创建各种图表,但是编程语言可以做的更多,特别是R lattice,ggplot2和shiny包。
在企业环境中,创建具有吸引力和信息量大的可视化功能的能力特别重要,因为在公司决策的人员可能不熟悉统计分析或不擅长阅读复杂的图表。你越容易理解数据,就越有可能对你的工作产生真正的影响。
9、跨平台稳定性
R和Python等编程语言的脚本可以在任何平台上运行而不会打ic。你可以确信你的R脚本可以在Windows,Mac和Linux计算机上使用,但是Excel文件并非总是如此。
当然,这并不是说你应该完全放弃Excel!与编程语言相比,它确实具有一些优势。由于其图形用户界面,在Excel中手动输入数据通常会更容易,并且如果你只想快速浏览电子表格,那么与使用代码进行查找相比,浏览Excel文件会更快,更容易。Python和R 都具有以可视表格式呈现正在使用的数据部分的方法,以便更轻松地查看正在使用的数据,但是在Excel中,这种可视数据表示是默认的,而不是某些东西。你必须有意实施。
当然,很明显,如果你要进行大量数据分析,则使用编程语言将比Excel提供一些非常重要的优势。如果你使用Excel的工作很多,学习的R或Python编程的哪怕是一点点可以为你节省时间每个星期在Excel中所花费的时间。如果你只熟悉Excel,那么学习R或Python之类的编程语言的想法可能会令人生畏。
但这并不像你想的那样困难!在AAA教育,我们相信任何人都可以学习编码,并且我们提供了免费的R和Python入门类,你可以在没有任何编码经验,没有任何数学或工程背景的情况下上课。
- ↓ ↓ ↓ 继续阅读与本文标签相同的文章
- excel做数据分析必知的编程语言
- excel