受到推崇的, 2024

编辑的选择

1010Data在R

Anonim

R编程语言继续渗透到大数据环境中。数据分析平台提供商1010data已将R添加到其库中,允许其许多企业客户使用面向统计的编程语言来查询他们的数据。“我们知道很多数据科学家和建模者已经使用R成长起来了,那就是他们所熟悉的环境,“1010data营销副总裁Jed Alpert说。 “他们在R中构建数据模型,然后利用我们的平台对所有数据运行分析。”

1010data成立于2010年,为组织提供了一系列用于分析大型数据集的服务,消除了需求建立系统来完成内部工作。

使用R语言的新选项,组织不需要使用1010数据自己的查询语言来训练他们的数据科学家。与其他1010数据服务一样,R可以通过浏览器访问。

新服务也将有利于R的长期用户,他们希望使用该语言来调查更大的数据集,直到最近才开始相当困难。 R的库存实现是一个单线程应用程序,这意味着它不能有效地用于跨多个服务器分布的数据集。对于这项服务,1010data开发了自己的软件,以针对大型分布式数据集运行R.

全球拥有数百万用户,R是专为统计计算和预测分析而设计的最广泛的编程语言之一,与SAS, MatLab,Mathematica和一些Python库。随着越来越多的组织开始进行大数据分析,以更多地了解他们的客户并改善运营,它的知名度也在不断提高。“R真的很擅长允许用户修改不同的统计分析方法来满足他们的需求,”Chris Simon说,1010数据高级分析师

其他一些公司最近还将R扩展为大数据使用。 Hewlett-Packard创建了Distributed R,这是一个开源软件包,用于跨计算机群集运行该语言。微软最近收购了R分销商Revolution Analytics,它提供R语言作为其机器学习云服务的接口。

超过700个组织使用1010数据,其中包括许多零售,制造,电信和金融领域的大公司服务。以纽约为基地的1010data代表这些客户端维护超过19万亿行数据。

Top