新闻稿




吉姆斯科特

吉姆斯科特是开发人员关系,数据科学,NVIDIA(www.nvidia.com.)。

在他的职业生涯中,斯科特在大数据,监管,数字广告,零售分析,物联网,金融服务,制造,医疗保健,化学品和地理信息系统行业中担任运行运营运营,工程,体系结构和QA团队。他已经建立了每天处理超过500亿次交易的系统,他在Dow Chemical的高吞吐量计算的工作是一个更标准化的大数据概念,如Hadoop。

吉姆斯科特的文章

保护信息系统和数据是任何组织的基础。检测Insider威胁可能对威胁检测系统和安全分析师来说是一个相当大的挑战。这是由于难以从内部系统行为数据确定非正常操作。

发表于4月5日,2021年4月

我们在Hadoop的出现时,我们看到的构造技术转变不会再次看到相当长的时间,但不要太舒服,因为新工具和技术支持数据科学空间并没有放慢任何时间很快。

发表于2021年1月18日

在谈论数据科学时,大多数人都感觉好像是两个阵营中的一个,就数据大小。第一个是一些小数据 - 数百兆字节到几个千兆字节。第二个是terabytes的千兆字节。注意我没有说“大数据”,也没有说“Petabytes”。源数据集可以从PetaByte级刻度开始,但请记住数据通常非常原始,并且大多数都被忽略了。

发表于2020年9月11日

大流行在我们的关键基础设施安全,供应链脆弱性和现代技术的利用中揭示了在全球范围内减轻和恢复社区的影响。虽然大型国际公司已经使用了先进的技术平台,但大流行是暴露了应急管理和公共卫生机构的事实落后于曲线或未充分利用数据科学,开源软件和高性能计算资源。

发表于5月28日,2020年5月28日

由于数据大小在过去十年中生长,因此运行ETL流程所需的时间才能支持Myriad下游工作负载。十年前,大多数人只考虑更快地制作KPI仪表板。随着时间的推移向前推出,他们开始考虑从他们的数据中获取更多智能分析,并且数据大小从千兆字节到Terabytes迅速增长。

发表于5月18日,2020年5月18日

加速数据科学生态系统

发表于2019年12月16日

众所周知,数据科学家花费约90%的时间执行数据物流相关的任务。任何数据科学家可以做到减少它的事情都很好地利用他们的时间,以及整个组织的利益。进入Rapids-A数据科学框架,提供支持,以完全在GPU上执行端到端数据科学管道。

发表于2019年9月3日

这几天apache气流是转动头。它与许多不同的系统集成,它很快就会变得完全齐全,因为过去30年来的工作流程管理已经存在。这主要是归因于数百个任务的运营商,例如执行Bash脚本,执行Hadoop作业以及使用SQL查询数据源。

发表于2019年5月16日

Kubeflow是一个工作流程工具,它自动旨在制作简单的机器学习工作流程,易于构建,可扩展和便携式。它提供了图形的最终用户工具来设置和定义管道中的步骤。最重要的是,随着数据科学家构建了他们的用例,它们增加了越来越多的步骤,并且在使用Kubeflow时,他们最终有一个被记录的可重复的过程。

发表于2019年4月24日

应用程序和AI数据的重要性

发表于2019年1月09日

由于GPU功能中的戏剧性上升,就是在一次性手动过程中创建和运行模型的数据科学家的日子。这是一个好消息,因为一次性模型通常没有优化以获得最佳结果。坏消息是,随着时间的推移,包括迭代的模型总数 - 用作输入的数据量和模型产生的数据量快速螺旋失控。额外的坏消息是与模型,数据,作业和工作流管理有各种复杂性。

发表于2018年9月26日

BlockChain是近期历史上企业数据库场景中最大声的新技术之一。然而,区块链的概念并不是一个新的概念。它更像是对现有构建的重新打造,为任何用于其用例而利用它的组织提供新的福利。它提供了不可撤销证明的好处,可减少信息交换的摩擦。

发表于2018年5月11日

数据,数据,数据。随着过去15年来发生的指数数据增长,需要通过该数据来筛选,以找到问题的答案。

发表于2018年3月26日

在一个新技术通常作为彩虹和独角兽呈现出行业的世界中,总是有人试图弄清楚如何解决业务问题,并使这些伟大的新技术在一起。事实是,所有这些技术都需要时间来学习,也需要时间来确定每个人可以解决的问题。

发表于2018年1月05日

许多人不确定深度学习,机器学习和人工智能之间的差异。一般来说,随着辩论的最小辩论,合理地接受了,人工智能最容易被分类为我们尚未弄清楚如何解决,而机器学习是一个实用的应用程序解决问题,例如与异常检测

发表于2017年9月20日

当人们谈论下一代申请或基础设施时,在整个行业中经常呼应的是云。在申请方面,“无法无关”的概念变得越来越少,梦想梦想和更多的现实。基础设施侧已经证明可以提供每小时或更粒度支付计算费用的能力。

发表于2017年5月15日

很难找到不谈论或考虑使用容器部署和管理其企业应用程序的人。一个容器看起来像在系统上运行的另一个进程;不需要专用的CPU和预先分配的内存以运行容器。建筑,部署和管理容器的简单性是容器在普及的迅速增长的原因之一。

发表于2017年4月7日

Hadoop基础和关键技术在不断发展的Hadoop生态系统中

发表于2017年2月03日

选择何时利用云基础架构是一个不应轻描淡写的主题。争论云作为业务战略的一部分时,应考虑一些问题。

发表于2016年10月4日

在不断发展的Hadoop生态系统中的7个关键技术

发表于2016年6月3日

NoSQL数据库诞生于需要更有效地扩展交易持久性商店。在一个关系数据库管理系统(RDBMS)是国王的世界中,这比做了更容易。

发表于2016年3月29日

Hadoop及其伴随的生态系统在这里留下来

发表于2016年1月19日

实时数据访问始终是一个很好的时光

发表于2015年10月13日

Google 新利国际White Papers启发了许多伟大的开源项目。然而,到目前为止缺少的是一种使这些技术能够共同推出这些技术,使任何数据为中心的组织可以从其整个数据中心的每个技术的能力中受益,并且以任何单一白皮书未记录的新方法。这被称为“Zeta架构”。

发表于2015年5月19日

为了真正欣赏Apache钻研,重要的是要了解这个空间中项目的历史,以及实现其实施的设计原则和目标。

发表于2015年4月8日