据CIO介绍,“数据工程师设计、构建和优化系统,以进行大规模数据收集、存储、访问和分析。他们创建数据管道,供数据科学家、以数据为中心的应用程序和其他数据消费者使用。” Dataquest确定了数据工程师的三个主要角色:通才、以管道为中心和以数据库为中心。较小的公司可能会聘请一名通才数据工程师,他必须为整个组织提供服务。这据分析,而在较大的公司中,数据分析是数据科学家的职责。
在这些较小的公司中,数据分析可能会取代大型企业所需的更深入波兰电报放映的数据工程。 管道专用数据工程师通常出现在数据需求更复杂的中型公司中。他们通常在团队中工作,将原始数据转换为有用的分析格式,例如让公司专业人员能够执行自己的数据分析任务的工具。 以数据库为中心的数据工程师专注于开发分析数据库,包括 ETL 任务,将数据移入仓库,然后可以访问这些仓库进行报告、分析和数据挖掘。
这些专业人员通常在大型公司工作,数据来自各种来源。 具体任务如下。 设计 在设计数据环境时,数据工程师必须首先从公司领导那里收集数据需求,例如如何使用数据、哪些团队成员需要访问数据以及数据应存储多长时间。 加工 原始形式的数据无法用于分析,因此必须对其进行处理才能发挥此功能。为此,数据工程师使用工具从不同来源检索数据,将其转换为指定格式,分配元数据,并将数据存储在存储系统中。