个性化阅读
专注于IT技术分析

推荐哦!Talend面试题和答案汇总详解

Talend面试题

下面列出了常见的Talend面试问题和答案。

1)定义Talend?

Talend是功能最强大的ETL工具之一, 其中包含各种产品, 例如数据质量, 应用程序集成, 数据管理, 数据集成, 数据准备和大数据。这些产品用于软件解决方案。

它提供开源版本和高级版本。

Talend用于统一存储库以存储和重用元数据。


2)什么是Talend Open Studio?

Talend的第一个产品是2006年推出的Talend Open Studio, 而Talend Open Studio的最新版本是v7.0。1TalendOpen Studio是基于Eclipse的开发人员工具和作业设计器工具。

Talend Open Studio用于连接Excel, RDBMS, SaaS和大数据生态系统等数据源以及CRM, SAP和EXCEL等技术。


3)Talend用哪种编程语言编写?

Talend用Java编程语言编写。


4)列出Talend Open Studio的优势?

以下是Talend开放工作室的优势:

  • 在Talend Open Studio的帮助下, 我们可以轻松地管理ETL流程中涉及的所有步骤。
  • Talend open studio充当代码生成器, 可自动将所有基础作业转换为Java代码。
  • 它用于更新和转换各种来源中存在的数据。
  • Talend开放工作室是开源的。这就是为什么它是免费的, 并且可以节省大量成本。

5)向Talend Studio解释一个数据集成平台, 它与TOS大数据有何不同?

Talend数据集成是一个开放源代码测试工具, 它允许ETL(提取, 传输和加载)测试, 其中包括ELT测试的所有功能。

数据集成是一种具有开放, 可扩展的体系结构的工具, 它还可以更快地响应业务请求。

用户可以使用Talend数据集成工具在具有不同操作系统的远程服务器上执行ETL任务。

Talend提供用于数据集成和大数据平台的Open Studio。

而且, Talend数据集成与Talend Big数据之间的主要区别在于, Data Integration仅生成Java代码, 而Big数据与Java代码一起生成MapReduce。


6)Talend Studio提供多种连接类型?

Talend studio中的多种连接类型如下:

  • 重复
  • 触发
  • 链接

行:行连接器用于维持实际的数据流;以下某些行连接器如下:

主要, 查找, 过滤器, 拒绝, 错误拒绝, 输出, 唯一/重复, 多个输入/输出等

有关行连接器的更多详细信息, 请参见以下链接:https://www.srcmini.com/talend-data-integration-components-and-connectors

迭代:迭代用于对目录中包含的文件, 文件中可用的行或由迭代连接器完成的数据库条目执行循环。它主要用于连接流的星形部分(在子作业中)。

触发器:触发器连接器用于在作业和子作业之间创建依赖关系。

Talend中提供两种类型的触发器:

  • 子作业触发器:
    • OnSubjobOK
    • OnSubjobError
    • 如果运行
  • 组件触发器:
    • OnComponentOK
    • OnComponentError
    • 如果运行

链接:链接连接器仅与ETL组件一起使用。这种类型的连接不处理实际数据, 而仅处理与操作表有关的元数据。


7)OnSubjobOK和OnComponentOK之间的区别?

OnSubjobOK和OnComponentOK之间的区别如下:

OnSubjobOK OnComponentOK
一旦源组件的执行完成而没有任何错误, 则使用这种类型的连接来触发目标组件。
它是组件触发器的一部分。

8)描述Talend Studio中的固定, 存储库和通用模式吗?

Talend支持多种类型的架构, 如下所示:

固定模式:固定模式是只读模式。对于某些组件, 它内置在Talend中。

存储库架构:我们可以重用存储库架构, 或者如果我们在架构中进行了一些更改, 它将自动影响所有作业。

通用模式:如果没有任何特定的元数据符合我们的需要, 或者如果我们没有任何其他源文件来采用该模式, 则可以创建通用模式。


9)什么是ETL流程?

ETL代表提取, 转换和加载。 ETL是数据仓库中的一个过程, 用于从源系统中提取数据并将其存储在数据仓库中。

提取:

我们从源系统中提取数据, 它主要用于从源系统中检索所有必需的数据, 并且源系统可以是RDBMS, ERP和CRM。

转型:

该转换用于将提取的数据加载到目标数据库中。

正在加载:

提取的数据和转换后的数据将加载到目标数据库。


10)ELT和ETL之间的区别?

ETL和ELT之间的区别如下:

ETL ELT
ELT代表提取, 加载和转换。
在ELT过程中, 首先提取数据, 然后将其加载到数据库中, 然后对其进行转换。
ELT流程支持非结构化数据。
ELT是数据库中的数据处理过程, 主要用于数据仓库。

11)列出Talend工具栏中存在的不同项目?

下面列出了Talend Open Studio工具栏中存在的多个项目:

Talend面试题
  • 保存:”保存”按钮用于保存当前作业设计。
  • 查找特定作业:此按钮用于显示相关对话框, 使我们可以打开”存储库”面板中列出的任何作业。
  • 运行作业:”运行作业”按钮用于执行作业, 当前显示在设计工作区窗口中。
  • 创建:此按钮用于启动相关的创建窗口。而且, 我们可以创建任何存储库项目, 例如业务模型, 作业设计, 上下文, 例程和元数据。
  • 项目设置:项目设置按钮可帮助我们启动[项目设置]对话框。借助此对话框, 我们可以向当前项目添加描述, 还可以自定义面板显示。
  • 检测并更新所有作业:此图标用于搜索可用于我们的作业的所有更新。
  • 导出Talend项目:用于启动[导出Talend项目]窗口。
  • 导出项目:导出项目按钮用于将存储库项目导出到存档文件, 并检查源文件是否包含在存档中。
  • 导入项目:”导入项目”按钮用于将存储库项目从存档文件导入到我们当前的Talend Studio中。

12)Talend Open Studio主窗口提供哪些不同的功能?

Talend Studio的主窗口中提供了四种不同的功能, 如下所示:

  • 资料库
  • 设计工作区
  • 组件面板
  • 配置选项卡

13)Talend Open Studio中的存储库是什么?

Talend studio在存储库中收集与用于设计作业的技术项目相关的数据, 我们也可以在此处创建和管理元数据。

“存储库”面板包含业务模型, 作业设计, 元数据, 文档, SQL模板和回收站等。


14)你对元数据了解什么?

元数据是文件的集合, 其中包含我们要在各种作业中重用的冗余信息, 例如架构和属性数据。

  • 如果要开发任何项目, 可以通过将对象从存储库中拖放到设计工作区窗口中来在工作中使用元数据。
  • 元数据包含许多来源, 例如数据库连接, 各种类型的文件(例如Azure, LDAP, Marketo, Salesforce, Web服务, Hadoop集群, FTP), 因此Talend Metadata Repository下提供了选项。

15)存储库和内置库之间的区别?

存储库和内置库之间的区别如下:

Repository Built-in
在内置中, 所有数据都存储在作业内部。
我们可以手动输入所有数据。
它将数据从”存储库”更改为”内置”, 并编辑内置数据。

16)为什么我们使用tMap组件?

tMap是一个高级组件, 它使我们能够执行联接操作, 列或行过滤以及多个输出。

tMap组件用于将数据从单个或多个源转换并路由到单个或多个目的地。


17)tMap组件支持哪些类型的联接?

tMap组件支持多个联接和联接模型, 如下所示:

联接:内部联接, 左联接

联接模型:唯一联接, 首次联接和所有联接等。


18)什么是tReplicate组件?

tReplicate组件将传入的模式复制到两个相似的输出流中。它使我们可以在同一架构上执行不同的操作。 tReplicate组件用于根据需要多次复制一行。


19)Talend工作室中的Palette面板是什么?

“面板”面板具有可用于构建工作的不同技术组件。


20)Talend中的MDM是什么?

MDM [主数据管理]将所有主数据存储在一个文件中。它用于将实时数据, 应用程序和集成过程与固定的数据质量结合起来, 以在本地, 云和移动应用程序之间共享。


21)”设计”工作区窗口的用途是什么?

这是我们可以设计工作的布局。而且, 我们可以访问”设计器”选项卡和”代码”选项卡, 其中的”设计器”选项卡以图形方式显示作业, 而”代码”选项卡显示生成的代码并识别可能的错误。


22)Talend主窗口中的”配置”选项卡是什么?

配置选项卡在设计工作区窗口中显示所选元素的属性。并且可以编辑这些属性以更改和设置与特定组件或作业相关的参数, 并且”运行”选项卡用于执行我们的作业。


23)Talend开放式工作室的常规是什么?

例程是可重用的Java代码。它使我们能够用Java编写自定义代码, 以提高作业容量, 优化数据处理并扩展Talend Studio功能。

Talend Studio中提供了两种类型的例程, 如下所示:

  • 系统例程
  • 用户例程

系统例程:Talend提供了许多系统例程, 并且基于数据类型(例如字符串, 日期, 数字)的过程是只读的, 我们可以在Talend作业中直接调用它们。

用户例程:我们可以创建新的用户例程或适应现有的例程。


24)什么是SQL模板?

Talend Studio允许使用各种SQL模板来简化最常见的任务。它还包含SQL编辑器, 使我们可以自定义或设计SQL模板。

SQL模板与Talend ELT组件中的组件一起使用, 这些组件具有tSQLTemplate, tSQLTemplateFilterColumns, tSQLTemplateRollback, tSQLTemplateCommit, tSQLTemplateAggregate, tSQLTemplateFilterRows和tSQLTemplateMerge, 并且这些组件执行所选的SQL语句。

借助这些SQL模板, 我们可以根据结构要求存储和检索数据, 从而提高DBMS(数据库管理系统)的效率。


25)解释tJoin组件?

tJoin组件用于执行主数据流和查找流之间的内部和外部联接, 该组件可帮助我们确保任何源数据相对于参考数据源的数据质量。


26)为什么我们在Talend中使用tLogRow组件?

tLogRow组件用于在”运行”控制台窗口中显示数据或结果。它主要用于监视处理的数据。


27)为什么我们使用tSortRow组件?

tSortRow组件用于根据排序类型和顺序基于一个或多个列对输入数据进行排序。

tSortRow组件的主要目标是帮助我们创建表的指标和分类。


28)什么是tLoqateAddressRow组件?

tLoqateAddressRow组件用于将地址数据与参考数据进行比较, 以确保其正确和完整。如果需要任何更改, 我们可以纠正拼写, 添加缺少的地址数据, 例如城市, 城市区域, 邮政编码或区域, 以及任何其他相关数据。


29)为什么我们使用tXMLMap组件?

tXMLMap组件用于将数据从单个或多个源转换并路由到单个或多个目的地。


30)你对”面板面板”中的”组件”一词有什么了解?

组件是用于执行特定数据集成操作的预配置连接器。而且, 它可以最大程度地减少处理来自各种异构源的数据所需的手动编码量。


工作/人力资源面试问题
JavaScript面试问题
Java OOP面试问题
JSP面试问题
休眠面试问题
SQL面试题
Android面试题
MySQL面试问题

它用于在子作业已完成而没有任何错误的条件下触发下一个子作业。

它是Subjob触发器的一部分。

ETL代表提取, 转换和加载。

ETL过程首先提取数据, 然后在将数据加载到数据库之前进行转换。

ETL流程支持关系数据。

ETL用于将数据从源数据库传输到目标数据仓库。

所有信息都存储在存储库中。

在存储库中, 我们可以访问作业中的只读信息。

它将更改存储库中的数据。

面试技巧

公司面试问题与程序

Java基础面试问题

Servlet面试问题

春季面试问题

PL / SQL面试问题

Oracle面试问题

jQuery面试问题

赞(0) 打赏
未经允许不得转载:srcmini » 推荐哦!Talend面试题和答案汇总详解
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

觉得文章有用就打赏一下文章作者

微信扫一扫打赏