knowledge base

Блок «Источник данных»

«Источник данных» – это второй и обязательный элемент блок схемы, именно он определяет какие данные будут использоваться при построении сценария.

На блоке отображаются две составляющие:

  • Датасет – это данные, которые будут использованы в сценарии. Далее будут описаны типы данных, которые можно использовать. Важным условием здесь является то, что данные должны быть загружены на платформу до настройки блока «Источник данных», коннекторы также должны быть созданы и настроены заранее.
  • Журнал событий содержит информацию о всех преобразованиях с данными, которые выполняются в текущем блоке. Ведение журнала позволяет сохранить историю преобразований над данными, и при необходимости выполнить обратное преобразование.

Параметры блока «Источник данных» можно менять после создания блок-схемы. Если выбранный файл или коннектор будут удалены, тогда повторный запуск блок схемы будет невозможен, блок выдаст ошибку.

В параметрах блока можно выбрать один из типов загружаемых данных. Они поделены на две группы: Загрузка данных и Spark.