«Источник данных» – это второй и обязательный элемент блок схемы, именно он определяет какие данные будут использоваться при построении сценария.
На блоке отображаются две составляющие:
- Датасет – это данные, которые будут использованы в сценарии. Далее будут описаны типы данных, которые можно использовать. Важным условием здесь является то, что данные должны быть загружены на платформу до настройки блока «Источник данных», коннекторы также должны быть созданы и настроены заранее.
- Журнал событий содержит информацию о всех преобразованиях с данными, которые выполняются в текущем блоке. Ведение журнала позволяет сохранить историю преобразований над данными, и при необходимости выполнить обратное преобразование.
Параметры блока «Источник данных» можно менять после создания блок-схемы. Если выбранный файл или коннектор будут удалены, тогда повторный запуск блок схемы будет невозможен, блок выдаст ошибку.
В параметрах блока можно выбрать один из типов загружаемых данных. Они поделены на две группы: Загрузка данных и Spark.