Pentaho Data Integration (Kettle) Tutorial (ru)

Данная статья является переводом и адаптацией статьи Pentaho Data Integration (Kettle) Tutorial, María Carina Roldán.

Данный материал распространяется по лицензии Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.

Вступление

Система Pentaho Data Integration (PDI, также известная как Kettle) это компонент комплекса Pentaho отвечающий за процесс Извлечения, Преобразования и Выгрузки данных (ETL). Несмотря на то, что использовать системы ETL предполагается в рамках комплекса хранения данных, средства PDI:Kettle могут быть применены и для других целей:

  • Обмена данными между приложениями или базами данных
  • Экспорта данных из таблиц баз данных в файлы
  • Загрузки массивов данных в базы данных
  • Обработки данных
  • Интеграции в приложения

Использовать PDI:Kettle достаточно просто. Весь процесс разработки в PDI:Kettle ведётся в визуальной форме без написания кода для выполнения необходимых задач, что даёт основание говорить о PDI:Kettle, как о системе ориентированной на работу с метаданными.

Система PDI:Kettle может быть использована как самостоятельное приложение или как элемент комплекса Pentaho Suite. Данная система является наиболее популярной среди систем ETL с открытым исходным кодом. В PDI:Kettle реализована поддержка множества форматов ввода и вывода данных для различных файлов, таблиц, коммерческих и свободных систем организации баз данных. Работа в системе PDI:Kettle открывает огромные возможности для управления данными.

Представленное руководство "Привет, Мир!", это простой и наглядный пример, показывающий удобство работы с PDI:Kettle, и позволяющий получить необходимые навыки для создания более сложных Преобразований (Transformation).