Данная статья является переводом и адаптацией статьи Pentaho Data Integration (Kettle) Tutorial, María Carina Roldán.
Данный материал распространяется по лицензии http://creativecommons.org/licenses/by-nc-sa/3.0/.
Вступление
Система Pentaho Data Integration (PDI, также известная как Kettle) это компонент комплекса Pentaho отвечающий за процесс Извлечения, Преобразования и Выгрузки данных (ETL). Несмотря на то, что использовать системы ETL предполагается в рамках комплекса хранения данных, средства PDI:Kettle могут быть применены и для других целей:
- Обмена данными между приложениями или базами данных
- Экспорта данных из таблиц баз данных в файлы
- Загрузки массивов данных в базы данных
- Обработки данных
- Интеграции в приложения
Использовать PDI:Kettle достаточно просто. Весь процесс разработки в PDI:Kettle ведётся в визуальной форме без написания кода для выполнения необходимых задач, что даёт основание говорить о PDI:Kettle, как о системе ориентированной на работу с метаданными.
Система PDI:Kettle может быть использована как самостоятельное приложение или как элемент комплекса Pentaho Suite. Данная система является наиболее популярной среди систем ETL с открытым исходным кодом. В PDI:Kettle реализована поддержка множества форматов ввода и вывода данных для различных файлов, таблиц, коммерческих и свободных систем организации баз данных. Работа в системе PDI:Kettle открывает огромные возможности для управления данными.
Представленное руководство "Привет, Мир!", это простой и наглядный пример, показывающий удобство работы с PDI:Kettle, и позволяющий получить необходимые навыки для создания более сложных Преобразований (Transformation).