Новые возможности использования Data Quality Services в SSIS

Data Quality Services (DQS) - один из главных механизмов нормализации данных, удаление дубликатов и наполнение базы знаний. Он позволяет выполнять различные операции для получения качественных данных. Главной особенностью является создание Базы Знаний, в которой происходят основные настройки, правила манипуляции с данными. В стандартный набор контролов SSIS вошел только один компонент DQS Cleansing, который используется для нормализации(чистки) данных.
В докладе пойдет речь о новых контролах DQS Domain Value Import и DQS Matching Transformation. Важный акцент будет сделан на автоматизацию процесса импорта доменных сущностей, включая синонимы, в существующую базу знаний, а так же использование механизма удаления дубликатов, полагаясь на возвращаемые весовые коэффициенты между каждым набором сравниваемых записей. В результате будут созданы SSIS пакеты в которых будут продемонстрированы все возможности DQS контролов.

Докладчик: Константин Хомяков (MVP SQL Server) специализируется в Microsoft Business Inteligence: разработка SSIS пакетов, построение кубов и анализ данных в SSAS. Последние несколько лет занимается интеграцией данных.

Регистрацияhttps://attendee.gotowebinar.com/register/2059269086637956097

cage-aids
cage-aids
cage-aids
cage-aids