Business Data Analytics. Технологии добычи знаний и интеллектуального анализа данных. Data mining Сайт www.BusinessDataAnalytics.ru
предлагает актуальные материалы
об алгоритмах и технологиях
добычи знаний и интеллектуального
анализа данных.

Описание структуры модели Data Mining

Первый шаг заключается в создании новой структуры Data mining модели при помощи Mining Model Wizard. При этом также создаётся начальная модель, основанная на алгоритме Microsoft Decision Trees.

Для того чтобы создать структуру модели:
  1. В Solution Explorer кликните правой кнопкой мыши на Mining Models, выберите New Mining Model. Откроется Mining Model Wizard.
  2. Нажмите Next на странице приветствия.
  3. Выберите From existing relational database or data warehouse, затем Next.
  4. В разделе Which data mining technique do you want to use? выберите Microsoft Decision Trees. Вы создадите несколько моделей, опирающихся на эту начальную структуру, в основе которой лежит алгоритм Microsoft Decision Trees.
  5. Нажмите Next. По умолчанию в качестве источника данных здесь выбран Adventure Works DW.
  6. Нажмите Next.
  7. Пометьте флагом Case таблицу vTargetMail, затем нажмите Next.
  8. Пометьте флагом Key столбец CustomerKey. Если в исходной таблице присутствует ключевое поле, Mining Model Wizard автоматически выберет его в качестве ключевого для модели.
  9. Пометьте флагом Input и Predictable столбец BikeBuyer. В результате столбец становится доступным для прогнозирования в новых наборах данных. После того как вы помечаете столбец подобным образом, становится доступной кнопка Suggest. Нажатие на эту кнопку вызывает диалоговое окно со списком наиболее связанных с данным полем столбцов, расположенных в порядке корреляции с прогнозируемым. Столбцы со значением больше 0.05 автоматически добавляются в модель. Если вы согласны с предлагаемым вариантом, нажмите кнопку OK или определите нужные поля вручную.
  10. Пометьте флагом Input столбцы, перечисленные в таблице.
AgeYearlyIncome Region
CommuteDistanceHouseOwnerFlagTotalChildren
EnglishEducationLastName
EnglishOccupationMaritalStatus
FirstNameNumberCarsOwned
GenderNumberChildrenAtHome

Вы можете выбрать несколько столбцов, удерживая клавишу SHIFT.

  1. Нажмите Next.
  2. В поле Specify Columns' Content and Data Type нажмите Detect. При этом автоматически определяется, содержат ли столбцы с численными данными дискретные, либо непрерывные значения. Например, столбец может содержать информацию о заработной плате с непосредственными значениями сумм (непрерывные значения) или в нём могут содержаться целые числа, отвечающие неким диапазонам значений (1 = <$25,000; 2 = от $25,000 до $50000 и так далее), то есть дискретные значения.
  3. В поле Structure Name введите Targeted Mailing и нажмите Finish
  4. Нажмите Finish. При этом откроется редактор Data mining, отображающий структуру Targeted Mailing, которую вы только что создали, см. Рисунок 5.

Рисунок 5 Страница структуры Targeted Mailing

Рисунок 5 Страница структуры Targeted Mailing

в начало страницы