Поиск по сайту:



Проверить аттестат

Мы принимаем Яндекс.Деньги

Смотри также:

Методика поиска неисправностей - Лабораторная.

Решение задач интеллектуального анализа данных (ИАД): классификация объектов средствами интегрированной системы Statistica - Лабораторная.

Задания, отчеты, программы по лаботаторным работам по базам данных - Лабораторная.

Генератор прямоугольных импульсов напряжения с постоянной составляющей - Лабораторная.

Все новинки...

Лабораторная «Решение задач интеллектуального анализа данных (ИАД): классификация объектов средствами интегрированной системы Statistica»

Где сдавалась работаБФ НГТУ
Файл: 4 КБ
Поделиться:

5. Вопросы к работе

1. Постановка задачи кластеризации объектов, как одной из задач интеллектуального анализа данных.
Дано: множество объектов x={x1, x2, … xn}, где xi - i-й исследуемый объект, для каждого xi измерено p признаков xi ={xi1, xi2, … xip}. Необходимо построить множество кластеров С и отображение x на С.
Отображение задает множество данных являющееся множеством решения.
2. Методологические этапы проведения кластерного анализа данных.
1) выбор переменных признаков, на основе которых производится кластеризация.
2) выбор меры сходства или расстояния между объектами.
3) выбор метода или процедуры кластерного анализа.
4) проведение кластеризации.
5) оценка полученных результатов.
3. Какие методы кластерного анализа данных вы знаете? Каковы предпосылки использования этих методов?
Иерархические методы кластерного анализа
Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие.
1) иерархические агломеративные (объединение) методы.
2) иерархические дивизимные (разделение) методы.
3) итеративные методы группировки (метод К-средних - надо заранее знать на сколько кластеров требуется разбить n объектов. Выбирается k-центров групп.)
Дискриминантный анализ - это статистический метод, который позволяет изучать различия между двумя и более группами объектов, по нескольким признакам одноврем-но.
   1)методы интерпретации межгрупповых различий.
   2) методы классификаций наблюдений по группам.
4. Какие меры расстояния между объектами используются в кластерном анализе данных? Как выбрать меру?
1) Евклидово расстояниею
2) Квадрат Евклидово расстояния.
3) Класс метрик Миковского.
4) Расстояние городских кварталов (манхэтонского).
5) Расстояние Чебышева.
6) Пиковое расстояние.
5. Какие алгоритмы и методы кластерного анализа данных реализованы в системе Statistica? Как выполнить кластеризацию объектов средствами Statistica?
Иерархические методы, метод K-средних, методы дискриминантного анализа.
6. Постановка задачи дискриминантного анализа данных.
7. Условия использования методов дискриминантного анализа данных.
Те же что и для дисперсионного:
1) нормальное распределение всех признаков;
2) ковариацинные матрицы для всех групп равны;
3) признаки стахостически не зависимы (не (стрелка вверх) и не (стрелка вниз)).
8. Понятие классификационной функции.
Классификационная функция - это линейная комбинация дискриминантных признаков.
- значение дисперсионной функции для i-го класса.
bi - коэффициенты, которые необходимо определить.
9. Как выбрать признаки, которые необходимо включить в классификационную функцию?
10. Как оценить адекватность построенной функции классификации выборочным данным?
11. Как провести дискриминантный анализ данных средствами Statistica?

Литература

1. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. - М.: Финансы и статистика, 1974. - 240 с.
2. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности.- М.: Финансы и статистика, 1989.
3. Аренс Х., Лейтер Ю. Многомерный дисперсионный анализ/Пер. с нем. В.М. Ивановой. -М.: Финансы и статистика, 1985.
4. Боровиков В.П. Statistica. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. - СПб.: Питер, 2003. - 688 с.
5. Боровиков В.П., Боровиков И.П. Statistica - Статистический анализ и обработка данных в среде Windows. - М.: "Филин", 1997. - 608 с.
6. Факторный, дискриминантный и кластерный анализ/Пер. с англ. А.М. Хотинского. Под ред. И.С. Енюкова. -М.: Финансы и статистика, 1989.
7. Электронный учебник StatSoft по анализу данных.