Дерево принятия решений - один из мощных средств для анализа больших данных. Деревья предназначены для задач классификации. И с этим справляются иногда лучше, чем нейросети.
Программа "Дерево решений с ограничением по времени" дает возможность создать (обучить) такое дерево на основе данных из CSV файла. Входной файл для программы должен быть в текстовом виде.
Что такое "с ограничением по времени"?
Очень часто получение каких-то параметров более затратное, стоит больше. Яркий пример - постановка медицинского диагноза. Врач (по сути) имеет дерево решений в своей голове. Он начинает опрос с более простых вопросов, которые можно быстро получить (мало затрачивается времени). И только в случае проблем с диагностикой на более поздних стадиях обследования назначаются анализы. Начинают с более быстрых-дешевых. Подобная ситуация возникает и в других случаях. Например при анализе фотографий какие-то характеристики считаются очень быстро и именно с них нужно начинать анализ.
В данной версии не реализовано:
- многопоточность;
- нет проверки на тестовых данных (нет возможности проконтролировать переобучение);
- не реализовано отсечение ветвей (pruning);
- 64-битность;
- пропущены некоторые проверки (в частности не контролируются AbsMinTreeRecords, MinTreeRecords).
Требования к данным
Информация об объектах, которые необходимо классифицировать, должна быть представлена в виде конечного набора признаков (колонок), каждый из которых имеет числовое значение. Такой набор атрибутов назовём примером (строка). Для всех примеров количество колонок и их состав должны быть постоянными. Множество классов, на которые будут разбиваться примеры, должно иметь конечное число элементов, а каждый пример должен однозначно относиться к конкретному классу. Число классов не более 256 (нумерация от 0 до 255). Для случаев с нечёткой логикой, когда примеры принадлежат к классу с некоторой вероятностью, программа неприменима. В обучающей выборке количество примеров должно быть значительно больше количества классов, к тому же каждый пример должен быть заранее ассоциирован со своим классом.
Последние комментарии и отзывы о Decision tree with Time limit