Публикации
Цель работы — оценить возможность установления возраста (возрастной группы) на момент смерти с использованием методов классификации по данным гистоморфометрической характеристики возрастных изменений костной и хрящевой тканей.
Материалы и методы. Материалом для исследования послужила база данных, содержащая результаты морфометрических исследований гистологических препаратов костной и хрящевой тканей от 294 паспортизированных трупов лиц мужского пола в возрасте от 10 до 93 лет. Для анализа и классификации данных использованы современные методы машинного обучения: k-NN, SVM, Logistic Regression, CatBoost, SGD, Naive Bayes, Random Forest, методы нелинейного снижения размерности (t-SNE и uMAP) и метод рекурсивного исключения признаков (Recursive feature elimination) для отбора признаков.
Результаты. Использованные методы (алгоритмы) обеспечили эффективную визуализацию сложного набора данных (76 гистоморфометрических признаков), на основе которой была выявлена кластерная структура части объектов в пространстве признаков, что свидетельствовало о целесообразности построения моделей. В ходе отбора признаков была дана оценка их значимости для диагностики возрастной группы, изучена зависимость качества классификации от размера признакового пространства. Предобработка данных позволила избавиться от шума в данных и оставить наиболее информативные признаки, тем самым ускорить процесс обучения и повысить качество классификации. Установлено, что сокращение признакового пространства является необходимой мерой и не приводит к потере качества классификации. Повторная визуализация данных свидетельствовала о наличии более четкой кластерной структуры в пространстве отобранных признаков. Точность установления отдельных групп — 90%. Это доказывает высокую эффективность использования методов машинного обучения с целью судебно-медицинской диагностики возраста на основе данных гистоморфометрических исследований.